Создание и обработка подстрок Python — как это работает?

Установка Python Программирование и разработка

В языке программирования Python существуют различные способы создания подстрок или проверки наличия подстрок в строке символов.

Что такое подстрока?

По сути, подстрока — это просто часть строки Python. Строки — это строки символов любого размера. Если вас интересует только часть такой строки символов и вы извлекаете ее, вы получите так называемую подстроку. Простым примером является строка «Hello World!», которую можно разделить на две подстроки, например, «Hello» и «World!». Обратите внимание, что подстроки не обязательно являются отдельными словами. Каждая буква и каждый символ из строки символов также будет отдельной подстрокой.

Создайте подстроку Python

slicing

Если вы хотите написать код Python, который создает для вас подстроку, наиболее известная функция Python для этого называется нарезкой. Нарезка позволяет вам использовать индексы, чтобы определить, где ваша подстрока должна начинаться и заканчиваться. Передайте индексы в квадратных скобках, разделенных двоеточием. Начальный индекс является инклюзивным, а конечный — исключающим. Итак, синтаксис нарезки в Python выглядит так:

string[start:ende]

Конкретный пример кода помогает визуализировать нарезку:

s = «Python ist eine beliebte Programmiersprache.»

ergebnis = s[0:6]

Сначала создается строка символов с именем «s». Вторая строка примера кода показывает нарезку. После имени строки символов в квадратных скобках дается начальный индекс 0, за которым следует двоеточие, а затем конечный индекс 6. В результате подстрока «s», состоящая из символов с нулевого по пятый, сохраняется в переменной с именем «результат». В нашем случае переменная «result» будет содержать слово «Python».

Если вы хотите разрезать строку с начала или до конца, вы можете сократить нотацию среза Python : если вы не укажете начальный индекс, по умолчанию просто выбирается индекс 0. С другой стороны, если вы опускаете конечный индекс, вы используете срез для создания подстроки Python, которая простирается до конца исходной строки.

Кроме того, если вы хотите начать извлекать подстроки из исходной строки Python в обратном порядке, вы можете использовать сокращенную нотацию, в которой используются отрицательные индексы :

s = "Python ist eine beliebte Programmiersprache."
ergebnis = s[-19:]

В приведенном выше примере кода переменная с именем «результат» содержит последние 19 символов исходной строки «s». Таким образом, строка символов «язык программирования» находится в переменной «результат».

String Methods

В дополнение к срезу Python существует ряд предопределенных строковых методов, которые можно использовать для извлечения подстроки Python из строки.

Читайте также:  Эффективные способы сохранения данных включают файлы, облачные решения и вопросы безопасности

Функция среза

Как следует из названия, функция slice работает так же, как и Python slicing. Синтаксис функции среза также очень похож на функцию среза, которую мы видели ранее. Он принимает начальный и конечный индексы и возвращает соответствующую подстроку:

string.slice(start, ende)

Подстрока функции

Метод подстроки также идеально подходит для извлечения подстрок Python. Синтаксически это похоже на функцию slice. Поведение также эквивалентно:

string.substring(start, ende)

Разделение функций

Если вас интересует не одна, а несколько подстрок Python, стоит взглянуть на раздел Python. Функция позволяет разбить строку на список подстрок Python на основе заданного разделителя. Синтаксис не сложный:

string.split(trennzeichen)

Пример короткого кода помогает прояснить точную процедуру функции разделения:

s = "Python ist eine beliebte Programmiersprache."
ergebnis = s.split(" ")

Вызов функции разделения Python принимает в качестве аргумента разделитель, в нашем случае пробел. Список всех подстрок Python, которые были разделены пробелом в исходной строке, теперь хранится в переменной «результат»: «[’Python’, ’is’, ’a’, ’popular’, ’язык программирования’]. »

Подстроки в результате регулярных выражений

Вы также можете хранить подстроки Python в списке, применяя регулярное выражение к строке, а затем используя функцию findall из библиотеки re. Регулярные выражения в Python — это формат обработки строк, который находит определенные шаблоны в строках. Функция findall принимает регулярное выражение в качестве первого параметра передачи и строку в качестве второго параметра. Пример кода показывает процедуру:

import re
s = "Python ist eine beliebte Programmiersprache."
ergebnis = re.findall(r"\w+", s)

Первая строка кода импортирует библиотеку «re», чтобы затем можно было получить доступ к функции findall. Затем передается регулярное выражение «r»\w+«» и уже известная строка в переменной с именем «s». На первый взгляд регулярное выражение может показаться немного странным, но оно не говорит ничего, кроме того, что все слова должны быть извлечены из строки. Неудивительно, что переменная с именем «результат» снова содержит список подстрок Python : «[’Python’, ’is’, ’a’, ’popular’, ’язык программирования’]».

Оцените статью
Блог о программировании
Добавить комментарий