Краткий обзор строк R

Краткий обзор строк R Программирование и разработка

Строки — это базовая структура данных в R, используемая для представления строк символов и отдельных букв. В отличие от других языков программирования, в R нет типа данных, называемого строкой: строки относятся к типу данных R символов.

Что такое строки R?

Независимо от того, учитесь ли вы программировать или давно имеете дело с различными языками программирования: строк не избежать даже опытным программистам.

Строки — это структура данных в языке программирования R. По сути, строки — это не что иное, как цепочки символов, которые в большинстве языков программирования, включая R, отмечаются одинарными или двойными кавычками. Обычно они используются для хранения и обработки нечисловой информации в программах.

Как создать строку R?

Строку можно легко создать в R с помощью всего лишь одной строки кода. Вы можете использовать одинарные или двойные кавычки при инициализации строки R :

# String mit doppelten Anführungszeichen
string1 <- "Hallo Welt!"
# String mit einfachen Anführungszeichen
string2 <- 'Hello world!'

Редактировать R-строки: обзор функций R-строк

Для эффективной работы со строками R предоставляет программистам набор базовых функций. Их можно использовать для выполнения различных операций со строками символов. Мы собрали для вас наиболее важные операции со строками R:

  • substr() : извлекает подстроку из R-строки.
  • Paste() : объединяет строки.
  • tolower()/toupper() : преобразует все символы строки в нижний или верхний регистр.
  • strsplit() : разделяет строку R, используя заданный разделитель.
  • Trimws() : удаляет начальные и конечные пробелы из строки.
  • gsub() : заменяет шаблоны в строке переданной строкой символов.
  • nchar() : получить длину строки R.

Если вы уже знакомы с другими языками программирования, большинство функций должны показаться вам знакомыми. Существует множество аналогов для работы со строками в Python, например.

substr()

Эта функция позволяет вам извлекать подстроки из ваших R-строк. Для этого передайте строку в функцию в качестве первого параметра, а начальный и конечный индекс нужной подстроки — в качестве второго и третьего параметров. Обратите внимание, что индексация R-строки начинается с 1, в отличие от многих других языков.substr()

string <- "Hallo Welt"
print(substr(string, start=7, stop=10))

Пример кода выше «Welt«выводится на экран.

paste()

Эта функция используется в R для объединения двух или более строк. Обратите внимание, что для объединения строк не существует оператора R, поскольку сложение определяется только для числовых типов данных.paste()+

string <- "Hallo"
string2 <- "Welt"
print(paste(string+ string2))

Вызов объединяет обе строки R и выдает следующий результат:.paste()»Hallo Welt»

Читайте также:  Как вернуть время назад - ключевые принципы и методы

tolower() / toupper()

С помощью двух строковых функций R вы можете преобразовать все символы в строке символов в нижний или верхний регистр. Обе функции ожидают строку, с которой они будут работать, в качестве параметра передачи и возвращают новую строку.tolower()toupper()

string <- "Hallo Welt"
print(tolower(string))
print(toupper(string))

Вышеупомянутая программа выводит результаты, как «hallo welt»и ожидалось, «HALLO WELT«на экран. Использование таких функций, как или, особенно полезно, когда входные данные должны обрабатываться с учетом регистра.tolower()toupper()

strsplit()

Опытные программисты наверняка сталкивались с -функцией в R на другом языке. В Python также есть функция под названием. ожидает строку, которую вы хотите разделить на подстроки с помощью разделителя, и разделитель, который будет использоваться для разделения, в качестве параметров передачи. Даже если имеется только одна подстрока, вызов функции возвращает список результирующих подстрок.strsplit()split()strsplit()

string <- "Hallo Welt"
print(strsplit(string, " "))

Вывод приведенного выше кода выглядит следующим образом:

[[1]]
[1] "Hallo" "Welt"

Таким образом, вы получаете список из двух строк, поскольку в качестве разделителя использовался пробел в исходной строке.

trimws()

С помощью этой функции вы можете удалять пробелы до и после вашей R-строки, что может быть особенно полезно при редактировании пользовательского ввода, чтобы удалить ненужные пробелы и пробелы, введенные по ошибке.trimws()

string <- "   Hallo Welt   "
print(trimws(string))

Этот раздел кода возвращает строку «Hallo Welt«без пробелов в начале или конце строки символов.

gsub()

Другая строковая операция в R может быть реализована с помощью функции, которая изначально ожидает замены подстроки в качестве первого передаваемого параметра. В качестве второго параметра указывается строка символов, которой должны быть заменены вхождения подстроки. Третий параметр передачи — это строка, к которой относится замена.gsub()

string <- "Hallo Welt"
print(gsub("Welt", "User", string))

Теперь вывод строки, определенной в коде, приветствует уже не весь мир, а только одного пользователя, потому что вывод программы — «Hallo User».

Читайте также:  Зачем TypeScript важен для разработчиков - основные преимущества и применение

nchar()

Одной из наиболее важных стандартных функций для строк является функция, возвращающая длину R-строки.nchar()

string <- "Hallo Welt"
print(nchar(string))

Пусть вас не смущает команда R, которая интуитивно может показаться более разумной : она используется в R для определения количества элементов в объекте и, следовательно, не возвращает длину строки R!length()length()

Управляющие символы и escape-последовательности

Если вы хотите влиять на поток текста в строках R, например, с помощью разрывов строк или табуляции, вы должны использовать так называемые управляющие символы. Это предопределенная форма escape-последовательностей, которая часто используется для проектирования вывода текста.

Специальные символы, такие как кавычки, которые обычно интерпретируются как начало или конец строки в синтаксисе R, также могут выводиться внутри строк символов с помощью escape-последовательностей. Escape-последовательности обозначаются обратной косой чертой в начале. Вот важные управляющие символы и escape-последовательности в R:

  • \n : новая строка/новая строка
  • \t : вкладка
  • \ : обратная косая черта
  • » : двойная кавычка
  • ’ : одинарная кавычка
Оцените статью
Блог о программировании
Добавить комментарий