Функции для работы со строками
В RQL представлен набор функций, предназначенных для обработки текстовых данных. Функции для поиска в строках и функции для замены в строках рассмотрены отдельно.
Набор поддерживаемых функций RQL и их поведение зависят от версии установленного ClickHouse. Если функция не поддерживается в используемой версии ClickHouse, она также не будет доступна в RQL. Ознакомиться с актуальным списком функций и их поведением можно в официальном репозитории ClickHouse, выбрав нужную версию из веток. Например: список функций для работы со строками для ClickHouse 24.7. |
Функция | Описание |
---|---|
|
Проверяет, является ли входная строка пустой. Возвращает 1 для пустой строки или 0 для непустой строки. |
|
Проверяет, не является ли входная строка пустой. Возвращает 1 для непустой строки или 0 для пустой строки. |
|
Возвращает длину строки в байтах (а не символах или кодовых точках Unicode). |
|
Возвращает длину строки в кодовых точках Unicode (а не в байтах или символах). Предполагается, что строка содержит допустимый текст в кодировке UTF-8. |
|
Дополняет строку слева пробелами или заданной строкой (при необходимости несколько раз), пока результирующая строка не достигнет указанной длины. |
|
Дополняет строку слева пробелами или заданной строкой (при необходимости несколько раз) до достижения указанной длины. В отличие от |
|
Дополняет строку справа пробелами или заданной строкой (при необходимости несколько раз) до достижения указанной длины. |
|
Дополняет строку справа пробелами или заданной строкой (при необходимости несколько раз) до достижения указанной длины. В отличие от |
|
Преобразует символы ASCII латиницы в строке в нижний регистр. |
|
Преобразует символы ASCII латиницы в строке в верхний регистр. |
|
Преобразует строку в нижний регистр, предполагая, что строка содержит допустимый текст в кодировке UTF-8. |
|
Преобразует строку в верхний регистр, предполагая, что строка содержит допустимый текст в кодировке UTF-8. |
|
Возвращает 1, если набор байтов составляет допустимый текст, закодированный в UTF-8, в противном случае 0. |
|
Заменяет недопустимые символы UTF-8 на символ � (U+FFFD). Все подряд идущие недопустимые символы сжимаются в один символ замены. |
|
Конкатенирует строку с самой собой указанное количество раз. |
|
Конкатенирует пробел указанное количество раз с самим собой. |
|
Инвертирует последовательность байтов в строке. |
|
Инвертирует последовательность кодовых точек Unicode в строке. Предполагается, что строка содержит допустимый текст в кодировке UTF-8. |
|
Конкатенирует заданные аргументы. |
|
Аналогично |
|
Конкатенирует заданные строки с использованием заданного разделителя. |
|
Аналогично |
|
Возвращает подстроку строки |
|
Аналогично |
|
Возвращает подстроку |
|
Аналогично |
|
Добавляет символ |
|
Возвращает строку |
|
Кодирует строку в формат Base58. |
|
Декодирует строку из формата Base58. |
|
Попытка декодировать строку из формата Base58 с возвратом пустой строки в случае ошибки. |
|
Кодирует строку в формат Base64. |
|
Декодирует строку из формата Base64. |
|
Попытка декодировать строку из формата Base64 с возвратом пустой строки в случае ошибки. |
|
Проверяет, заканчивается ли строка определенным суффиксом. |
|
То же, что и |
|
Проверяет, начинается ли строка с определенного префикса. |
|
То же, что и |
|
Удаляет пробельные символы с начала и конца строки. |
|
Удаляет пробельные символы с начала строки. |
|
Удаляет пробельные символы с конца строки. |
|
Удаляет пробельные символы с обеих сторон строки. |
|
Вычисляет CRC32 хеш строки. |
|
Вычисляет CRC32 используя IEEE полином. |
|
Вычисляет CRC64 хеш строки. |
|
Нормализует строку запроса. |
|
Вычисляет хеш нормализованного запроса. |
|
Нормализует строку в нормализацию формы C (NFC) для Unicode. |
|
Нормализует строку в нормализацию формы D (NFD) для Unicode. |
|
Нормализует строку в нормализацию формы KC (NFKC) для Unicode. |
|
Нормализует строку в нормализацию формы KD (NFKD) для Unicode. |
|
Кодирует компоненты XML в строке. |
|
Декодирует компоненты XML из строки. |
|
Декодирует HTML компоненты из строки. |
|
Извлекает текст из HTML строки. |
|
Возвращает ASCII код первого символа строки. |
|
Преобразует строку в ее код Soundex. |
|
Кодирует строку в формат Punycode. |
|
Декодирует строку из формата Punycode. |
|
Попытка декодировать строку из формата Punycode с возвратом пустой строки в случае ошибки. |
|
Кодирует строку в формат IDNA. |
|
Попытка кодировать строку в формат IDNA с возвратом пустой строки в случае ошибки. |
|
Декодирует строку из формата IDNA. |
|
Вычисляет расстояние Хэмминга между двумя строками. |
|
Вычисляет индекс Жаккара для двух строк. |
|
Вычисляет индекс Жаккара для двух строк, учитывая кодировку UTF-8. |
|
Вычисляет расстояние редактирования (Левенштейна) между двумя строками. |
|
Вычисляет расстояние Дамерау-Левенштейна между двумя строками. |
|
Вычисляет сходство Джаро между двумя строками. |
|
Вычисляет сходство Джаро-Винклера между двумя строками. |
|
Преобразует первый символ каждого слова в верхний регистр. |
|
То же, что и |
|
Возвращает первую строку из многострочного текста. |