Агрегатные функции
Агрегатные функции в RQL позволяют проводить расчеты над множествами значений, предоставляя доступ к вычислению общих сумм, средних, максимальных и минимальных значений, а также других агрегатов из больших объемов данных. Их ключевая особенность — это возможность эффективно обработать информацию, полученную из различных строк данных.
Обработка NULL
в агрегатных функциях предполагает исключение NULL
значений из обработки, т.е., все NULL
значения пропускаются и не участвуют в агрегации.
Набор поддерживаемых функций RQL и их поведение зависят от версии установленного ClickHouse. Если функция не поддерживается в используемой версии ClickHouse, она также не будет доступна в RQL. Ознакомиться с актуальным списком функций и их поведением можно в официальном репозитории ClickHouse, выбрав нужную версию из веток. Например: список агрегатных функций для ClickHouse 24.7. |
Функция | Описание |
---|---|
|
Подсчитывает количество строк, удовлетворяющих условиям запроса ( |
|
Возвращает минимальное значение в столбце ( |
|
Возвращает максимальное значение в столбце ( |
|
Суммирует значения по столбцу ( |
|
Вычисляет среднее значение для столбца, содержащего числовые данные ( |
|
Возвращает произвольное значение из столбца ( |
|
Вычисляет стандартное отклонение для всей выборки ( |
|
Вычисляет выборочное стандартное отклонение ( |
|
Вычисляет дисперсию для всей выборки ( |
|
Вычисляет дисперсию выборки ( |
|
Вычисляет коэффициент корреляции Пирсона между двумя столбцами ( |
|
Вычисляет ковариацию для всей совокупности ( |
|
Вычисляет ковариацию на основе выборки из генеральной совокупности ( |
|
Вычисляет энтропию для столбца ( |
|
Суммирует длины интервалов между значениями в столбце ( |
|
Вычисляет медиану значений в столбце ( |
|
Вычисляет ранговую корреляцию между двумя переменными ( |
|
Суммирует числа с использованием алгоритма Кахана для уменьшения ошибки округления ( |
|
Выполняет t-тест Стьюдента для сравнения средних двух выборок. Используется без параметра |
|
Выполняет t-тест Уэлча, модификацию t-теста Стьюдента, предназначенную для использования с выборками разного размера и дисперсии. Используется без параметра |
|
Возвращает наиболее часто встречающееся значение в столбце ( |
|
Возвращает последнее значение в столбце ( |
|
Вычисляет отношение ограничивающего объема ( |
|
Возвращает первое значение в порядке сортировки ( |
|
Возвращает последнее значение в порядке сортировки ( |
|
Возвращает значение аргумента, при котором достигается минимальное значение выражения ( |
|
Возвращает значение аргумента, при котором достигается максимальное значение выражения ( |
|
Вычисляет взвешенное среднее значение ( |
|
Вычисляет сумму разностей последовательных значений в столбце ( |
|
Вычисляет сумму разностей между последовательными временными метками ( |
|
Агрегирует значения в массив ( |
|
Агрегирует уникальные значения в массив ( |
|
Вставляет значение в массив по указанному индексу ( |
|
Сортирует элементы массива ( |
|
Возвращает массив, содержащий только элементы, присутствующие во всех входных массивах ( |
|
Выполняет побитовую операцию И над всеми значениями столбца ( |
|
Выполняет побитовую операцию ИЛИ над всеми значениями столбца ( |
|
Выполняет побитовую операцию исключающее ИЛИ над всеми значениями столбца ( |
|
Агрегирует значения в битовую карту ( |
|
Выполняет операцию И над битовыми картами ( |
|
Выполняет операцию ИЛИ над битовыми картами ( |
|
Выполняет операцию исключающее ИЛИ над битовыми картами ( |
|
Суммирует значения, позволяя переполнение ( |
|
Суммирует элементы входных массивов, группируя по ключам ( |
|
Находит минимальные элементы входных массивов, группируя по ключам ( |
|
Находит максимальные элементы входных массивов, группируя по ключам ( |
|
Вычисляет выборочный коэффициент асимметрии для набора данных ( |
|
Вычисляет коэффициент асимметрии для всей совокупности ( |
|
Вычисляет выборочный коэффициент эксцесса ( |
|
Вычисляет коэффициент эксцесса для всей выборки ( |
|
Подсчитывает количество уникальных значений в столбце ( |
|
Точно подсчитывает количество уникальных значений ( |
|
Приблизительно подсчитывает количество уникальных значений с помощью алгоритма HyperLogLog ( |
|
Приблизительно подсчитывает количество уникальных значений с помощью 64-битной версии алгоритма HyperLogLog ( |
|
Приблизительно подсчитывает количество уникальных значений с использованием алгоритма HyperLogLog с точностью 12 бит ( |
|
Приблизительно подсчитывает количество уникальных значений с использованием алгоритма Theta Sketch ( |
|
Вычисляет параметры простой линейной регрессии для двух переменных ( |
|
Вычисляет параметры стохастической линейной регрессии ( |
|
Вычисляет параметры стохастической логистической регрессии ( |
|
Вычисляет информационную ценность для категориальных переменных ( |
|
Вычисляет таблицу сопряженности для двух категориальных переменных ( |
|
Вычисляет коэффициент Крамера для измерения ассоциации между двумя категориальными переменными ( |
|
Вычисляет скорректированный на смещение коэффициент Крамера ( |
|
Вычисляет индекс Тейла для измерения ассоциации между двумя категориальными переменными ( |
|
Находит максимальное количество пересечений между наборами значений ( |
|
Находит позицию максимального количества пересечений ( |
|
Выполняет Z-тест для среднего значения ( |
|
Генерирует текстовое представление гистограммы для распределения значений ( |
|
Вычисляет сумму и количество значений одновременно ( |
|
Применяет алгоритм Largest Triangle Three Buckets для уменьшения числа точек во временных рядах ( |