Конфигурирование#

Параметры настройки#

Список конфигурационных файлов, в которых выполняются настройки компонента OLAP, представлен в таблице ниже:

Компонент

Файл

Описание

OLAP

conf/kylin.properties

Глобальный файл конфигурации со всеми свойствами конфигурации компонента OLAP

Hadoop

hadoop_conf/core-site.xml

Глобальный файл конфигурации, используемый Hadoop, который определяет параметры системного уровня, такие как URL-адреса HDFS, временные каталоги Hadoop и т. д

Hadoop

hadoop_conf/hdfs-site.xml

Файл конфигурации HDFS, который определяет параметры HDFS, такие как место хранения NameNode и DataNode, количество копий файла и т. д

Hadoop

hadoop_conf/yarn-site.xml

Файл конфигурации Yarn, который определяет параметры системы управления ресурсами кластера Hadoop, такие как ResourceManager, порт связи NodeManager, порт веб-мониторинга и т. д

Hadoop

hadoop_conf/mapred-site.xml

Файл конфигурации Map Reduce, используемый в Hadoop, который определяет количество задач сокращения по умолчанию, верхний и нижний пределы по умолчанию памяти, которую может использовать задача, и т. д

Hive

hadoop_conf/hive-site.xml

Файл конфигурации Hive, который определяет параметры Hive, такие как каталог хранения данных Hive, адрес базы данных и т. д

Базовые настройки#

Общие настройки#

Общие настройки компонента OLAP выполняются в файле kylin.properties — одном из наиболее важных конфигурационных файлов.

Маршрутизация запросов к компоненту OLAP осуществляется через балансировщик нагрузки по портам.

Примечание

Для конфигурации реплик необходимое количество компонентов OLAP в режимах OLAP ALL и OLAP QUERY ≥ 2.

При увеличении нагрузки количество реплик должно быть увеличено соответствующим образом.

Параметр

Описание

Значение по умолчанию

server.port

Параметр указывает порт, используемый службой компонента OLAP

7070

server.address

Параметр указывает адрес, используемый службой компонента OLAP

0.0.0.0

kylin.env.ip-address

Когда сетевой адрес узла, на котором находится служба компонента OLAP, имеет формат ipv6, можно указать формат ipv4 через этот элемент конфигурации

0.0.0.0

kylin.env.hdfs-working-dir

Определяет рабочий путь экземпляра OLAP в HDFS

/kylin — HDFS с именем таблицы в пути метаданных в качестве подкаталога

kylin.env.zookeeper-connect-string

Указывает адрес ZooKeeper (Этот параметр необходимо настроить вручную перед запуском экземпляра OLAP, иначе компонент не запустится). Используется для обнаружения экземпляров, выбор лидера и т.п. Формат значения: IP-адресы и порты через запятую.

kylin.metadata.url

Путь к метаданным компонента OLAP

kylin_metadata таблица в БД

kylin.metadata.random-admin-password.enabled

Для режима LOCAL. Если параметр имеет значение false, то пароль будет фиксированный. Если значение параметра true, то пароль будет сгенерирован автоматически и отображен в консоли, после перезапуска всех узлов Kylin

false

kylin.metadata.ops-cron

Задает выражение cron для задачи синхронизации для синхронизированного резервного копирования метаданных и очистки от мусора

0 0 0 * * *

kylin.metadata.audit-log.max-size

Указывает максимальное количество строк в журнале аудита

500000

kylin.metadata.compress.enabled

Указывает, следует ли сжимать содержимое метаданных и журнала аудита

true

kylin.server.mode

В компоненте OLAP есть режимы: all и query. Параметр меняет этот режим. В режиме query компонента OLAP может обслуживать только запросы. В режиме all, помимо обслуживания запросов, может запускать задачи построения индекса и выполнять операции с метаданными. Проект является логическим пространством для работы с моделями. Каждый проект имеет физического владельца в виде экземпляра Kylin в режиме all. Все действия с проектом выполняются на экземпляре владельца проекта

all

kylin.web.timezone

Часовой пояс, используемый для службы компонента OLAP Rest

Часовой пояс системы локального компьютера

kylin.web.export-allow-admin

Указывает, разрешить ли пользователю с правами администратора экспортировать результаты запроса в файл CSV

true

kylin.web.export-allow-other

Указывает, разрешить ли пользователю, не являющемуся администратором, экспортировать результаты запроса в CSV-файл

true

kylin.web.stack-trace.enabled

Сообщение об ошибке показывает, отображаются ли во всплывающем окне подробные сведения

false

kylin.env

Использование экземпляра OLAP определяется этим свойством. Необязательные значения включают и DEV, среди них есть значение по умолчанию. В режиме включены некоторые функции разработчика PROD QA, PROD DEV

kylin.circuit-breaker.threshold.project

Максимальное количество проектов, которое можно создать

100

kylin.circuit-breaker.threshold.model

Максимальное количество моделей, которое можно создать в одном проекте

100

kylin.query.force-limit

Некоторые инструменты BI всегда отправляют запрос типа select * from fact_table, но процесс может застрять, если размер таблицы очень велик. Предложение LIMIT помогает в этом случае, и, установив значение этого свойства в положительное целое число, компонент добавит предложение LIMIT, если его нет. Например, значение равно 1000, запрос select * from fact_table будет преобразован в select * from fact_table limit 1000. Эта конфигурация может быть переопределена на уровне проекта

kylin.query.max-result-rows

Это свойство указывает максимальное количество строк, которые может вернуть запрос. Это свойство применяется ко всем способам выполнения запросов, включая веб-интерфейс, асинхронный запрос, драйвер JDBC и драйвер ODBC. Эту конфигурацию можно переопределить на уровне проекта. Чтобы это свойство вступило в силу, оно должно быть положительным целым числом, меньшим или равным 2 147 483 647. Значение по умолчанию — 0, что означает отсутствие ограничений на результат

0

kylin.query.init-sparder-async

Асинхронный запуск sparder. Поэтому веб-служба компонента OLAP и служба запросов Spark будут запускаться отдельно. Если установлено значение false, веб-служба компонента OLAP будет доступна только после запуска службы sparder

true

kylin.circuit-breaker.threshold.query-result-row-count

Максимальное количество строк в результирующем наборе, возвращаемом SQL-запросом

2000000

kylin.query.timeout-seconds

Время ожидания запроса, в секундах

300

kylin.query.convert-create-table-to-with

Некоторое программное обеспечение BI отправит инструкцию Create Table для создания постоянной или временной таблицы в источнике данных. Если для этого параметра установлено значение true, оператор create table в запросе будет преобразован в оператор with, когда последующий запрос использует таблицу, созданную запросом на предыдущем шаге, оператор create table будет преобразован в подзапрос, который может попасть в индекс, если таковой имеется для выполнения запроса

true

kylin.query.replace-count-column-with-count-star

Значение по умолчанию — false, что означает, что мера COUNT (столбец) попадет в модель только после того, как она будет настроена в модели. Если показатель COUNT (столбец) вызывается в SQL, но не был настроен в модели, значение этого параметра может быть установлено равным true, тогда система будет использовать показатель COUNT (константа) для приблизительной замены показателя COUNT (столбец). Мера COUNT (константа) принимает в расчет все значения Null

false

kylin.query.match-partial-inner-join-model

Значение по умолчанию — false, что означает, что модель внутреннего соединения с несколькими таблицами не поддерживает SQL, который частично соответствует части внутреннего соединения.Значение по умолчанию — false, что означает, что модель внутреннего соединения с несколькими таблицами не поддерживает SQL, который частично соответствует части внутреннего соединения. Например: предположим, что есть три таблицы A, B и C. По умолчанию на SQL A inner join B может ответить только модель внутреннего соединения A B или модель внутреннего соединения B левого соединения C. Модель внутреннего соединения B внутреннего соединения C не может ответить на него. Если для этого параметра установлено значение true, на SQL внутреннего соединения B можно ответить моделью внутреннего соединения B или внутреннего соединения B левого соединения C, либо на него также можно ответить моделью внутреннего соединения A внутреннего соединения B. С. Если для этого параметра установлено значение true, на SQL внутреннего соединения B можно ответить моделью внутреннего соединения B или внутреннего соединения B левого соединения C, либо на него также можно ответить моделью внутреннего соединения A внутреннего соединения B. С.

false

kylin.query.match-partial-non-equi-join-model

Значение по умолчанию — false, в настоящее время, если модель содержит неэквивалентные соединения, запрос может быть сопоставлен с моделью только в том случае, если он содержит все неэквивалентные соединения, определенные в модели. Если для конфигурации задано значение true, запрос может содержать только часть неэквивалентных соединений. например, модель: A левое соединение B неэквивалентное левое соединение C. Если для конфигурации установлено значение false, только запрос с полными отношениями соединения модели может быть сопоставлен с моделью. Когда для конфигурации установлено значение true, запрос типа A левое соединение B также может быть сопоставлен с моделью

false

kylin.query.use-tableindex-answer-non-raw-query

Значение по умолчанию — false, что означает, что на агрегированный запрос можно ответить только агрегированным индексом. Если для параметра задано значение true, система разрешает использовать соответствующий индекс таблицы для ответа на агрегированный запрос

false

kylin.query.layout.prefer-aggindex

Значение по умолчанию равно true, что означает, что при выборе для сравнения индексов для агрегированных индексов и подробных индексов предпочтение отдается агрегированным индексам

true

kylin.storage.columnar.spark-conf.spark.yarn.queue

Этот параметр указывает очередь Yarn, которая используется кластером запросов Spark

kylin.storage.columnar.spark-conf.spark.master

Использование автономного развертывания, которое может отправлять задания на определенный адрес spark-master-url

kylin.job.retry

Время автоматического повтора для заданий с ошибками

kylin.job.retry-interval

Временной интервал для повторной попытки выполнения задания с ошибкой. Это свойство допустимо только в том случае, если для свойства повторной попытки задания установлено значение 1 или выше

30000

kylin.job.max-concurrent-jobs

Ограничение параллельных заданий

20

kylin.scheduler.schedule-job-timeout-minute

Время ожидания выполнения задания. Этот параметр допустим, только если для него установлено значение 1 или выше. Когда выполнение задания превышает период тайм-аута, оно переходит в состояние «Ошибка»

0

kylin.garbage.storage.cuboid-layout-survival-time-threshold

Порог недопустимых файлов в HDFS

7 дней

kylin.garbage.storage.executable-survival-time-threshold

Пороговое значение для задания с истекшим сроком действия

30 дней

kylin.storage.quota-in-giga-bytes

Квота хранилища для каждого проекта

10240

kylin.influxdb.address

Адрес InfluxDB

localhost:8086

kylin.influxdb.username

Имя пользователя InfluxDB

root

kylin.influxdb.password

Пароль InfluxD

root

kylin.metrics.influx-rpc-service-bind-address

Если свойство # bind-address = «127.0.0.1:8088» было изменено в файле конфигурации influxdb, его значение должно быть изменено одновременно. Этот параметр влияет на то, может ли диагностический пакет содержать системные показатели

kylin.security.user-password-encoder

Алгоритм шифрования пароля пользователя

BCrypt

kylin.web.session.secure-random-create-enabled

Создание идентификатора сеанса и включение идентификатора сеанса после шифрования MD5

kylin.web.session.jdbc-encode-enabled

Включение функции шифрования JDBC

false

kylin.server.cors.allow-all

Разрешить все перекрестные исходные запросы (CORS)

false

kylin.server.cors.allowed-origin

Указывает белый список, разрешающий междоменное использование. Этот параметр действителен, когда kylin.server.cors.allow-all=true

kylin.storage.columnar.spark-conf.spark.driver.host

Настраивает IP-адрес узла, на котором расположен компонент OLAP

kylin.engine.spark-conf.spark.driver.host

Настраивает IP-адрес узла, на котором расположен компонент OLAP

kylin.engine.sanity-check-enabled

Указывает, следует ли открывать проверку работоспособности во время построения индексов

true

kylin.job.finished-notifier-url

Когда задание на сборку будет завершено, информация о статусе задания будет отправлена на URL-адрес через HTTP-запрос

kylin.diag.obf.level

Уровень снижения чувствительности диагностического пакета. RAW означает отсутствие десенсибилизации, OF означает снижение чувствительности. Настройка OBF снизит чувствительность конфиденциальной информации, такой как имена пользователей и пароли, в файле kylin.properties

OBF

kylin.diag.task-timeout

Время ожидания подзадачи для диагностического пакета

3 минуты

kylin.diag.task-timeout-black-list

Черный список времени ожидания подзадачи пакета диагностики (значения разделены запятыми). Подзадачи в черном списке будут пропущены настройками тайм-аута и будут выполняться до его завершения

METADATA, LOG

kylin.query.queryhistory.max-size

Общее количество записей в истории запросов всех проектов

10000000

kylin.query.queryhistory.project-max-size

Количество записей в истории запросов, сохраняемых для одного проекта

1000000

kylin.query.queryhistory.survival-time-threshold

Количество записей в истории запросов, время хранения всех элементов

30 дней

kylin.query.engine.spark-scheduler-mode

Стратегия планирования обработчика запросов

FAIR

kylin.query.realization.chooser.thread-core-num

Количество основных потоков пула потоков, соответствующих модели, в обработчике запросов

5

kylin.query.realization.chooser.thread-max-num

Максимальное количество потоков в пуле потоков соответствия модели в механизме запросов

50

kylin.query.memory-limit-during-collect-mb

Ограничение использования памяти при получении результата запроса в компоненте OLAP

5400

kylin.query.auto-model-view-enabled

Автоматическая генерация видов для модели

kylin.storage.columnar.spark-conf.spark.sql.view-truncate-enabled

Позволяет spark view терять точность при загрузке таблиц и запросов

false

kylin.engine.spark-conf.spark.sql.view-truncate-enabled=true

Позволяет spark view терять точность при построении

false

kylin.source.hive.databases

Настраивает список баз данных, загружаемых источником данных

Отсутствует

kylin.query.spark-job-trace-enabled

Включает журнал отслеживания заданий spark

kylin.query.spark-job-trace-timeout-ms

Максимальное время ожидания истории запросов

kylin.query.spark-job-trace-cache-max

Максимальное количество кешей журнала отслеживания заданий в spark. Стратегия устранения — LRU, TTL — kylin.query.spark-job-trace-timeout-ms + 20000 ms

kylin.query.spark-job-trace-parallel-max

Отслеживает параллелизм обработки журнала

kylin.query.replace-dynamic-params-enabled

Включает динамическую привязку параметров для запроса JDBC

false

kylin.second-storage.route-when-ch-fail

Когда многоуровневое хранилище включено, отвечает ли запрос, соответствующий индексу базовой таблицы, только многоуровневым хранилищем. Значение по умолчанию — 0, что означает, что когда многоуровневое хранилище не может ответить, ему отвечает индекс базовой таблицы в HDFS, настроенный как 1указывает, что, когда многоуровневое хранилище не может ответить на запрос, запрос будет выталкиваться вниз, настроенный как 2указывает, что запрос завершается ошибкой, когда многоуровневое хранилище не может ответить на запрос

0

kylin.second-storage.query-pushdown-limit

Указывает, следует ли использовать оператор limit для ограничения того, использует ли подробный запрос многоуровневое хранилище. Значение по умолчанию — 0, что означает, что он не включен. Если вам нужно включить его, вы можете настроить определенное значение. Например, если он настроен как 100000, это означает, что на подробный запрос со значением после лимита <= 100000 может ответить многоуровневое хранилище. Если подробный запрос не содержит оператор ограничения или значение после ограничения > 100000, многоуровневое хранилище не будет использоваться.

0

kylin.query.async-query.max-concurrent-jobs

Максимальное количество заданий асинхронных запросов

0

kylin.storage.columnar.spark-conf.spark.dynamicAllocation.enabled

В параметре указывается, использовать ли динамическое распределение ресурсов, которое масштабирует количество исполнителей

false

kylin.storage.columnar.spark-conf.spark.dynamicAllocation.maxExecutors

Максимальное количество исполнителей

kylin.storage.columnar.spark-conf.spark.dynamicAllocation.minExecutors

Минимальное количество исполнителей

kylin.storage.columnar.spark-conf.spark.shuffle.service.enabled

Включает внешнюю службу перетасовки. Эта служба сохраняет файлы Shuffle, написанные исполнителями

kylin.storage.columnar.spark-conf.spark.dynamicAllocation.initialExecutors

Начальное количество исполнителей

spring.session.store-type

Режим хранения сессионных данных. Возможные значения: none (хранение в памяти приложения) и jdbc (хранение в персистентном хранилище)

none

kylin.OLAP.Pangolin.ConnectionURL

Строка подключения к СУБД Pangolin

kylin.OLAP.Pangolin.Schema

Схема Pangolin для использования

OLP

kylin.OLAP.GP.ConnectionURL

Строка подключения к СУБД Greenplum

kylin.OLAP.GP.Schema

Схема Greenplum для использования

OLP

Переопределение настроек#

В файле kylin.properties доступно множество настроек. Чтобы изменить часть из них, создайте новый файл с именем kylin.properties.override в каталоге $KYLIN_HOME/conf.

Затем поместите настраиваемые элементы конфигурации в kylin.properties.override. Элементы из этого файла будут переопределять значения по умолчанию в kylin.properties во время выполнения программы.

Это удобно использовать при обновлении системы. Просто поместите файл kylin.properties.override вместе с новой версией kylin.properties.

Настройки JVM#

Конфигурация JVM по умолчанию такова:

export KYLIN_JVM_SETTINGS="-server -Xms1g -Xmx8g -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:G1HeapRegionSize=16m -XX:+PrintFlagsFinal -XX:+PrintReferenceGC -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintAdaptiveSizePolicy -XX:+UnlockDiagnosticVMOptions -XX:+G1SummarizeConcMark  -Xloggc:$KYLIN_HOME/logs/kylin.gc.$$  -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=10 -XX:GCLogFileSize=64M -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=${KYLIN_HOME}/logs"

Чтобы изменить конфигурацию, сделайте копию, назовите setenv.sh и поместите ее в папку $SKYLINE_HOME/conf/, затем измените конфигурацию в ней.

Параметр -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=${KYLIN_HOME}/logs будет генерировать журналы при выходе из памяти.

Путь к файлу журнала по умолчанию — ${KYLIN_HOME}/logs. При необходимости его можно изменить.

export JAVA_VM_XMS=1g        #Начальная память JVM при запуске OLAP
export JAVA_VM_XMX=8g        #Максимальный объем памяти JVM при запуске OLAP
export JAVA_VM_TOOL_XMS=1g   #Начальный объем памяти JVM при запуске класса инструмента
export JAVA_VM_TOOL_XMX=8g   #Максимальный объем памяти JVM при запуске класса инструмента

Если значение JAVA_VM_TOOL_XMS не задано, то значение JAVA_VM_TOOL_XMS будет использовать значение JAVA_VM_XMS. Аналогично, если значение JAVA_VM_TOOL_XMX не задано, JAVA_VM_TOOL_XMX будет использовать значение JAVA_VM_XMX.

Примечание

  1. Некоторые специальные классы инструментов, такие как guardian.sh, get-properties.shне зависят от конфигурации JAVA_VM_TOOL_XMS, JAVA_VM_TOOL_XMX.

  2. Два элемента конфигурации JAVA_VM_TOOL_XML и JAVA_VM_TOOL_XMX были добавлены и вступают в силу. При обновлении старой версии необходимо настроить их вручную.

Рекомендуемые настройки для производственной среды#

В каталоге $KYLIN_HOME/conf/ находятся два набора готовых к использованию конфигураций: production и minimal.

Первая — это конфигурация по умолчанию, которая рекомендуется для производственной среды.

Вторая использует минимум ресурсов и подходит для «песочницы» или другого узла с ограниченными ресурсами.

Используйте минимальную конфигурацию, если среда имеет ограниченные ресурсы.

Чтобы перейти на минимальную конфигурацию, уберите символы комментария у нижеперечисленных элементов конфигурации в файле $KYLIN_HOME/conf/kylin.properties и перезапустите компонент OLAP, чтобы они вступили в силу.

# KAP предоставляет два профиля конфигурации: minimal и production (по умолчанию).
# Чтобы переключиться на minimal: раскомментируйте свойства
# kylin.storage.columnar.spark-conf.spark.driver.memory=512m
# kylin.storage.columnar.spark-conf.spark.executor.memory=512m
# kylin.storage.columnar.spark-conf.spark.executor.memoryOverhead=512m
# kylin.storage.columnar.spark-conf.spark.executor.extraJavaOptions=-Dhdp.version=current -Dlog4j.configuration=spark-executor-log4j.properties -Dlog4j.debug -Dkylin.hdfs.working.dir=${kylin.env.hdfs-working-dir} -Dkylin.metadata.identifier=${kylin.metadata.url.identifier} -    Dkylin.spark.category=sparder -Dkylin.spark.project=${job.project} -XX:MaxDirectMemorySize=512M
# kylin.storage.columnar.spark-conf.spark.yarn.am.memory=512m
# kylin.storage.columnar.spark-conf.spark.executor.cores=1
# kylin.storage.columnar.spark-conf.spark.executor.instances=1

Конфигурация Spark#

Подробное объяснение конфигурации Spark смотрите в официальной документации Spark.

Ниже приведены параметры, связанные с запросами и задачами сборки в компоненте OLAP.

Параметры начинаются с kylin.storage.columnar.sparkconf, последующая часть — это параметр Spark, используемый задачей запроса.

Параметры по умолчанию в рекомендуемом файле конфигурации kylin.properties следующие:

Параметр

Min

Prod

kylin.storage.columnar.spark-conf.spark.driver.memory

512m

4096m

kylin.storage.columnar.spark-conf.spark.executor.memory

512m

12288m

kylin.storage.columnar.spark-conf.spark.executor.memoryOverhead

512m

3072m

kylin.storage.columnar.spark-conf.spark.yarn.am.memory

512m

1024m

kylin.storage.columnar.spark-conf.spark.executor.cores

1

5

kylin.storage.columnar.spark-conf.spark.executor.instances

1

4

Компонент OLAP предоставляет настраиваемые конфигурации Spark. Настройки будут влиять на то, как будет формироваться план выполнения Spark.

Параметры по умолчанию в рекомендуемом конфигурационном файле kylin.properties следующие:

Параметр

Описание

Значение по умолчанию

kylin.storage.columnar.spark-conf.spark.sql.cartesianPartitionNumThreshold

-1

Порог для числа декартовых разделов в плане выполнения Spark. Запрос будет завершен, если число декартовых разделов достигнет или превысит пороговое значение. Если это значение задано пустым или отрицательным, порог будет установлен как spark.executor.cores spark.executor.instances 100

Параметры начинаются с kylin.engine.spark-conf, последующая часть — это параметр Spark, используемый для задания сборки.

Параметры по умолчанию не настроены, и они будут автоматически скорректированы и сконфигурированы в соответствии со средой кластера во время выполнения задания сборки. Если настроить эти параметры в kylin.properties, компонент OLAP сначала будет использовать конфигурацию в kylin.properties.

kylin.engine.spark-conf.spark.executor.instances
kylin.engine.spark-conf.spark.executor.cores
kylin.engine.spark-conf.spark.executor.memory
kylin.engine.spark-conf.spark.executor.memoryOverhead
kylin.engine.spark-conf.spark.sql.shuffle.partitions
kylin.engine.spark-conf.spark.driver.memory
kylin.engine.spark-conf.spark.driver.memoryOverhead
kylin.engine.spark-conf.spark.driver.cores

Конфигурация Spark Context Canary#

Sparder Canary — это компонент, используемый для мониторинга рабочего состояния Sparder.

Он будет периодически проверять, нормально ли работает текущий Sparder. Если рабочее состояние является ненормальным, например, Sparder неожиданно завершает работу или перестает отвечать на запросы, Sparder Canary создаст новый экземпляр Sparder.

Параметр

Описание

Значение по умолчанию

kylin.canary.sqlcontext-enabled

Включает функцию Sparder Canary

false

kylin.canary.sqlcontext-threshold-to-restart-spark

Перезапуск контекста Spark при превышении количества аномальных обнаружений

kylin.canary.sqlcontext-period-min

Интервал проверки

3

kylin.canary.sqlcontext-error-response-ms

Время ожидания одиночного обнаружения

3

kylin.canary.sqlcontext-type

Метод обнаружения. Этот метод подтверждает, что контекст Spark все еще работает нормально, записывая parquet-файл в каталог, настроенный kylin.env.hdfs-working-dir. Он также может быть настроен как count, чтобы подтвердить, работает ли spark context нормально

file

Интеграция с компонентом Platform V Pangolin SE (PSQ) как источником данных#

Параметр

Описание

Значение по умолчанию

kylin.source.jdbc.pangolin.source.enable

Использование Pangolin в качестве источника данных

false

kylin.source.jdbc.pangolin.connection-url

URL для подключения к БД Pangolin

kylin.source.jdbc.pangolin.ssl.enabled

Использование mTLS для подключения к Pangolin

false

Пример запроса импорта конфигурации доступа к СУБД Pangolin в качестве источника данных#

Пример запроса импорта конфигурации доступа в режиме LOCAL/LOCAL
POST http://localhost:7070/kylin/api/projects/import/projectData
Accept: application/json
Content-Type: application/json
Authorization: Basic <base64_basic_auth>

{
  "projectList": [
    {
      "code": "<project_name>",
      "DBPangolinList": [
        "<schema_name>"
      ],
      "Pangolin": {
        "loginPass": "pangolinSource.properties",
        "jks": "pangolinSource.jks"
      }
    }
  ]
}
Пример запроса импорта конфигурации доступа в режиме SCIM/OID
POST http://localhost:7070/kylin/api/internal/conf/projects/import/projectData
Accept: application/json
Content-Type: application/json
Authorization: Bearer <bearer_token>

{
  "projectList": [
    {
      "code": "<project_name>",
      "DBPangolinList": [
        "<schema_name>"
      ],
      "Pangolin": {
        "loginPass": "pangolinSource.properties",
        "jks": "pangolinSource.jks"
      }
    }
  ]
}

Интеграция с компонентом SDP AnalyticDB (Greenplum) как источником данных#

Параметр

Описание

Значение по умолчанию

kylin.source.jdbc.greenplum.source.enable

Использование Greenplum в качестве источника данных

false

kylin.source.jdbc.greenplum.connection-url

URL для подключения к БД Greenplum

kylin.source.jdbc.greenplum.ssl.enabled

Использование mTLS для подключения к Greenplum

false

Пример запроса импорта конфигурации доступа к СУБД Greenplum в качестве источника данных#

Пример запроса импорта конфигурации доступа в режиме LOCAL/LOCAL
POST http://localhost:7070/kylin/api/projects/import/projectData
Accept: application/json
Content-Type: application/json
Authorization: Basic <base64_basic_auth>

{
  "projectList": [
    {
      "code": "<project_name>",
      "DBGPList": [
        "<schema_name>"
      ],
      "Greenplum": {
        "loginPass": "greenplumSource.properties",
        "jks": "greenplumSource.jks"
      }
    }
  ]
}
Пример запроса импорта конфигурации доступа в режиме SCIM/OID
POST http://localhost:7070/kylin/api/internal/conf/projects/import/projectData
Accept: application/json
Content-Type: application/json
Authorization: Bearer <bearer_token>

{
  "projectList": [
    {
      "code": "<project_name>",
      "DBGPList": [
        "<schema_name>"
      ],
      "Greenplum": {
        "loginPass": "greenplumSource.properties",
        "jks": "greenplumSource.jks"
      }
    }
  ]
}

Интеграция с Kerberos#

Параметр

Описание

Значение по умолчанию

kylin.kerberos.enabled

Включение аутентификации с использованием Kerberos

false

kylin.kerberos.project-level-enabled

Включение разграничения доступов на уровне проекта

false

kylin.kerberos.krb5-conf

Имя файла с конфигурацией Kerberos-провайдера относительно директории $KYLIN_HOME/conf

krb5.conf

kylin.kerberos.principal

Имя Principal ТУЗ OLAP

kylin.kerberos.keytab

Имя временного keytab-файла для ТУЗ OLAP относительно secret.keytab.path

kylin.kerberos.job.dir

Директория хранения временных файлов для Spark Job с информацией о Kerberos-аутентификации

/tmp/

kylin.kerberos.job-clear-interval-minutes

Интервал запуска (в минутах) программы очистки директории хранения временных файлов для Spark Job

720

Динамическое распределение Spark#

В Spark ресурсной единицей является executor, что-то вроде контейнеров в YARN.

В Spark на YARN используются num-executors для указания количества исполнителей. В то время как executor-memory и executor-cores будут ограничивать память и виртуальные ядра процессора, потребляемые каждым исполнителем.

Например, если пользователь выбрал фиксированную стратегию распределения ресурсов и установил num-executor равным 3, то каждый экземпляр OLAP всегда будет содержать 4 контейнера YARN (1 для мастера приложения и 3 для исполнителя). Эти 4 контейнера будут заняты до тех пор, пока пользователь не выйдет из системы.

Таким образом, при использовании динамического распределения ресурсов Spark будет динамически увеличивать и уменьшать количество исполнителей в зависимости от нагрузки на движок запросов компонента OLAP, что значительно сэкономит ресурсы.

Для динамического распределения Spark настройте:

  • Resource Management для кластера. Настройки будут отличаться из-за различных менеджеров ресурсов (YARN, Mesos, Standalone).

  • Файл spark-default.conf (этот файл не зависит от среды).

Настройка Resource Manager#

HDP

  1. Войдите на страницу управления Ambari, выберите Yarn Configs Advanced, найдите следующие настройки через фильтр и обновите: yarn.nodemanager.aux-services.spark_shuffle.class=org.apache.spark.network.yarn.YarnShuffleService.

  2. Сохраните конфигурацию и перезапустите все службы.

Конфигурация компонента OLAP

Конфигурацию Spark можно переопределить в kylin.properties.

Чтобы включить динамическое распределение Spark, добавьте следующие параметры конфигурации в конфигурационные файлы Spark.

kylin.storage.columnar.spark-conf.spark.dynamicAllocation.enabled=true
kylin.storage.columnar.spark-conf.spark.dynamicAllocation.maxExecutors=5
kylin.storage.columnar.spark-conf.spark.dynamicAllocation.minExecutors=1
kylin.storage.columnar.spark-conf.spark.shuffle.service.enabled=true
kylin.storage.columnar.spark-conf.spark.dynamicAllocation.initialExecutors=3

Примечание

Описание параметров читайте в разделе «Общие настройки».

При конфигурации реплик исполнителей задач Spark значения должны быть >=2 для параметров: kylin.storage.columnar.spark-conf.spark.dynamicAllocation.maxExecutors, kylin.storage.columnar.spark-conf.spark.dynamicAllocation.minExecutors, kylin.storage.columnar.spark-conf.spark.dynamicAllocation.initialExecutors.

После выполнения указанных настроек запустите компонент OLAP и проследите за текущим количеством исполнителей на странице Spark Executor.

Исполнители будут простаивать, поэтому через некоторое время их количество будет уменьшаться, пока не достигнет минимального количества в конфигурационном элементе.

Настройка очереди Hadoop#

В случае мультитенантной среды для безопасного совместного использования большого кластера каждому тенанту необходимо своевременно получать выделенные ресурсы в соответствии с ограничениями выделенных мощностей.

Для обеспечения распределения и разделения вычислительных ресурсов каждый экземпляр OLAP или проект может быть сконфигурирован для использования дополнительной очереди YARN.

Конфигурация очереди YARN на уровне экземпляра#

Создайте новую очередь планировщика мощностей YARN. По умолчанию задание, отправленное компонентом OLAP, будет отправляться в очередь YARN по умолчанию.

Измените файл kylin.properties для настройки очереди YARN, используемой в компоненте OLAP для сборки или отправки запроса (измените YOUR_QUEUE_NAME на имя вашей очереди).

Building configuration: kylin.engine.spark-conf.spark.yarn.queue=YOUR_QUEUE_NAME
Querying configuration: kylin.storage.columnar.spark-conf.spark.yarn.queue=YOUR_QUEUE_NAME

Чтобы проверить, что изменения применились, запустите задание отправки запросов. Затем перейдите в YARN Resource Manager в кластере. Задание было отправлено в переименованную очередь.

Чтобы добиться разделения вычислительных ресурсов, таким же образом настройте очередь YARN для других экземпляров OLAP.

Конфигурация очереди YARN на уровне проекта#

Технический администратор системы может установить очередь приложений YARN для проекта в разделе Настройки Расширенные настройки - Очередь приложений YARN. Более подробную информацию смотрите в документе «Руководство пользователя OLAP» в разделе «Расширенные настройки».

Параметры кеширования запросов#

По умолчанию компонент OLAP включает кеширование запросов в каждом процессе для повышения производительности запросов.

Кеширование по умолчанию#

По умолчанию компонент OLAP включает кеш запросов на уровне каждого узла/процесса. Детали конфигурации описаны ниже. Изменить их можно в файле $KYLIN_HOME/conf/kylin.properties в каталоге установки компонента OLAP.

Параметр

Описание

Значение по умолчанию

kylin.query.cache-enabled

Включает кеширование запросов

true

Критерии кеширования запросов#

По умолчанию компонент OLAP не кеширует результаты всех SQL-запросов (поскольку ресурс памяти может быть ограничен). Он кеширует только медленные запросы, размер результатов которых соответствует критериям.

Кешироваться будет запрос, удовлетворяющий любой из конфигураций №1, №2, №3, а также удовлетворяющий конфигурации №4.

Критерий настраивается следующими параметрами.

Параметр

Описание

Значение по умолчанию

Единица измерения

1

kylin.query.cache-threshold-duration

Запросы, продолжительность которых превышает значение параметра

2000

миллисекунда

2

kylin.query.cache-threshold-scan-count

Запросы, число строк сканирования которых превышает значение параметра

10240

ряд

3

kylin.query.cache-threshold-scan-bytes

Запросы, байты сканирования которых превышают значение параметра

1048576

байт

4

kylin.query.large-query-threshold

Запросы, размер набора результатов которых меньше значения параметра

1000000

ячейка

Конфигурация кеш-памяти Ehcache#

По умолчанию компонент OLAP использует Ehcache в качестве кеша запросов. Настройка Ehcache необходима для управления размером и политикой кеша запросов. Чтобы заменить стандартную конфигурацию кеширования запросов, измените следующие параметры конфигурации.

Параметр

Описание

Значение по умолчанию

kylin.cache.config

Путь к файлу ehcache.xml. Чтобы заменить стандартный файл конфигурации кеша запросов, создайте новый файл xml, например ehcache2.xml, в каталоге ${KYLIN_HOME}/conf/ и измените значение этого элемента конфигурации: file://${KYLIN_HOME}/conf/ehcache2.xml

classpath:ehcache.xml

Конфигурация кеш-памяти Redis#

Кеш запросов по умолчанию не может быть разделен между различными узлами или процессами, поскольку он находится на уровне процесса.

Из-за этого, когда последующие одинаковые запросы направляются на разные узлы компонента OLAP, кеш результатов первого запроса не может быть использован в режиме развертывания кластера. Поэтому можно сконфигурировать кластер Redis как распределенный кеш, который может быть общим для всех узлов компонента OLAP. Подробно параметры конфигурации описаны ниже:

Параметр

Описание

Значение по умолчанию

kylin.cache.redis.enabled

Включает кеш запросов с помощью кластера Redis

false

kylin.cache.redis.cluster-enabled

Включает режим кластера Redis

false

kylin.cache.redis.hosts

Хост Redis. Если необходимо подключиться к кластеру Redis, разделите хосты запятыми, например, kylin.cache.redis.hosts=localhost:6379,localhost:6380

localhost:6379

kylin.cache.redis.expire-time-unit

Единица времени для периода кеширования. EX означает секунды, а PX означает миллисекунды

EX

kylin.cache.redis.expire-time

Допустимый период кеширования.

86400

kylin.cache.redis.reconnection.enabled

Включает переподключение redis при снижении уровня кеша до ehcache

true

kylin.cache.redis.reconnection.interval

Интервал автоматического переподключения, в минутах

60

kylin.cache.redis.password

Пароль Redis

В связи с несогласованностью метаданных между узлами Query и All/Job необходимо настроить переключение кеша redis kylin.cache.redis.enabled=true и kylin.server.store-type=jdbc.

Настройка отката#

Предпосылкой использования инструмента отката является то, что данные ресурса (данные OLAP-куба, словаря, моментальные снимки и т.д.) должны быть гарантированно не удалены в диапазоне времени отката.

Период хранения ресурсных данных включает в себя две конфигурации:

Настройка

Описание

Значение по умолчанию

kylin.storage.time-machine-enabled

После включения настройки ресурсы, находящиеся в периоде хранения, не будут удаляться в службе OLAP, а время хранения данных моментальных снимков будет соответствовать времени, настроенному в параметре kylin.storage.resource-survival-time-threshold

False

kylin.storage.resource-survival-time-threshold

Время хранения данных ресурса

7d (описание единиц измерения: d (день), h (час), m (минута))

Настройки редактируются в конфигурационном файле kylin.properties администратором.

Настройки параметров безопасности#

Параметры интеграции с Secret Management System (SecMan)#

Для интеграции с Secret Management System (SecMan) необходимо заполнить следующие параметры:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

vault.enabled

Включение интеграции с SecMan

false

kylin.properties

vault.url

URL SecMan

kylin.properties

vault.namespace

Namespace хранения секретов в SecMan

kylin.properties

vault.secret.path

Путь до KV-v2-хранилища

kylin.properties

vault.module.path

Путь до секретов относительно KV-v2-хранилища

kylin.properties

vault.need_secret

Имена секретов для получения из SecMan

kylin.properties

secret.zero.path

Абсолютный путь до директории хранения zero secret (AppRole ID, Secret ID wrapped token)

kylin.properties

vault.approle.id

Имя файла с идентификатором AppRole. Файл должен располагаться в директории, указанной в параметре secret.zero.path

approle_role_id

kylin.properties

vault.approle_wrapped_secret_id

Имя файла с wrapped token для AppRole Secret ID. Файл должен располагаться в директории, указанной в параметре secret.zero.path

approle_wrapped_secret_id

kylin.properties

vault.approle_ca_chain_pem

Имя файла с цепочкой сертификатов доверенных УЦ для проверки серверного сертификата SecMan. Файл должен располагаться в директории, указанной в параметре secret.zero.path

approle_ca_chain.pem

kylin.properties

vault.approle.path

Имя файла с параметризируемой частью пути URI для аутентификации в SecMan c использованием AppRole-компонента. Файл должен располагаться в директории, указанной в параметре secret.zero.path. Пример URI: https://<vault_host>:<vault_port>/v1/auth/<approle_path>/login, где <approle_path> — параметризируемая часть пути

approle_path

kylin.properties

secret.dir

Абсолютный путь до директории хранения секретов, полученных из SecMan. Директория создается компонентом. У ТУЗ, под которой запускается компонент, должны быть права на запись в родительскую директорию

kylin.properties

secret.JKS.path

Абсолютный путь до директории хранения секретов (JKS), полученных из SecMan. Директория создается компонентом. У ТУЗ, под которой запускается компонент, должны быть права на запись в родительскую директорию

kylin.properties

secret.keytab.path

Абсолютный путь до директории хранения секретов (keytab). Директория создается компонентом. У ТУЗ, под которой запускается компонент, должны быть права на запись в родительскую директорию

kylin.properties

vault.wrapped-token.secret-id-field

Имя поля в формате JSON, в котором будет храниться Secret ID после выполнения операции unwrap для wrapped token

secret_id

kylin.properties

vault.secret.zero.removing-mode

Режим удаления zero secret: AFTER — удаляется после успешного чтения секретов из SecMan; ALWAYS — удаляется независимо от результата чтения секретов; NEVER — не удаляется (не рекомендуется использовать на промышленных стендах)

AFTER

kylin.properties

vault.wrapping-token.enabled

Включение генерации и периодического обновления wrapped token c Secret ID при работе компонента. Обновление производится с периодичностью vault.wrapped_token_ttl/3 c

true

kylin.properties

vault.wrapped_token_ttl

TTL выпускаемого wrapped token c Secret ID. Используется при vault.wrapping-token.enabled=true

14400

kylin.properties

Параметры проверки сертификатов#

Для проверки отозванных сертификатов используются следующие параметры:

Параметр

Описание

Значение по умолчанию

kylin.OLAP.server.ssl.check-certs-revocation.enabled

Опция включения или отключения проверки отозванных сертификатов OLAP за исключением Spark Job

True

kylin.OLAP.server.ssl.crldp.enabled

Опция включения или отключения поддержки точек распространения CRL при проверке отозванных сертификатов OLAP за исключением Spark Job

True

kylin.OLAP.server.ssl.ocsp.enabled

Опция включения или отключения проверки OCSP при проверке отозванных сертификатов OLAP за исключением Spark Job

True

kylin.OLAP.spark.job.ssl.check-certs-revocation.enabled

Опция включения или отключения проверки отозванных сертификатов во время выполнения Spark Job

False

kylin.OLAP.spark.job.ssl.crldp.enabled

Опция включения или отключения поддержки точек распространения CRL при проверке отозванных сертификатов во время выполнения Spark Job

False

kylin.OLAP.spark.job.ssl.ocsp.enabled

Опция включения или отключения проверки OCSP при проверке отозванных сертификатов во время выполнения Spark Job

False

Настройки редактируются в конфигурационном файле kylin.properties администратором.

Настройка аутентификации#

Компонент поддерживает несколько режимов аутентификации:

  • LOCAL - аутентификация пользователя по логину и паролю локальной УЗ посредством веб-формы аутентификации компонента. В этом режиме используется схема аутентификации Basic.

  • OID - аутентификация пользователя внешним компонентом IAM Proxy (AUTH), через компонент KeyCloak.SE (KCSE), с использованием OpenID Connect. В этом режиме используется схема аутентификации Bearer.

Режим аутентификации пользователя в приложении определяется параметром:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.auth

Режим аутентификации пользователя в приложении

OID

kylin.properties

Параметры интеграции с IAM Proxy (AUTH)#

Для интеграции с IAM Proxy (AUTH) необходимо заполнить следующие параметры:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.sudir.addr

Адрес для получения конфигурации провайдера аутентификации

kylin.properties

kylin.OLAP.iam.addr

Адрес IAM

kylin.properties

kylin.OLAP.iam.junction

Junction компонента в IAM

kylin.properties

kylin.OLAP.authCI

Cписок кодов CI (Configuration Item - конфигурационный элемент). Используется для проверки поля aud (получатель токена) в JWT

kylin.properties

kylin.OLAP.ISS.Value

Cписок ISS - доверенных сторон, которые выпускают JWT

kylin.properties

Параметры интеграции с компонентом «Единый коллектор телеметрии» (COTE) продукта Platform V Monitor#

Система поддерживает асинхронную отправку событий аудита в компонент «Единый коллектор телеметрии» (COTE).

При старте приложения происходит отправка предопределенной мета-модели для регистрации и далее каждая значимая операция в системе так же сопровождается отправкой соответствующего события в компонент COTE. Конфигурирование интеграции и отправки сообщений предопределяется набором параметров, представленных в таблицах ниже:

Базовые параметры#

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.auditSE.enabled

Включение/отключение отправки событий в компонент COTE

true

kylin.properties

kylin.OLAP.auditSE.host

FQDN/IP-адрес сервера компонента COTE

kylin.properties

kylin.OLAP.auditSE.endpoint-prefix

Базовый префикс для каждого endpoint сервера компонента COTE

kylin.properties

kylin.OLAP.auditSE.metamodel-module

Имя модуля в метамодели

-

kylin.properties

kylin.OLAP.auditSE.port

Порт сервера компонента COTE

kylin.properties

kylin.OLAP.auditSE.schema

Схема

HTTPS

kylin.properties

kylin.OLAP.auditSE.timeout

Тайм-аут обращения к API сервера компонента COTE в миллисекундах

10 000

kylin.properties

kylin.OLAP.auditSE.node-id

IP и FQDN (через пробел) узла компонента или FQDN namespace среды контейнеризации, с которого происходит отправка событий аудита

kylin.properties

kylin.OLAP.auditSE.user-node-id-headers

Список HTTP-заголовков для извлечения IP-запроса инициатора операции

kylin.properties

kylin.OLAP.auditSE.OTTS.enabled

Включение (true) или отключение (false) аутентификации с Аудит через компонент «One-Time Password (OTP) / OTT» (OTTS)

true

kylin.properties

kylin.OLAP.auditSE.OTTS.url

URL сервиса OTTS. Используется встроенным в клиент OTTS программным БН как шаблон для формирования ссылок при вызове серверов OTTS, указанных в параметре kylin.OLAP.auditSE.OTTS.hosts

-

kylin.properties

kylin.OLAP.auditSE.OTTS.hosts

Список серверов OTTS. Порт (8080 или 8443) должен соответствовать протоколу (HTTP или HTTPS), указанному в kylin.OLAP.auditSE.OTTS.url

-

kylin.properties

kylin.OLAP.auditSE.OTTS.id

Идентификатор приложения/namespace в OTTS

-

kylin.properties

kylin.OLAP.auditSE.OTTS.auth-realm

Авторизационный realm

mmt

kylin.properties

kylin.OLAP.auditSE.OTTS.module-attribute-id

Атрибут контекста авторизации, в котором передается идентификатор приложения/namespace в OTT. При пустом значении параметров будет использовать значение из КМ OTT

-

kylin.properties

kylin.OLAP.auditSE.OTTS.token-type-attribute-id

Атрибут контекста авторизации, в котором передается тип запрашиваемого токена. При пустом значении параметров будет использовать значение из КМ OTT

-

kylin.properties

kylin.OLAP.auditSE.OTTS.action-id

Action, используется для совместимости с ММТ

request

kylin.properties

kylin.OLAP.auditSE.OTTS.receiver-id

Идентификатор OTTS для приложения получателя

-

kylin.properties

Параметры настройки повторной отправки данных аудита в случае возникновения проблем при отправке#

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.auditSE.retry.period-ms

Стартовая длительность ожидания до осуществления повторной отправки данных в компонент COTE при проблемах отправки (в миллисекундах)

100

kylin.properties

kylin.OLAP.auditSE.retry.max-period-ms

Максимальная ожидания до осуществления повторной отправки данных в компонент COTE при проблемах отправки (в миллисекундах)

1000

kylin.properties

kylin.OLAP.auditSE.retry.max-attempts

Максимальное количество повторных отправок, которые будут выполнены при проблемах отправки данных в компонент COTE

3

kylin.properties

Параметры настройки пула потоков и очереди событий для асинхронной отправки данных аудита#

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.auditSE.thread-pool.core-pool-size

Минимальное количество потоков в пуле (не менее 2)

4

kylin.properties

kylin.OLAP.auditSE.thread-pool.maximum-pool-size

Максимальное количество потоков в пуле

8

kylin.properties

kylin.OLAP.auditSE.thread-pool.keep-alive-time-in-seconds

Время ожидания дополнительных потоков в пуле до удаления

32

kylin.properties

kylin.OLAP.auditSE.thread-pool.queue-capacity

Фиксированный размер очереди событий, ожидающих отправки

256

kylin.properties

Настройка аудита#

В конфигурационном файле компонента OLAP kylin.properties есть параметр конфигурации журнала аудита: kylin.metadata.audit-log.max-size=500000. Этот параметр определяет количество показываемых строк в журнале. По умолчанию значение составляет 500 000 строк. Параметр может быть изменен по мере необходимости.

По умолчанию избыточный журнал операций очищается каждое утро.

Параметры чтения дополнительных конфигурационных файлов с данными учетных записей#

В целях безопасности данные учетных записей для подключения к внешним ресурсам вынесены в отдельные файлы конфигурации.

Пути ожидаемого расположения файлов настраиваются с помощью параметров:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

secret.DB.path

Путь к файлу с данными учетной записи для подключения к БД

optional:${KYLIN_HOME}/conf/OLAP_DB_secret.properties

kylin.properties

secret.hiveDB.path

Путь к файлу с данными учетной записи для подключения к БД Hive

optional:${KYLIN_HOME}/conf/OLAP_hiveDB_secret.properties

kylin.properties

Параметры учетной записи подключения к БД#

Логин и пароль для подключения к БД настраиваются с помощью параметров:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

meta.DB.login

Логин для подключения к БД (должно быть закодированно в Base64)

OLAP_DB_secret.properties

meta.DB.password

Пароль для подключения к БД (должно быть закодированно в Base64)

OLAP_DB_secret.properties

Параметры учетной записи подключения к БД Hive#

Логин и пароль для подключения к БД Hive настраиваются с помощью параметров:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

meta.hiveDB.login

Логин для подключения к БД Hive (должно быть закодированно в Base64)

OLAP_hiveDB_secret.properties

meta.hiveDB.password

Пароль для подключения к БД Hive (должно быть закодированно в Base64)

OLAP_hiveDB_secret.properties

Параметры режима управления пользователями#

Для управления пользователями и их ролями с помощью внешнего компонента в OLAP реализована поддержка SCIM API.

Режим управления пользователями и параметры аутентификации внешнего компонента при обращении к SCIM API настраиваются с помощью параметров:

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.access

Режим управления пользователями. Через встроенный API компонента OLAP (LOCAL) или с использованием SCIM API (SCIM)

SCIM

kylin.properties

kylin.OLAP.accessSCIM.CN.headerName

Имя HTTP-заголовка с CN сертификата для аутентификации при обращении к сервис-провайдеру SCIM

-

kylin.properties

kylin.OLAP.accessSCIM.CN.Value

Список(через запятую) CN авторизированных для выполнения запросов к сервис-провайдеру SCIM

-

kylin.properties

Параметры управления группами#

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

kylin.OLAP.user-group.prefix

Общий префикс имени групп, добавляемый при создании

«»

kylin.properties

kylin.OLAP.user-group.add-project-prefix

Флаг для добавления имени проекта в имя группы при создании

true

kylin.properties

kylin.OLAP.user-group.max-length

Максимальная длина имени группы

32

kylin.properties

Параметры шифрования секретов#

Параметр

Описание

Значение по умолчанию

Конфигурационный файл

secret.crypt.keyParam

Список параметров для генерации ключа шифрования секретов

kylin.properties

В целях обучения и практики работы с инструментами бизнес-аналитики, OLAP-кубами и MDX-запросами в дистрибутиве поставляется скрипт с проектом sample_adw_hive.sh. Скрипт предназначен для автоматизированного создания проекта с преднастроенными моделями, которые содержат готовую структуру данных для имитации реальных бизнес-процессов. Более подробное описание скрипта и инструкция по его запуску находятся в документе «Создание проекта с преднастроенными моделями».