Параллельная обработка данных в задачах сбора данных#

Данная функция позволяет настраивать параллельные потоки обработки данных с использованием конфигураций обработки, фильтрации и преобразования полученных данных для их последующего сохранения в различные хранилища данных. Шаг «Параллельная обработка данных» не является обязательным. Если данные не требуют параллельного преобразования, их можно сразу отправить на хранение. Для запуска параллельной обработки данных необходимо добавить чекбокс с надписью «Разделить последующую обработку на потоки». По умолчанию чекбокс установлен в положение «false».

check-box

Потоки очередей компонентов обработки применяются одновременно ко всем собранным и обработанным данным. Таким образом, можно разделить потоки данных для того, чтобы по-разному их дополнительно обрабатывать и сохранять.

После выбора конфигурации обработки отображаются поля конфигурации из JSON очерченные горизонтальной линией в конце конфигурации.

processing

Если необходимо удалить обработку нажмите иконку «Корзина». При клике на иконку «Корзина» появляется сообщение с текстом: «Вы действительно хотите удалить Обработку N из задачи Наименование задачи». Обработка сразу удалится из задачи сбора данных независимо от результата ее сохранения.

processing_delete

После выбора чекбокс «Разделить последующую обработку на потоки» в навигационной панели появляется неактивный шаг «Параллельная обработка данных»(сразу после шага «Обработка данных»)

not_active_button

Кнопка страницы «Перейдите к хранению» изменяется на «Перейдите к параллельной обработке»

После нажатия кнопки «Перейдите к параллельной обработке» пользователь переходит к шагу «Параллельная обработка данных»

parallel_processing

Далее пользователь должен выбрать конфигурации обработок которые будут применены последовательно в потоке в параллель с другими потоками.

Поток так же можно оставить пустым (без обработок), тогда все полученные данные на шаге сбора и последовательной обработки могут быть направлены на хранение через этот поток.

Иконки действий у варианта хранения#

copy_button

Копировать — копирует весь вариант хранения данных вместе с выбранными потоками обработки в конец списка, в качестве нового варианта.

copy_button

Удалить — удаляет вариант хранения данных вместе с потоками относящимися к нему.

При клике на кнопку «Удалить» появляется информационное сообщение.