Предлагаемый в проекте подход к формализации выбора конфигурации виртуальных машин, оптимальной для решения задач определенного типа (анализ, обработка, визуализация) на больших данных, ориентирован на использование вычислительных процедур, организованных как конвейерно-параллельные процессы, а для параметрической оптимизации предлагается использовать рекуррентные алгоритмы, что позволит учитывать динамический характер процессов выделения вычислительных ресурсов и адаптировать конфигурацию вычислительной среды к текущему классу решаемых прикладных задач. В этом случае возникает необходимость в периодическом перераспределении (динамической миграции) виртуальных машин для поддержания оптимальной конфигурации в условиях изменяющихся показателей потребления ресурсов, однако, сокращаются интегральные потери машинного времени, связанные с недоиспользованием имеющихся ресурсов, и увеличивается число решаемых прикладных задач, ориентированных на приложения, использующие преимущества параллельных расчетов.

Возможность перераспределения ресурсов и оптимизации архитектур виртуальных машин в процессе вычислений реализуется с использованием механизма миграции виртуальных машин, что обеспечивает перенос как виртуальной машины, так и приложения с одного физического узла вычислительной системы на другой с сохранением состояния и параметров исполняющихся процессов. В ходе ПНИ предлагается разработать способ интеллектуального планирования  запуска и перераспределения задач обработки больших данных в виртуальной среде на основе выбора учитываемых аппаратных ресурсов системы, используемых виртуальной машиной, и решения задачи поиска оптимальной конфигурации виртуальной среды в зависимости от загруженности ресурсов. В качестве учитываемых ресурсов необходимо рассматривать загрузку центральных процессоров, используемый объем оперативной памяти и нагрузку на дисковую подсистему. При этом в качестве критериев оптимизации рассматриваются минимизация числа используемых виртуальных машин и выравнивание нагрузки на физические вычислительные средства.

Предлагаемое решение является новым и обладает следующими конкурентными преимуществами по сравнению с существующими аналогами:

  • оптимизация распределения ресурсов по нескольким критериям (например, нагрузки на процессор и память);
  • ведение оперативного учета фактически потребляемых ресурсов виртуальными машинами;
  • возможность настройки планировщика для задач разных классов обработки больших данных, запускаемых в виртуальных машинах, а не ориентация на какие-либо прикладные задачи одного типа;
  • ожидаемое снижение объема потребляемой электроэнергии (по сравнению со стандартными вычислительными подходами).

Алгоритмы обработки больших данных предлагается модифицировать с учетом распределения вычислительной нагрузки между виртуальными машинами вычислительной среды и реализации поиск оптимальной конфигурации виртуальных машин. Такое решение впервые позволяет учитывать динамический характер процессов выделения ресурсов и эффективно адаптировать конфигурацию вычислительной среды к текущему типу решаемых прикладных задач по обработке больших данных.