ivdon3@bk.ru
Университеты обладают фантастическим потенциалом для получения важнейших знаний, благодаря наличию огромных объемов данных. Статья посвящена переходу университетов от хранилищ данных к более гибким и масштабируемым озёрам данных для обработки больших данных. Рассматриваются ключевые различия и сходства хранилищ данных и озер данных, где хранилища ориентированы на структурированные данные и традиционную аналитику, а озера данных позволяют работать с сырыми и полуструктурированными данными, поддерживая гибкий ELT-подход (извлечение, преобразование, загрузка). Акцентируется внимание на вызовах, связанных с миграцией данных между этими архитектурами, включая вопросы безопасности, масштабируемости и затрат. Использование облачных решений и технологий, таких как Apache Hadoop и Spark, помогает снижать затраты и эффективно управлять большими данными. Приводятся примеры способов обработки данных с помощью машинного обучения и специализированных инструментов, что способствует лучшему пониманию процесса управления и анализа данных в университетских структурах.
Ключевые слова: хранилище данных, озеро данных, большие данные, облачное хранение, неструктурированные данные, полуструктурированные данные
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.6 - Методы и системы защиты информации, информационная безопасность
В статье представлен метод количественной оценки зигзагообразности траекторий движения транспортных средств, позволяюший выявить потенциально опасное поведение водителей. Алгоритм анализирует изменения направления движения между сегментами траектории и включает этапы предварительной обработки данных: слияние близко расположенных точек и упрощение траектории с использованием модифицированного алгоритма Рамера–Дугласа–Пекера. Эксперименты на сбалансированном наборе данных (20 траекторий) подтвердили эффективность метода: точность — 0.8, полнота — 1.0, F1-мера — 0.833. Разработанный подход может применяться в системах мониторинга движения, предупреждения аварий и обнаружения опасного вождения. Дальнейшие исследования направлены на повышение точности и адаптацию метода к реальным условиям.
Ключевые слова: траектория, анализ траекторий, зигзагообразность, упрощение траекторий, алгоритм Рамера–Дугласа–Пекера, yolo, обнаружение объектов
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В данной работе предложена новая модель открытой многоканальной системы массового обслуживания с взаимопомощью между каналами и ограниченным временем ожидания заявки в очереди. Представлены общие математические зависимости для вероятностных характеристик такой системы.
Ключевые слова: система массового обслуживания, очередь, обслуживающее устройство, взаимопомощь между каналами
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В настоящее время ключевыми аспектами разработки программного обеспечения являются безопасность и эффективность создаваемых приложений. Особое внимание уделяется безопасности данных и операций с базами данных. В статье освещаются методы и техники разработки безопасных приложений на основе интеграции языка программирования Rust и системы управления базами данных (СУБД) PostgreSQL. Рассматриваются ключевые концепции Rust, такие как строгая типизация, программная идиома (шаблон) RAII, макроопределения, неизменяемость, и как они способствуют созданию надежных и производительных приложений при работе с базой данных. Рассматривается, как интеграция с PostgreSQL позволяет эффективно управлять данными при высоком уровне безопасности, исключая распространенные ошибки и уязвимости. Практический пример демонстрирует преимущества использования Rust в сочетании с PostgreSQL для создания системы управления расписаниями занятий, обеспечивая целостность и безопасность данных.
Ключевые слова: язык программирования Rust, безопасность памяти, RAII, метапрограммирование. СУБД, PostgreSQL
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.6 - Методы и системы защиты информации, информационная безопасность
Отрасль железнодорожного транспорта демонстрирует значительные достижения в различных областях деятельности благодаря внедрению прогнозной аналитики. Системы прогнозной аналитики используют данные из множества источников, таких как сети датчиков, исторические данные, погодные условия и т.д. В статье рассматриваются ключевые направления применения прогнозной аналитики на железнодорожном транспорте, а также преимущества, вызовы и перспективы дальнейшего развития этой технологии в железнодорожной инфраструктуре.
Ключевые слова: прогнозная аналитика на железнодорожном транспорте, прогнозирование пассажиропотока, оптимизация грузоперевозок, оптимизация технического обслуживания, управление запасами и снабжением, управление персоналом, финансовое планирование, анализ больших данных
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Рассматривается Simulink-модель, позволяющая рассчитывать переходные процессы объектов, описываемых с помощью переходной функции при любом виде входного воздействия. Описывается алгоритм работы S-функции, выполняющей расчет с помощью интеграла Дюамеля. Приводятся результаты расчетов. Даются рекомендации по заданию параметров модели. Формулируется вывод о возможности применения модели для расчета динамических режимов.
Ключевые слова: имитационное моделирование, Simulink, переходная характеристика, ступенчатая функция, S-функция, интеграл Дюамеля, модельное время
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
в статье приводятся результаты вычислительных экспериментов по использованию управляющих надстроек на основе искусственной нейронной сети (ИНС) класса RNN и алгоритма «случайный лес», влияющих на разрушающую способность операторов генетического алгоритма (ГА) и способных изменять траекторию движения популяции в пространстве решений непосредственно при работе эволюционной процедуры для трудоемких задач. В данном исследовании приводятся полученные результаты с вычислениями на CPU и CPU+GPGPU в ресурсоемкой задаче синтеза динамических имитационных моделей бизнес-процессов с использованием математического аппарата теории сетей Петри (СП), и сравнение с работы ГА без управляющей надстройки, ГА и управляющая надстройка на основе ИНС класса RNN, ГА и алгоритм «случайный лес». Для моделирования работы ГА, ИНС, алгоритма «случайный лес», моделей бизнес-процессов предложено использование графового представления с использованием различных расширений СП, приводятся примеры моделирования выбранных методов с помощью предложенного математического аппарата. Для работы ИНС и алгоритма «случайный лес» по распознаванию состояния популяции ГА предложен ряд правил, которые позволяют выполнить управление процессом синтеза решений. На основании проведенных вычислительных экспериментов и их анализа показаны сильные и слабые стороны применения предложенных алгоритмов машинного обучения в качестве управляющей надстройки.
Ключевые слова: сеть Петри, дерево решений, случайный лес, машинное обучение, теория сетей Петри, двудольный направленный граф, интеллектуальные системы, эволюционные алгоритмы, системы поддержки принятия решений, математическое моделирование, теория графов
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье излагаются математические основы частотно-временного анализа сигналов с использованием алгоритмов Empirical Mode Decomposition (EMD), Intrinsic Time-Scale Decomposition (ITD) и Variational Mode Decomposition (VMD). Рассматриваются синтетические и реальные сигналы, искаженные аддитивным белым гауссовским шумом с различным отношением сигнал/шум. Произведено комплексное сравнение алгоритмов EMD, ITD и VMD. Исследована возможность применения этих алгоритмов в задачах очистки сигналов от шума и спектрального анализа. Произведена оценка времени выполнения алгоритмов и стабильности вычислений.
Ключевые слова: частотно-временной анализ, очистка от шума, декомпозиция, мода, преобразование Гильберта-Хуанга, Empirical Mode Decomposition, Intrinsic Time-Scale Decomposition, Variational Mode Decomposition
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В работе предлагается подход, позволяющий повысить эффективность использования моделей машинного обучения в задачах мониторинга на основе использования метрических пространств. Под эффективностью при этом понимается решение ключевых задач мониторинга – повышение заблаговременности выявление нежелательных инцидентов и снижение, по возможности, ложных срабатываний системы. Подход носит универсальный характер и не зависит от конкретных алгоритмов машинного обучения (в основном методов классификации) и способов измерения расстояния между элементами метрического пространства. Подбор наилучшей комбинации методов осуществляется путем перебора на основе предложенной методики. Подход апробирован на наборе синтетических и реальных данных.
Ключевые слова: мониторинг, машинное обучение, классификация состояний, прогнозирование инцидентов, заблаговременность, выявление аномалий
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье рассмотрены проблемы износа роликов трайб-аппарата, связанных с рассогласованием скоростей в режиме сопровождения материала. Существующие методы борьбы с износом борются со следствием проблемы, а не с причиной. Одним из способов снижения интенсивности износа бочек роликов является разработка метода, позволяющего скорректировать скорость электродвигателя трайб-аппарата с целью уменьшения рассогласования скоростей между рабочей поверхностью ролика и заготовки, учитывая существующие технологические требования по созданию тянущих и тормозящих усилий. Предложен алгоритм расчёта корректировки скорости на основании натяжения металла, компенсирующий износ ролика и снижающий силу трения. Моделирование системы с разработанным алгоритмом показало устранение рассогласования скоростей во время сопровождения материала, а, следовательно, она позволит снизить интенсивность износа роликов.
Ключевые слова: система корректировки скорости, трайб-аппарат, износ роликов, натяжение металла, система управления, рассогласование скоростей, снижение силы трения
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.3 - Автоматизация и управление технологическими процессами и производствами
Рассматривается использование расширения PDO языка сценариев PHP в качестве метода взаимодействия с различными системами управления базами данных при разработке PHP-приложений. Подчеркиваются преимущества PDO перед традиционными подходами, такими как mysql и pgsql расширения, указывая на его универсальность, поддержку подготовленных запросов, удобство работы с ошибками, поддержку транзакций, и легкость в обучении. Через практические примеры кода демонстрируется, как эти преимущества могут быть реализованы в реальных сценариях работы с базами данных. Затрагивается поддержка подготовленных запросов как одного из мощных механизмов защиты от SQL-инъекций. В заключении подчёркивается важность PDO для современной PHP-разработки, акцентируется внимание на повышенной безопасности, гибкости и удобстве поддержки кода, что делает его предпочтительным выбором для современных разработчиков.
Ключевые слова: PHP, PDO, базы данных, СУБД, безопасность, подготовленные запросы, транзакции, программирование
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.6 - Методы и системы защиты информации, информационная безопасность
В статье представлены основные этапы и рекомендаций по разработке информационно-аналитической системы (ИАС) на основе геоинформационных систем (ГИС) в сфере рационального управления лесными ресурсами, обеспечивающей обработку, хранение и представление информации о лесных древесных ресурсах, а также описание некоторых частных примеров реализации ее отдельных компонентов и цифровых технологий. Рассмотрены такие этапы разработки ИАС: этап сбора и структурирования данных о лесных древесных ресурсах; этап обоснования типа программной реализации ИАС; этап выбора оборудования; этап разработки блока анализа и обработки данных; этап разработки архитектуры взаимодействия блоков ИАС; этап разработки интерфейса приложения ИАС; этап тестирования ИАС. Взаимодействие между клиентской и серверной частью предлагается реализовывать на основе технологии Asynchronous JavaScript and XML (AJAX). Библиотеки «Leaflet» с открытым исходным кодом рекомендуется использовать для визуализации геоданных. Для хранения больших объемов данных на сервере предложено использовать систему управления базой данных SQLite. Предложенные подходы могут найти применение при создании ИАС для формирования управленческих решений в сфере рационального управления лесными древесными ресурсами.
Ключевые слова: геоинформационные системы, лесные ресурсы, методика, веб-приложение, технология AJAX, SQLite, Leaflet, обработка информации
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В условиях цифровизации строительства и импортозамещения, наблюдается растущий переход на отечественное программное обеспечение. Необходимым является построение открытой цифровой экосистемы на базе СОД. На каждом этапе строительства нужны дополнительные продукты, в том числе САПР, ТИМ. Рассматривается опыт интеграции систем российского производства для задач информационного моделирования объектов транспортной инфраструктуры и дорожного строительства. В рамках работы выполнена интеграция СОД Vitro-CAD и программного комплекса «Топоматик Robur». Осуществлена организация коллективной работы участников проекта строительства в едином информационном пространстве. Установлена эффективность работы участников проекта за счет освобождения от рутинных операций. Опыт интеграции показал, что связка СОД Vitro-CAD и «Топоматик Robur» позволяет эффективно управлять данными проекта, хранить файлы с возможностью отслеживания версий, согласовывать документацию и выдавать замечания.
Ключевые слова: среда общих данных, информационное пространство, информационная модель, цифровая экосистема, система автоматизированного проектирования, технология информационного моделирования, автоматизация, интеграция, импортозамещение, программный комплекс
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
При оценке работ студентов особенно актуальным становится анализ текстовых работы, в частности анализ программного кода. В статье рассмотрен подход для оценки динамики изменения признаков программного кода студентов. Проанализированы различные метрики программного кода и выделены ключевые: количественные, метрики сложности потока управления программы, индикатор качества TIOBE. Для определения порогового значения по каждой из метрик и их категоризации использован набор текстовых данных с исходными кодами программ, размещённых на сайте, посвящённому практическому программированию. Полученные результаты были использованы для проведения анализа программных кодов студентов с помощью разработанного сервиса, позволяющего оценить работы по ключевым признакам, увидеть динамику изменения показателей программного кода, понять положение студента в группе с точки зрения полученных значений.
Ключевые слова: машинное обучение, анализ текстовых данных, анализ программного кода, цифровой след, визуализация данных
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Данная статья рассматривает два из наиболее применимых алгоритмов построения дерева доминаторов в контексте статического анализа кода на языке программирования Solidity. Оба алгоритма: итеративный алгоритм Cooper, Harvey, Kennedy и алгоритм Lengauer-Tarjan считаются эффективными и широко используются на практике. В статье производится сравнение алгоритмов, оценка их сложности и выбор наиболее предпочтительного в контексте данного языка. Для сравнения были использованы критерии, такие как время выполнения и использование памяти. Итеративный алгоритм Cooper, Harvey, Kennedy показал более высокую производительность при работе с небольшими проектами, в то время как алгоритм Lengauer-Tarjan лучше справился с анализом более крупных проектов. Однако, в целом, итеративный алгоритм Cooper, Harvey, Kennedy оказался более предпочтительным в контексте Solidity, так как он показал более высокую эффективность и точность при анализе смарт-контрактов на данном языке программирования. В заключение, данная статья может быть полезна для разработчиков и исследователей, которые занимаются статическим анализом кода на языке Solidity, и которые могут использовать результаты и выводы данного исследования в своей работе.
Ключевые слова: дерево доминаторов, Solidity, сравнение алгоритмов
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В данной статье исследуются вероятностные характеристики замкнутых систем массового обслуживания с ожиданием и входящим потоком «терпеливых» и «нетерпеливых» требований. Уникальность работы заключается в анализе системы с трехкомпонентной структурой входящего потока требований, что позволяет провести более детальный анализ динамики обслуживания и поведения заявок в условиях ограничений на время ожидания. Выведены основные аналитические выражения для определения вероятностных характеристик, а также для определения основных показателей эффективности работы системы. Результаты работы представляют интерес как для теоретического изучения систем массового обслуживания, так и для практического применения в области оптимизации управления потоками заявок.
Ключевые слова: ожидание, очередь, обслуживание, марковский процесс, система массового обслуживания с ограничениями, поток заявок, имитационное моделирование, математическая модель
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Разливы нефтепродуктов требуют своевременных мероприятий по устранению причин возникновения и нейтрализации последствий. Для выработки конкретных технологических решений в целях ликвидации разливов нефтепродуктов перспективно применение ситуационного подхода. Важным становится структурировать описание возможных ситуаций и формирование представления решений. В данной работе представляются результаты выполнения этих задач. Предложена структура для представления ситуаций при разливах нефтепродуктов на основе дерева ситуаций, дается описание алгоритма ситуационного вывода решений с использованием этой структуры, предлагаются параметры описания ситуаций при разливах нефтепродуктов и представление решений. Дерево ситуаций позволяет сформировать представление ситуаций на основе анализа различной исходной информации. Этот подход дает возможность в оперативном режиме уточнить параметры и подобрать схожие ситуации из базы знаний, решения которых может быть использовано в сложившейся нежелательной ситуации.
Ключевые слова: принятие решений, ситуационный метод, case-based reasoning, ликвидация разлива нефти, разлив нефтепродуктов, поддержка принятия решений, дерево ситуаций
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В статье рассматривается возможность моделирования алгоритма машинного обучения «случайный лес» с применением математического аппарата теории сетей Петри. Предложенный подход базируется на использовании трех видов расширений сетей Петри: классического, цветных сетей, а также вложенных сетей. Для этого в работе рассматривается общая структура деревьев решений и правила построения моделей на основе двудольного направленного графа с последующим переходом на алгоритм машинного обучения «случайный лес». В статье приведены примеры моделирования данного алгоритма сетями Петри с формированием дерева достижимых маркировок, которое соответствует работе как деревьев решений, так и «случайному лесу».
Ключевые слова: сеть Петри, дерево решений, случайный лес, машинное обучение, теория сетей Петри, двудольный направленный граф, интеллектуальные системы, эволюционные алгоритмы, системы поддержки принятия решений, математическое моделирование, теория графов
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Многие современные системы обработки информации и управления для различных областей базируются на программно-аппаратных средствах обработки и анализа изображений. При этом часто необходимо обеспечить хранение и передачу больших наборов данных, в том числе коллекций изображений. Для уменьшения объема требуемой памяти и увеличения скорости передачи информации применяются технологии сжатия данных. К настоящему времени разработаны и применяются подходы, основанные на использовании дискретных вейвлет-преобразований. Достоинством данных преобразований является возможность локализовать точки изменения яркости на изображениях. Соответствующие таким точкам детализирующие коэффициенты вносят значимый вклад в энергию изображения. Этот вклад можно оценить количественно в виде весов, анализ которых позволяет определить способ квантования коэффициентов вейвлет-преобразования в предложенном методе сжатия с потерями. Описанный в статье подход соответствует общей схеме сжатия изображений и предусматривает этапы преобразования, квантования и кодирования. Он обеспечивает хорошие показатели сжатия и может быть использован в системах обработки информации и управления.
Ключевые слова: обработка изображений, сжатие изображений, избыточность в изображениях, общая схема сжатия изображений, вейвлет-преобразование, сжатие на основе вейвлет-преобразования, весовая модель, значимость детализирующих коэффициентов, квантование
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Работа посвящена разработке и анализу алгоритмов компьютерного зрения, предназначенных для распознавания объектов в условиях ограниченной видимости, таких как туман, дождь или недостаточное освещение. В условиях современных требований к безопасности и автоматизации, задача идентификации объектов становится особенно актуальной. Рассмотрены теоретические основы методов компьютерного зрения и их применения в сложных условиях. Проведен анализ алгоритмов обработки изображений, включая методы машинного обучения и глубокого обучения, которые адаптированы для работы в условиях плохой видимости. Представлены результаты экспериментов, демонстрирующие эффективность предложенных подходов, а также сравнение с существующими системами распознавания. Результаты исследования могут быть полезны при разработке автономных транспортных средств и систем видеонаблюдения.
Ключевые слова: компьютерное зрение, математическое моделирование, программный комплекс, методы машинного обучения, автономные транспортные системы
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В системах мониторинга, диагностики и распознавания состояния важным аспектом является уменьшение объема данных измеренных сигналов для их передачи или накопления в информационных базах с возможностью восстановления без существенных искажений. Особым видом сигналов при этом являются пакетные сигналы, которые представляют наборы гармоник с кратными частотами и с четко выделяемым периодом. Подобного вида сигналы характерны для механических, электромагнитных, электромеханических систем. Рассматривается ряд моделей редукции, в частности: модель дискретного преобразования Фурье с модифицированной формулой восстановления непрерывного сигнала, модель на основе разложения по окаймляющим функциям и модель дискретного косинусного преобразования. Сопоставление моделей осуществляется по вычислительной сложности, степени редукции, погрешности восстановления. Выявлены особенности и случаи эффективного применения каждой из моделей для пакетных сигналов.
Ключевые слова: модель редукции, измеренный пакетный сигнал, дискретное косинусное преобразование, разложение по окаймляющим функциям, оценка качества редукции
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Представлен метод характеризации закона распределения свойством максимума энтропии, предназначенный для моделирования определяющего параметра (случайной величины) сложных технических систем с метрологическим обеспечением. В отличие от классического метода характеризации предлагаемый метод основан на использовании неравенств Чебышева вместо ограничений на статистические моменты. Описан алгоритм построения функции распределения определяющего параметра. Дается сравнение результатов построения законов распределения с использованием разработанного метода и с использованием классического вариационного исчисления.
Ключевые слова: полумарковская модель, средство измерений, поверка, оперативный автоматизированный контроль состояния
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.5 - Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей
При оперативной диагностике и распознавании состояний сложных технических систем важной является задача выявления малых детерминированных во времени изменений сложных измеряемых диагностических сигналов контролируемого объекта. Для этих целей сигнал преобразуют в малоразмерный образ в диагностическом признаковом пространстве, перемещающийся по разным по форме траекториям, в зависимости от характера и величины изменений. Были обнаружены аналитические функциональные зависимости, связывающие конкретный вид изменения сигнала с формой траектории движения образа в признаковом пространстве. Предложенный траекторный подход упрощает идентификацию, оперативную диагностику и мониторинг состояния объектов, в частности, при низкочастотной диагностике и дефектоскопии конструкций, вибродиагностике, контроле напряженного состояния объекта по анализу временных характеристик функций отклика на воздействие и т.п.
Ключевые слова: моделирование, траектории движения образов, функциональные зависимости, малозаметные изменения сложных сигналов, аналитическое описание траекторий
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В статье решается задача автоматизированного формирования пользовательских ролей с применением методов машинного обучения. Для решения задачи используются методы кластерного анализа данных, реализованные на языке Python в среде разработки Google Colab. На основе полученных результатов разработана и апробирована методика формирования пользовательских ролей, позволяющая сократить время формирования ролевой модели управления доступом.
Ключевые слова: машинное обучение, ролевая модель управления доступом, кластеризация, метод k-средних, иерархическая кластеризация, метод DBSCAN
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.6 - Методы и системы защиты информации, информационная безопасность
С целью оптимизации работы пылеосадительных камер систем очистки выбросов сталеплавильных печей и повышения общей эффективности работы системы очистки исследовано движение газовоздушных потоков и частиц пыли разного диаметра внутри пылеулавливающих камер с помощью программного продукта SolidWorks с приложением FlowSimulation,что позволило исследовать влияние целого ряда факторов, например, фракционного состава,состояния рабочих поверхностей камер, на движение газовоздушного потока.
Ключевые слова: сталеплавильная печь, газовоздушный поток, пылеосадительная камера, эффективность очистки, пыль, дисперный состав, моделирование
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.1.10 - Экологическая безопасность строительства и городского хозяйства