Машинное обучение и анализ данных
http://jmlda.org/papers/index.php/JMLDA
<p><strong>Электронная система подачи статей в журнал</strong></p><p><a href="/ru/journal">Новости, текущий номер журнала, архив статей</a></p><p><a href="/papers/index.php/JMLDA/information/authors">Руководство для авторов</a></p><p><a href="/papers/index.php/JMLDA/about/editorialPolicies#peerReviewProcess">Процесс рецензирования</a></p><p><a href="/papers/doc/jmlda-guides.zip">Правила оформления и шаблон статьи</a></p><p> </p><p>Журнал публикует новые теоретические и обзорные статьи с результатами научных исследований в области информатики и приложений.</p><p><strong>Тематика журнала: </strong></p> <ul><li>классификация, кластеризация, регрессионный анализ,</li><li>многомерный статистический анализ,</li><li>байесовские методы регрессии и классификации,</li><li>выбор моделей и сложность,</li><li><span>глубокое обучение</span>,</li><li>статистическая теория обучения,</li><li>методы прогнозирования временных рядов,</li><li>методы обработки и распознавания сигналов,</li><li>методы оптимизации в задачах машинного обучения и анализа данных,</li><li><span>методы анализа больших данных,</span></li><li>методы визуализации данных,</li><li>обработка и распознавание речи и изображений,</li><li>анализ и понимание текста, информационный поиск,</li><li>прикладные задачи анализа данных.</li></ul><p>ISSN 2223-3792, <a href="http://elibrary.ru/title_about.asp?id=32828">РИНЦ</a></p><p>Журнал зарегистрирован в системе Crossref, doi 10.21469/22233792.</p>ru-RUМашинное обучение и анализ данныхЯ, автор рукописи, от своего лица и от лица соавторов передаю учредителям и редколлегии журнала "Машинное обучение и анализ данных" неисключительное право опубликовать данную рукопись статьи в электронной версии журнала. Я подтверждаю, что данная публикация не нарушает авторского права других лиц или организаций.Неявная модель вариативности произношения для автоматического распознавания речи
http://jmlda.org/papers/index.php/JMLDA/article/view/268
<p>Вариативность произношения слов и словосочетаний<br />в естественной разговорной речи является одним из основных источников<br />ошибок при автоматическом распознавании речи. <br />Поэтому использование моделей вариативности произношения представляется важным направлением повышения эффективности работы систем распознавания речи. В докладе рассматривается проблема моделирования вариативности, которая вызвана нечеткой, неполной артикуляцией, например, в результате нарушения синхронизации работы органов речеобразования. Предлагается использовать неявные произносительные модели, основанные на комбинировании акустических моделей соседних звуков. Комбинирование может заключаться в сглаживании или интерполяции параметров акустических моделей текущих звуков параметрами соседних моделей. Cтепень проявления вариативности, вообще говоря, зависит от синтаксического и просодического контекста звука, поэтому предлагается использовать меняющиеся параметры интерполяции в зависимости от наличия позиционных, фонетических, синтаксических и просодических признаков.<br />Подход с комбинированием акустических моделей на основе сглаживания их <br />параметров был описан в научной литературе, однако <br />автору неизвестны исследования с комбинированием именно соседних<br />акустических моделей и где бы параметры комбинирования зависели <br />от текущих контекстных признаков. Предварительные эксперименты на корпусах с читаемой и разговорной речью показали справедливость предположений о целесообразности использования<br />интерполяционных моделей и существования зависимости параметров <br />сглаживания моделей от наличия позиционных и синтаксических признаков.</p>Владимир Яковлевич Чучупал
(c) 2017 Машинное обучение и анализ данных
2017-02-022017-02-022410.21469/jmlda.v2i4.268Реализация пакета программ для встраивания и извлечения скрытых сообщений в аудиофайлах
http://jmlda.org/papers/index.php/JMLDA/article/view/280
<p>В работе представлены результаты разработки пакета программ для встраивания, извлечения, обнаружения и прочтения сообщений в аудиофайлах.</p><p>Методология работы и программная реализация относятся к стеганографии - одному из основных направлений защиты информации. Стегоконтейнер представляет собой аудиофайл, получаемый в результате модификации контейнера последовательностью бит сообщения. Контейнер и стегоконтейнер представляют собой последовательности отсчетов импульсно-кодовой модуляции (ИКМ), а встраивание осуществляется простым суммированием отсчетов контейнера с отсчетами сигнала сообщения. Сигнал сообщения модулируется методом двоичной дискретной частотной манипуляции, а контейнер перед встраиванием подвергается режекторной фильтрации.</p>И методология, и пакет программ являются основой построения стеганографических систем со скачками по частоте (СЧ) и с вариацией просодических параметров речи.Aleksei Vladimirovich Gorbunov
(c) 2017 Машинное обучение и анализ данных
2017-02-022017-02-022410.21469/jmlda.v2i4.280Сопоставление и интеграция подходов к дешифровке древнерусских знаменных песнопений
http://jmlda.org/papers/index.php/JMLDA/article/view/285
<p>Рассматриваются наиболее перспективные, по мнению авторов, <br /> подходы к проблеме нотолинейной реконструкции (дешифровки) древнерусских церковных песнопений XVII века и выше, <br /> представленных в знаменной форме записи. <br /> Предпочтение отдаётся предложенному авторами подходу, основанному на использовании внутригласовых инвариантов --- <br /> цепочек знамен, интерпретация которых характеризуется минимальным уровнем неоднозначности. <br /> Приводятся оценки эффективности разных подходов. <br /> Исследуется возможность их интеграции.</p>Титкова Татьяна НиколаевнаБахмутова Ирина ВладимировнаГусев Владимир ДмитриевичМирошниченко Любовь Александровна
(c) 2017 Машинное обучение и анализ данных
2017-02-022017-02-022410.21469/jmlda.v2i4.285Вероятностная модель для сглаживания целевых метрик качества ранжирования
http://jmlda.org/papers/index.php/JMLDA/article/view/292
<p>Задача информационного поиска - находить релевантные документы по запросу пользователя.<br />Одной из важнейших задач информационного поиска является задача ранжирования результатов поиска.<br />В настоящее время широко распространен подход получения функции релевантности с помощью методов машинного обучения на основе обучающей выборки.<br />Для оценки качества принято использовать метрики качества, например, pFound.<br />Однако, большинство из них являются дискретными, что усложняет, например, отбор признаков.</p><p>Цель данной работы - получить гладкий аналог дискретной метрики.<br />В работе рассматривается несколько вариантов определения гладкой метрики, лучший из которых экспериментально определяется по критериям гладкости и похожести на дискретную метрику.<br />Критерий похожести, в отличии от критерия гладкости, численно выразить довольно трудно ввиду большого множества различных случаев поведения метрик, поэтому от численного описания пришлось отказаться.<br />По результатам многочисленных экспериментов была найдена оптимальная модель гладкой метрики в соответствии с нашими требованиями.</p>Никита ВолковМаксим Жуковский
(c) 2017 Машинное обучение и анализ данных
2017-02-022017-02-022410.21469/jmlda.v2i4.292Мультимодальная тематическая модель текстов и изображений на основе использования их векторного представления
http://jmlda.org/papers/index.php/JMLDA/article/view/294
Целью данной работы является создание мультимодальной тематической модели для изображений и текстов. Предложен подход к построению такой модели на основе векторного представления текстов и изображений. Векторы значимых слов строятся за счет применения Word2Vec, для изображений~--- как выход последнего неполносвязного слоя сверточной нейронной сети. Предложены алгоритм обучения тематической модели по коллекции аннотированных изображений, а также алгоритмы аннотирования нового изображения и иллюстрирования нового текста. Эксперменты показали, что предложенная модель превосходит аналоги в задаче аннотирования изображений и иллюстрирования текстов.Andrey FilchenkovNikolay Smelik
(c) 2017 Машинное обучение и анализ данных
2017-02-022017-02-022410.21469/jmlda.v2i4.294Eyelid Position Detection Method for Mobile Iris Recognition
http://jmlda.org/papers/index.php/JMLDA/article/view/288
Information about eyelid position in an image is used during iris recognition the for eyelid<br />and eyelash noise removal, iris image quality estimation and other purposes. Eyelid detection<br />is usually performed after iris-sclera boundary localization which is a fairly complex operation<br />itself. If the authentication is working on a hand-held device, this order is not always justified,<br />mainly because of the device limited performance, user interaction difficulties and highly vari-<br />able environmental conditions. In this case the eyelid position information could be used to<br />determine whether the image should be passed for the further complex processing operations.This paper proposes a method of eyelid position detection for iris image quality estimation and further complete eyelid border localization and compares its performance with several similar existing methods on four open datasets.Gleb OdinokikhMikhail KorobkinVitaly GnatyukVladimir Eremeev
(c) 2016 Машинное обучение и анализ данных
2017-02-022017-02-022410.21469/jmlda.v2i3.288The choice of decisions at recognition of emotions on the speech
http://jmlda.org/papers/index.php/JMLDA/article/view/296
<p>In work experience of the choice of decisions in system of recognition of an emotional condition of the person on the speech concerning truthfulness and sincerity of speaking is described. Informational content of measuring base of recognition on the basis of paralinguistic, articulation and extralinguistic features of the speech taking into account individual emotional and semantic connotations of the examinee is analyzed, algorithms of recognition of emotions according to the speech are described, the choice from a set of decisions and their verification concerning sincerity and truthfulness speaking taking into account a situational context is carried out.</p><p>The analysis of emotional manifestations with their emotional and semantic connotations without correlation with the reconstructed picture of incident and a situation of inquiry shows ambiguity of these connotations that can lead to essential errors of recognition.</p><p>It is offered the strategy of the choice of solutions of recognition of an emotional condition of the person on the speech in the related system of temporal and acoustic, emotional and semantic and situational dependences. At the real approach verification of meanings of emotional speech reactions becomes possible thanks to comparison to a situational context.</p><p>Work is supported by Russian Federal Property Fund \No grant \, 11-01-00900.</p>Victor P. Kalyan
(c) 2017 Машинное обучение и анализ данных
2017-02-062017-02-062410.21469/jmlda.v2i4.296