Найти | Информатика и автоматизация

Поиск статей:

Расширенные фильтры

Опубликовано после

Опубликовано до

По автору

Сергей Николаевич Карпович

2016-08-01

Многозначная классификация текстовых документов с использованием вероятностного тематического моделирования ml-PLSI

92-104

В работе рассмотрен подход к многозначной классификации текстовых документов на основе вероятностного тематического моделирования. На базе корпуса SCTM-ru построена тематическая модель методом обучения с учителем, приведен алгоритм многозначной классификации. Описан состав программного прототипа, реализующего предложенный подход.

Сергей Николаевич Карпович

2015-04-16

Русскоязычный корпус текстов SCTM-ru для построения тематических моделей

123-142

В статье рассматривается задача создания русскоязычного специального корпуса текстов для тестирования алгоритмов вероятностного тематического моделирования. В качестве наполнения корпуса предлагается использовать статьи международного новостного сайта «Русские Викиновости», распространяемого по свободной лицензии CC BY 2.5. Описан этап предварительной обработки и разметки корпуса текстов. Предложена разметка корпуса текстов, содержащая только необходимую в алгоритмах тематического моделирования информацию.

1 - 2 из 2 результатов

Поиск статей

Импакт-фактор

Разделы

Мы в сети

Обратная связь