Детерминированная идентификация буквенных биграмм в русскоязычном тексте
Ключевые слова:
идентификация, символ, биграмма, русский язык, простая заменаАннотация
В статье рассмотрена задача идентификации символов текстов на естественном языке по числовым характеристикам этих текстов. На основе правил языка и частот биграмм предложено решение данной задачи для русских текстов. Решение представляет собой систему идентифицирующих функций для каждого символа алфавита и детерминированную последовательность их применения. Указаны ограничения для полученного решения, область его эффективного применения и возможности расширения.Литература
1. Шеннон К. Теория связи в секретных системах // Работы по теории информации и кибернетике. М.:ИЛ. 1963. С. 333‒369.
2. Бабенко Л.К., Ищукова Е.А. Анализ симметричных криптосистем // Известия ЮФУ. Технические науки. 2012. Вып. 137. №12. С. 136‒147.
3. Минеев М.П., Чубариков В.Н. Лекции по арифметическим вопросам криптографии // М.: Изд-во ≪Попечительский совет Механико-математического факультета МГУ им. М. В. Ломоносова≫. 2010. 186 с.
4. Бабаш А.В., Баранова Е.К. Криптографические методы и средства информационной безопасности // М.:РГСУ. 2010. 65 с.
5. Жданов О.Н., Куденкова И.А. Криптоанализ классических шифров // Красноярск: Изд-во Сиб. гос. аэрокосм. ун-та им. акад. М.Ф. Решетнева. 2008. 107 с.
6. Морозенко В.В., Плешкова И.Ю. О применении генетического алгоритма для криптоанализа шифра Тритемия-Белазо-Виженера // Современные проблемы науки и образования: электронный научный журнал. 2014. №2. С. 1‒11.
7. Brownbridge Jason. Decrypting Substitution Ciphers with Genetic Algorithms // Department of Computer Science. University of Cape Town. 2007. 12 p.
8. Chen Jian, Rosenthal Jeffrey S. Decrypting classical cipher text using Markov Сhain Monte Carlo // Statistics and Computing. 2011. vol. 22. no. 2. pp. 397‒413.
9. Губарев В.В. Введение в теоретическую информатику // Новосибирск: Изд-во НГТУ. 2014. 420 с.
10. Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка (на материале Национального корпуса русского языка) // М.: Азбуковник. 2009. 923 с.
2. Бабенко Л.К., Ищукова Е.А. Анализ симметричных криптосистем // Известия ЮФУ. Технические науки. 2012. Вып. 137. №12. С. 136‒147.
3. Минеев М.П., Чубариков В.Н. Лекции по арифметическим вопросам криптографии // М.: Изд-во ≪Попечительский совет Механико-математического факультета МГУ им. М. В. Ломоносова≫. 2010. 186 с.
4. Бабаш А.В., Баранова Е.К. Криптографические методы и средства информационной безопасности // М.:РГСУ. 2010. 65 с.
5. Жданов О.Н., Куденкова И.А. Криптоанализ классических шифров // Красноярск: Изд-во Сиб. гос. аэрокосм. ун-та им. акад. М.Ф. Решетнева. 2008. 107 с.
6. Морозенко В.В., Плешкова И.Ю. О применении генетического алгоритма для криптоанализа шифра Тритемия-Белазо-Виженера // Современные проблемы науки и образования: электронный научный журнал. 2014. №2. С. 1‒11.
7. Brownbridge Jason. Decrypting Substitution Ciphers with Genetic Algorithms // Department of Computer Science. University of Cape Town. 2007. 12 p.
8. Chen Jian, Rosenthal Jeffrey S. Decrypting classical cipher text using Markov Сhain Monte Carlo // Statistics and Computing. 2011. vol. 22. no. 2. pp. 397‒413.
9. Губарев В.В. Введение в теоретическую информатику // Новосибирск: Изд-во НГТУ. 2014. 420 с.
10. Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка (на материале Национального корпуса русского языка) // М.: Азбуковник. 2009. 923 с.
Опубликован
2016-02-15
Как цитировать
Котов, Ю. А. (2016). Детерминированная идентификация буквенных биграмм в русскоязычном тексте. Труды СПИИРАН, 1(44), 181-197. https://doi.org/10.15622/sp.44.11
Раздел
Теоретическая и прикладная математика
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).