Диссертация - Информационно—статистический анализ нуклеотидных последовательностей
Содержание
ОГЛАВЛЕНИЕ
стр.
Введение 5
Глава 1. Обзор основных проблем биоинформатики и анализа 13 символьных последовательностей
§1.1. Основные задачи в исследованиях символьных последовательностей 13
§ 1.2. Проблема аннотирования геномов 15
§1.3. Модели генетических текстов 17
§ 1.4. Построение словарей генетических текстов 20
§ 1.5. Распознавание структурных закономерностей в генетических текстах 22
§ 1.6. Методы сравнения генетических текстов 27
§1.7. Информация и энтропия 32
§1.8. Выводы Главы 1 37
Глава 2. Частотный словарь. Случай глобального восстановления. 38
§ 2.1. Соотношение "последовательность - конечно-частотный словарь" и 38
проблема восстановления целого из частей
§ 2.2. Конечно-частотный словарь и проблема восстановления полной 39
последовательности
§ 2.3. Характеристики конечно-частотных словарей для реальных 41
нуклеотидных последовательностей
§ 2.4. Изменение избыточности генов в результате сплайсинга 52
§ 2.5. О распределении наидлиннейших повторов в различных участках 76
последовательности
§ 2.6. О распределении наидлиннейших повторов в геномах некоторых 85
организмов
§ 2.7. Выводы Главы 2 97
Глава 3. Частотный словарь. Случай локального восстановления 98
§ 3.1. Задача локального восстановления. Гипотеза наиболее вероятного 98
продолжения
§ 3.2. Принцип максимума энтропии частотного словаря и восстановление 99
-3-
частотных словарей большей толщины по заданному § 3.3. Локальное востановление частотных словарей и проблема выбора 102
статистической модели генетического текста
§3.4. Информационное содержание частотных словарей 105
§ 3.5. Предельная энтропия, удельная энтропия и качество восстановления 112
частотных словарей §3.6. Качество восстановления для некоторых реальных символьных 116
последовательностей § 3.7. Отличия реальных и восстановленных частотных словарей некоторых 119
генетических текстов § 3.8. Сравнительное исследование информационных свойств генов 139
вирусов и генов их хозяев
§3.9. Информационная ёмкость некоторых геномов 164
§ 3.10. Микроинформационная структура генов и геномов 169
§ 3.11. Самоподобие геномов . . 199
§3.12. Выводы Главы 3 225
Глава 4. Распределение информационно значимых слов в геномах 227
§4.1. Поиск и выделение информационно значимых сайтов в символьных 228
последовательностях •
§ 4.2. Поиск и выделение информационно значимых сайтов в некоторых 231
биологических последовательностях
§4.3. Поиск и выделение информационно значимых сайтов в геномах 239
§ 4.4. Информационно значимые сайты функционально различных частей в 255
геномах § 4.5. Связь между информационно значимыми сайтами различной длины в 258
геномах § 4.6. О связи структуры и функции в геномах: статистическая семантика 274
геномов § 4.7. Выводы Главы 4 278
-4-
Глава 5. Информационные и статистические подходы к определению 280
близости символьных последовательностей
§5.1. Сравнение символьных последовательностей по носителям их 282
конечно-частотных словарей § 5.2. Сравнение генетических текстов по носителям их конечно-частотных 287
словарей § 5.3. Сравнение символьных последовательностей по их конечно- 290
частотным словарям § 5.4. Сравнение нескольких символьных последовательностей с помощью 292
их конечно-частотных словарей § 5.5. Сравнение символьных последовательностей по их 294
частотным словарям
§5.6. Сравнение генетических текстов по их частотным словарям 302
§ 5.7. Сравнение геномов по наборам их информационно значимых слов 350
§ 5.8. Сравнение функционально различных частей генома по наборам их 362
информационно значимых слов § 5.9. Выводы Главы 5 369
Заключение 371
Выводы 377
Список литературы . . 380