орой соответствует расстоянию между дубликатами в серии ("сдвигу'' в серии) -- см. рис. 7. (Особенно ярко такие полки выделяются на графиках среднего возраста старого имени. Ниже мы приведем некоторые примеры.) Если список имен Х содержит не ОДНУ, а НЕСКОЛЬКО серий дублирующих друг друга глав, на графике среднего возраста имен возникают полки РАЗЛИЧНОГО УРОВНЯ. По высоте этих полок можно судить о сдвигах между дубликатами в списке. 3. 5. МЕТОД ОБНАРУЖЕНИЯ ДУБЛИКАТОВ В ХРОНОЛОГИЧЕСКОМ СПИСКЕ ИМЕН В том случае, если для рассматриваемого списка Х графики среднего возраста имени и среднего возраста старого имени распадаются на серию ``полок'', будем говорить, что в списке имен Х содержатся СТАТИСТИЧЕСКИЕ ДУБЛИКАТЫ. Их можно явно указать, пользуясь тем, что величины среднего возраста старых имен в главах списка позволяют найти (приблизительно) расстояния до прежде появившихся дубликатов этих глав. Качественное изучение графика среднего возраста в хронологических списках имен позволяет также определить места скрытой ``сшивки'' (места стыков) хроник в дошедших до нас хронологических компиляциях (``современном учебнике'' по истории). Отметим, что в современном ``гладком'' изложении места этих сшивок (стыков) УЖЕ НЕ ВИДНЫ -- над ним поработало несколько поколений историков. Однако часто оказывается, что в местах таких сшивок процесс возраста имен (старых имен) скачком меняет свои параметры. Это СКАЧКООБРАЗНОЕ изменение легко улавливается даже ``на глаз'', при качественном анализе графиков среднего возраста (см. примеры ниже). 3. 6. ВОЗРАСТ ИМЕН В БИБЛИИ 3. 6. 1. ГРАФИК СРЕДНЕГО ВОЗРАСТА ИМЕН В БИБЛИИ ПРИМЕР 7. График среднего возраста имен В СПИСКЕ ИМЕН БИБЛИИ (собственные имена в Библии). График показан на рис. 8-а. По горизонтальной оси отложены номера глав-поколений, а также отмечены дубликаты серии Т, обнаруженные А. Т. Фоменко в [6, 18]. (В предыдущих публикациях эти дубликаты обозначались МТ). График СРЕДНЕГО ВОЗРАСТА СТАРОГО ИМЕНИ В СПИСКЕ ИМЕН БИБЛИИ полностью аналогичен графику СРЕДНЕГО ВОЗРАСТА ИМЕН в нем. На рис. 8б приведен график СРЕДНЕГО ВОЗРАСТА СТАРОГО ИМЕНИ в списке имен Библии, усредненный по текущему отрезку длины 4 (то есть в каждой точке i значение функции f(i) заменено на среднее [f(i)+f(i+1)+f(i+2)+f(i+3)]/4 ). Хорошо видно, что график распадается НА СЕРИЮ ПОЛОК, причем дубликаты Т-серии как правило попадают на границы между полками. Это прекрасно согласуется с результатами А. Т. Фоменко [18], согласно которым короткие дубликаты Т-серии разделяют в современном учебнике (который, кстати, очень сильно зависит от Библии) дублирующие друг друга длинные хроники. 3. 6. 2. ПРОВЕРКА МЕТОДА НА ХОРОШО ИЗВЕСТНЫХ ДУБЛИКАТАХ В БИБЛИИ Укажем например, как проявляется на рис. 8 ХОРОШО ИЗВЕСТНАЯ серия дубликатов в Библии: I-IV кн. Царств и I-II кн. Паралипоменон. Этим частям Библии соответствуют главы-поколения с номерами 98-137 (для I-IV Царств) и 138-167 (для I-II Паралипоменон). На рис. 8 соответствующие отрезки списка имен четко выделены полками на графике, разность уровней которых равняется величине сдвига между указанными дубликатами (он равен приблизительно 35 главам). Точно так же, рис. 8 показывает, что последовательность глав-поколений с номерами 169-195 (книги Пророков) является статистическим дубликатом: частично -- глав 99-113 (I-III Царств), а частично -- глав 79-97 (кн. Судей). Это -- ТОЖЕ ИЗВЕСТНЫЙ РЕЗУЛЬТАТ: в книгах Пророков описываются события одновременные с теми, что описаны в библейской хронике I-IV Царств или же в книге Судей. 3. 6. 3. НЕОЖИДАННОЕ ОТКРЫТИЕ РАНЕЕ НЕИЗВЕСТНЫХ ДУБЛИКАТОВ В БИБЛИИ НЕОЖИДАННЫМ с точки зрения ``современного учебника истории'' является ярко выраженный ``шов'' (разладка процесса) в начале книги IV Царств, а также статистическое наложение на хронику I-III Царств глав-поколений с номерами 74-91 (IV Царств, начиная с глав, посвященных пророку Елисею) и глав-поколений с номерами 196-218 (Новый Завет). Согласно этим наложениям, ВСЕ СОБЫТИЯ, описанные в Библии начиная с книг Царств, как в Ветхом, так и в Новом Заветах, находятся В ТЕХ ЖЕ ВРЕМЕННЫХ ГРАНИЦАХ, что и события книг I-IV (или даже I-III) Царств. Другими словами, КНИГИ I-IV ЦАРСТВ ОХВАТЫВАЮТ ВСЮ БИБЛЕЙСКУЮ ИСТОРИЧЕСКУЮ ЭПОХУ (НО, РАЗУМЕЕТСЯ, НЕ ВСЕ СОБЫТИЯ, ОПИСАННЫЕ В БИБЛИИ), А НЕ МАЛУЮ ЧАСТЬ ЕЕ, КАК ЭТО ПРИНЯТО СЧИТАТЬ СЕГОДНЯ. Этот результат ИДЕАЛЬНО согласуется с результатами А. Т. Фоменко, полученными совсем другими методами [18]. 3. 6. 4. БИБЛЕЙСКАЯ ИСТОРИЯ СПРЕССОВЫВАЕТСЯ В КОРОТКИЙ ИНТЕРВАЛ ВРЕМЕНИ На рис. 9 приведен вид квадратной матрицы {К}, построенной по списку имен Библии. Жирными точками выделены клетки матрицы, содержащие локальные максимумы в отдельных строках. Паре известных ранее дубликатов (I-IV Царств) = (I-II Паралипоменон) соответствует сплошной жирный отрезок, параллельный главной диагонали. Рис. 9 также говорит о том, что ОСНОВНАЯ МАССА БИБЛЕЙСКИХ СОБЫТИЙ ПРИ ФОРМАЛЬНОЙ ИХ ДАТИРОВКЕ ДОЛЖНА БЫТЬ ОТНЕСЕНА К ХРОНОЛОГИЧЕСКОМУ ПРОМЕЖУТКУ, ОХВАТЫВАЕМОМУ КНИГАМИ I-IV ЦАРСТВ, ПРИЧЕМ В ОСНОВНОМ -- К НАЧАЛУ И К КОНЦУ ЭТОГО ПРОМЕЖУТКА. 3. 7. ВОЗРАСТ ИМЕН В СПИСКЕ ВИЗАНТИЙСКИХ ПАТРИАРХОВ. ТРАДИЦИОННАЯ ХРОНОЛОГИЯ ЭТОГО СПИСКА НЕВЕРНА ПРИМЕР 8. Графики среднего возраста имени в списке ВП ИМЕН ВИЗАНТИЙСКИХ (КОНСТАНТИНОПОЛЬСКИХ) ПАТРИАРХОВ и в отдельных частях этого списка. См. рис. 10-а, 10-б, 10-в. На рис. 10-а представлен график среднего возраста в полном списке ВП. График сглажен по ``текущему'' отрезку длиной в 6 глав (= 60 лет). Очень хорошо выделяется скачкообразное изменение параметров процесса приблизительно в 950 г. н. э. Заметна также разладка (скачок параметров) процесса приблизительно в 1550 г. В это время создавалась всеобщая хронология и по-видимому в связи с этим возникало стремление использовать древние имена. На графике это отразилось в виде резкого массивного всплеска среднего возраста около 1550 г., который со временем постепенно стал затухать. ВЫВОД: В ``СОВРЕМЕННОМ УЧЕБНИКЕ'' ПО ИСТОРИИ ВИЗАНТИИ ГДЕ-ТО В СЕРЕДИНЕ X ВЕКА ПРОХОДИТ ``ШОВ'' (СТЫК) МЕЖДУ ДВУМЯ КРУПНЫМИ ХРОНИКАМИ-КОМПИЛЯЦИЯМИ. НАЧАЛО ПЕРВОЙ ИЗ НИХ В ``СОВРЕМЕННОМ УЧЕБНИКЕ'' ОТНЕСЕНО К НАЧАЛУ IV ВЕКА, А НАЧАЛО ВТОРОЙ -- К СЕРЕДИНЕ X ВЕКА (ПРИБЛИЗИТЕЛЬНО). На рис. 10-б представлен график СРЕДНЕГО ВОЗРАСТА ИМЕНИ в урезанном списке имен КОНСТАНТИНОПОЛЬСКИХ ПАТРИАРХОВ. Была взята часть списка в хронологических границах от 980 г. до 1650 г. Заметим, что данный график не является просто частью предыдущего графика, построенного по полному списку. В самом деле, поскольку список был урезан в своем начале, то в нем изменились моменты первого появления имен, а следовательно мог измениться возраст имен в любой главе. График был сглажен аналогично предыдущему текущими средними по отрезку длины 6 (= 60 лет). График на рис. 10-б содержит две полки: одну на интервале времени 1000-1250 гг., а другую -- на интервале 1300-1550 гг. (временные границы приблизительные). На первой из них значение среднего возраста составляет около 50 лет, на второй -- 100-150 лет. На стыке этих полок параметры процесса меняются скачком. ТАКИМ ОБРАЗОМ В ИСТОРИИ ВИЗАНТИИ ТАКЖЕ ОБНАРУЖИВАЕТСЯ РАЗРЫВ (СШИВКА РАЗНОРОДНЫХ ХРОНИК) ГДЕ-ТО В ПЕРВОЙ ПОЛОВИНЕ XIII ВЕКА. Это вполне естественно, поскольку в 1204-1261 гг., после завоевания в 1204 г. Константинополя крестоносцами, столица империи находилась в Никее (не в Константинополе), а вся обстановка в империи резко изменилась. Рис. 10-б показывает, что последующими компиляторами были ``сшиты'' две крупные хроники -- одну из них они отнесли к до-никейской эпохе, другую -- к никейской и последующей эпохам. Еще одна ``сшивка'' на этом графике, так же как и на предыдущем, указывает на время составления окончательной хронологической версии европейской истории (эта версия оформилась около 1550 г.). Наконец, на рис. 10-в представлен график среднего возраста имен в части списка ВП, относящейся к 1250-1800 гг. В этой части списка наша методика никаких дубликатов не обнаруживает. График имеет теоретический вид, характерный для правильных списков имен. 3. 8. ВОЗРАСТ ИМЕН В СПИСКЕ ЗАПАДНО-РИМСКИХ ИМПЕРАТОРОВ. ТРАДИЦИОННАЯ ХРОНОЛОГИЯ ЭТОГО СПИСКА НЕВЕРНА ПРИМЕР 9. График среднего возраста в списке имен императоров Западной Римской империи, разбитом на главы по 40 лет. См. рис 11. Список имен римских императоров имеет два пробела -- периоды античной и средневековой римских республик. В тех главах списка, которые папали в эти периоды, нет имен императоров -- эти главы пустые. На рис. 11 изображен также график среднеквадратичного отклонения возраста старых имен в главе. Это отклонение подсчитывалось по формуле: -------------- З Д - / \ВS\А (s -- s) v = i / ------------ / k Д s где суммирование производится по возрастам s всех старых имен i - данной главы. Через s обозначен средний возраст старых имен, а через k -- число старых имен в данной главе. s График среднего возраста старого имени в списке имен римских императоров содержит ХОРОШО ЗАМЕТНУЮ ``ПОЛКУ'' на 900-летнем промежутке времени 750-1650 гг. Высота этой полки колеблется около значений 800-1000 лет и соответствует основным сдвигам в 780 и 1050 лет в истории Европы (см. разложение Глобальной Хронологической Карты в [18]). На этой полке выделяется область пологого монотонного спада графика на 250-летнем временном промежутке 1000-1250 гг. В этой области график среднего возраста ведет себя существенно более регулярно, чем в остальных частях ``полки''. Монотонный спад среднего возраста часто является признаком ``оригинала'', ``дубликат'' которого , помещен на хронологической шкале раньше своего оригинала и существенно растянут во времени по сравнению с ним. Из-за такого растяжения имена дубликата ``догоняют'' имена оригинала, в результате чего имена оригинала ``молодеют'', а средний возраст в нем монотонно падает (рис. 12). Если сместить даты промежутка 1000-1250 гг. в прошлое на соответствующие им величины среднего возраста, то получим, что дубликат этого промежутка в списке имен римских императоров ' находится во временных границах приблизительно 0-650 гг. (Геометрически это смещение является косой проекцией на ось о времени вдоль направляющей, наклоненной к этой оси на 45 -- см рис. 12.) ТАКИМ ОБРАЗОМ, ПЕРИОД 0-650 ГГ. Н. Э. В СПИСКЕ ИМЕН РИМСКИХ ИМПЕРАТОРОВ ЯВЛЯЕТСЯ РАСТЯНУТЫМ ВО ВРЕМЕНИ СТАТИСТИЧЕСКИМ ДУБЛИКАТОМ ПЕРИОДА 1000-1250 ГГ. Вывод справедлив в рамках данной модели. p3'1'4 4. МЕХАНИЗМ ВОЗНИКНОВЕНИЯ ДУБЛИКАТОВ В ИСТОРИИ. МОДЕЛЬНАЯ ЗАДАЧА С ТАСОВАНИЕМ КОЛОДЫ КАРТ 4. 1. ТАСОВАНИЕ КОЛОДЫ КАРТ Прежде, чем перейти к более сложным моделям распределения имен в больших хрониках и к методикам, основанным на этих моделях, попробуем разобраться в самом механизме возникновения дубликатов в хронологии (с формальной точки зрения). При этом, мы будем опираться на результаты А. Т. Фоменко, вскрывающие ``внутреннее строение'' принятой сегодня скалигеровской версии хронологии. В итоге, механизм возникновения дубликатов в хронологии будет смоделирован нами на простом, но весьма полезном формальном примере с ТАСОВАНИЕМ КОЛОДЫ КАРТ. Использование этого примера облегчает понимание достаточно сложных статистических моделей, рассматриваемых в главах 2 и 3. 4. 2. КАК МОГ ВОЗНИКНУТЬ СОВРЕМЕННЫЙ УЧЕБНИК ПО ИСТОРИИ. ХРОНОЛОГИЧЕСКИЕ СДВИГИ Зададимся естественным вопросом: как возник ``современный учебник'' по истории? Известно, что он является результатом длинного ряда компиляций. В процессе каждой из них историк-компилятор сопоставлял, отождествлял и ``сшивал'' имеющиеся в его распоряжении компиляции его предшественников. А также, возможно, привносил какие-то новые данные о современных ему событиях. Такая работа велась параллельно многими историками (возможно, несколькими школами историков и хронологов). Поэтому длинные хроники, описывающие один и тот же период времени могли появляться (и появлялись) сразу в нескольких, вообще говоря отличных друг от друга вариантах. Эти варианты отличались по языку, позиции автора, выбору собственных имен для обозначения персонажей и т. п. Отличия могли быть настолько сильными, что при содержательном восприятии текста уже невозможно было определить, что речь идет по сути дела об одних и тех же (или одновременных) событиях. При последующий компиляциях и согласованиях источников такие различия могли привести к значительным хронологическим ошибкам, перекосам. Исследования А. Т. Фоменко [18] показали, что на последнем этапе формирования ``современного учебника'' по истории, во время компиляций XV-XVI веков, по-видимому произошло следующее: 1) НЕСКОЛЬКО крупных хроник-компиляций, описывавших приблизительно ОДИН И ТОТ ЖЕ исторический период времени (X-XIII вв. и XIII-XVI вв.), но существенно разнящихся по своему виду (скажем, выполненных в различных историко-хронологических традициях), -- были восприняты при итоговой компиляции как РАЗЛИЧНЫЕ хроники, описывающие различные эпохи и события и были СДВИНУТЫ В ПРОШЛОЕ, создав там ``искусственное освещение'' - ОТРАЖЕНИЕ более поздних средневековых событий. 2) Эти хроники были ``сшиты'' в итоговой компиляции НЕПРАВИЛЬНО, в результате чего полученный ``современный учебник'' по истории ИСКУССТВЕННО УДЛИНИЛСЯ, РАСТЯНУЛСЯ ВО ВРЕМЕНИ (рис. 13). 3) В результате в ``современном учебнике'' появились длинные СЕРИИ ДУБЛИКАТОВ, сдвинутых друг относительно друга и иногда ``наползающих'' друг на друга. Итоговая картина получилась очень сложной и ``на глаз'', при содержательном чтении ``учебника'', она не воспринимается. Формальными методами А. Т. Фоменко обнаружено, что основные сдвиги между наиболее массивными слоями дубликатов в ``современном учебнике'' составляют приблизительно 330, 720, 1050 и 1800 лет (см. [18]). Однако в хронологии присутствует и множество других, менее значительных сдвигов, спектр которых практически покрывает весь 2000-летний отрезок числовой оси (и это очень сильно осложняет итоговую картину). Итак, ПОДРОБНАЯ структура хронологии ``современного учебника'' достаточно сложна. И усложнена она тем, что дубликаты ``наползают'' друг на друга и описание той или иной хронологической эпохи является зачастую смесью описаний сразу нескольких других, более поздних эпох. По-видимому, был какой-то момент в истории, когда средневековые хронологи впервые ``потеряли опору'' в своих представлениях о глобальной хронологии и после этого они, сами того не понимая, начали ``тасовать'', перемешивать хронологические слои, в результате чего хронология ``современного учебника'' приобрела СЛОЖНУЮ СЛОИСТУЮ СТРУКТУРУ (рис. 14). Тем не менее, В ОБЩИХ ЧЕРТАХ, структура хронологии ``современного учебника'' оказывается достаточно простой. Грубо говоря, ``СОВРЕМЕННЫЙ УЧЕБНИК'' ЯВЛЯЕТСЯ СУММОЙ НЕСКОЛЬКИХ ДЛИННЫХ ХРОНИК-ДУБЛИКАТОВ, ОПИСЫВАЮЩИХ ПРИМЕРНО ``ОДНИ И ТЕ ЖЕ'' СОБЫТИЯ. Для создания правильной хронологии, их следовало бы поместить на оси времени ``параллельно'' (то есть покрыв ими несколько раз один и тот же интервал времени). Однако, средневековые хронологи (константинопольская школа хронологов XIV века, следы деятельности которой содержатся в предисловии к известному ``Собранию святоотеческих правил'' Матфея Властаря, а впоследствии и западно-европейская хронологическая школа -- Скалигер, Петавиус и другие) ошиблись и совместили их со значительными сдвигами, искусственно растянув тем самым описываемый исторический период во времени (см. разложение ГХК [18]). 4. 3. ВОЗНИКНОВЕНИЕ НЕВЕРНОЙ ХРОНОЛОГИИ ПОХОЖЕ НА ТАСОВАНИЕ КОЛОДЫ КАРТ Итак, из-за неправильного согласования хроник при компиляции их совмещают со сдвигом, создавая при этом фиктивные исторические эпохи -- см. рис. 15. Механизм возникновения такой структуры напоминает тасование колоды карт, когда одна часть колоды с некоторым смещением ``вдвигается'' в другую (рис. 16). Пользуясь этой аналогией, мы сформулируем следующую модельную задачу о тасовании пачки одинаковых колод карт. 4. 4. МОДЕЛЬНАЯ ЗАДАЧА С НЕСКОЛЬКИМИ КОЛОДАМИ КАРТ Предположим, что вначале имелось несколько совершенно одинаковых по составу и порядку колод карт, которые затем сложили подряд в одну общую большую колоду и перетасовали ее ``блоками'' (рис. 17). ЗАДАЧА СОСТОИТ В ТОМ, ЧТОБЫ ЗНАЯ СОСТАВ И ПОРЯДОК КАРТ В ПЕРЕТАСОВАННОЙ БОЛЬШОЙ КОЛОДЕ, ВОССТАНОВИТЬ (ХОТЯ БЫ ПРИБЛИЗИТЕЛЬНО) СОСТАВ И ПОРЯДОК В ИСХОДНЫХ МАЛЫХ КОЛОДАХ. Ясно, что поскольку тасование -- это случайная процедура, то поставленная задача не может иметь однозначного (детерминированного) ответа. Оказывается, что ее можно все же попытаться решить вероятностными методами. Естественный путь к такому решению состоит в исследовании похожих друг на друга кусков (отрезков) перетасованной большой колоды. В самом деле, рассмотрим некий отрезок (кусок) большой колоды и зададимся вопросом: насколько этот кусок был искажен при тасовании? Легко понять, что чем больше найдется в перетасованной колоде кусков, ПОХОЖИХ НА ДАННЫЙ, тем с большим основанием можно утверждать, что этот отрезок колоды не изменился (или слабо изменился) при тасовании. Но отрезок большой колоды, не изменившийся при тасовании, является, очевидно, также отрезком одного из экземпляров исходной малой колоды. Накопив информацию о большом количестве таких неискаженных кусков, мы сможем восстановить структуру исходных колод ``по частям''. Это -- общая идея, которая лежит в основе методов, излагаемых ниже, в главах 2 и 3. 4. 5. КАК НАЙТИ ВЕЛИЧИНЫ ХРОНОЛОГИЧЕСКИХ СДВИГОВ Более простой задачей является определение не самой исходной структуры малых колод, а лишь ВЕЛИЧИН СДВИГОВ между этими колодами в большой колоде (рис. 17). Идея решения этой задачи состоит в следующем. Предположим, что два экземпляра исходной малой колоды сдвинуты в большой колоде на величину \ВД\А (то есть между соответствующими картами этих колод расположено приблизительно \ВД карт в большой колоде). Это означает, что в большой колоде имеется очень много одинаковых (или похожих друг на друга, если допустить возможность искажений) кусков, ``разнесенных'' в ней на величину \ВД\А (карт). И обратно, если обнаружится, что в большой колоде содержится НЕОБЫЧНО МНОГО ПОХОЖИХ ДРУГ НА ДРУГА КУСКОВ, которые разнесены друг от друга на некоторую величину \ВД\А, то это означает, что \ВД по-видимому является величиной сдвига между двумя экземплярами малых исходных колод, распределенных в большой колоде. Величины таких ``НЕОБЫЧНО ЧАСТЫХ'' разнесений можно определить исследуя частоты появления различных значений разнесения между похожими друг на друга отрезками большой колоды. Для этого строятся графики зависимости количества подобных разнесений от величины разнесения ("гистограммы частот разнесений''). В случае, когда какое-либо значение разнесения между похожими кусками в большой колоде встречается НЕОБЫЧНО ЧАСТО, такой график будет делать ``всплеск'' (резко выраженный локальный максимум) на этом значении. Простейший отрезок колоды -- это две последовательно расположенные в ней карты. (Такие карты мы в дальнейшем будем называть КАРТАМИ-СОСЕДЯМИ.) Если имеющаяся в нашем распоряжении большая колода действительно была получена с помощью описанного выше механизма ``блочного тасования'' из нескольких одинаковых малых колод, то многие из карт-соседей в ней БЫЛИ СОСЕДЯМИ И В ИСХОДНЫХ МАЛЫХ КОЛОДАХ. Конечно, в ходе тасования появятся и новые ``ложные'' пары карт-соседей. Но все же доля ``истинных'' (исходных) соседей среди всех пар карт-соседей большой колоды будет значительной. Для нас важно, что эта доля будет оказывать существенное влияние на статистический характер распределения подобных пар в большой колоде. При этом, ``ложные'' соседи создадут, естественно, некоторый ``случайный шум'', смазывающий картину распределения в колоде ``истинных'' соседей. Однако систематическую часть этого шума удается скомпенсировать, а случайная оказывается невелика в реальных примерах (см. ниже). Используя описанную модельную задачу, перейдем к неформальному описанию методик статистического анализа хронологических списков. 4. 6. МЕТОД ГИСТОГРАММ ЧАСТОТ РАЗНЕСЕНИЯ СВЯЗАННЫХ ИМЕН. ОПРЕДЕЛЯЕТ ВЕЛИЧИНЫ СДВИГОВ МЕЖДУ ДУБЛИКАТАМИ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ Здесь мы на модельном примере изложим идею и основные шаги методики. На формальном уровне она изложена в главе 2. Обозначим буквой К большую перетасованную колоду карт, описанную выше. Наша задача -- ОПРЕДЕЛИТЬ ВЕЛИЧИНЫ СДВИГОВ МЕЖДУ ЭКЗЕМПЛЯРАМИ МАЛЫХ ИСХОДНЫХ КОЛОД В К. Пусть к к -- некая пара последовательных карт в К (то есть к и 1 2 1 к -- соседи). Предположим, что к и к -- ``истинные'' соседи, то есть 2 1 2 они были соседями также и в исходных малых колодах, до тасования. Тогда пары вида к к, разбросанные по колоде К, будут отмечать в 1 2 ней положения своих малых колод (откуда они пришли). Сдедовательно, расстояния (разнесения) между такими парами будут равны сдвигам (разнесениям) между экземплярами малых колод в К. Это -- идеальная ситуация. В реальности, конечно, по экземплярам одной только пары к к в колоде К судить о сдвигах 1 2 между дубликатами (малыми колодами) в К нельзя, даже если сама пара к к -- ``истинная''. В самом деле некоторые экземпляры этой 1 2 пары могут случайным образом быть разбиты при тасовании и информация о соответствущем сдвиге в этом случае потеряется. С другой стороны, среди экземпляров пары к к могут 1 2 встретиться и ``ложные'', случайно возникшие при тасовании, и в этом случае мы зарегистрируем ложный сдвиг. Кроме того, мы заранее не знаем -- ``истиная'' ли данная пара карт-соседей в К или нет. Поэтому поступим следующим образом. Чтобы исключить потерю информации при случайном разбиении пар к к в ходе тасования, 1 2 будем рассматривать карты к и к в колоде К по отдельности. 1 2 Итак, ПОДСЧИТАЕМ РАССТОЯНИЯ МЕЖДУ ВСЕМИ ПАРАМИ КАРТ В К, ПРИ УСЛОВИИ ОДНАКО, ЧТО ХОТЯ БЫ В ОДНОМ МЕСТЕ КОЛОДЫ К ЭТИ (ТАКИЕ ЖЕ) КАРТЫ ВСЕ ЖЕ СТОЯТ РЯДОМ (ЯВЛЯЮТСЯ СОСЕДЯМИ). В чем смысл этого условия? Оно позволяет выделить такую совокупность пар карт, в которой ``истинные'' карты-соседи составляют заметную долю. В самом деле, пусть к к -- ``истинная'' 1 2 пара карт-соседей. Поскольку все исходные малые колоды были до тасования одинаковы, то эта пара существовала перед тасованием в N экземплярах (где N -- число исходных малых колод). Чтобы данная пара карт НЕ ПОПАЛА в нашу совокупность, необходимо, чтобы ВСЕ N экземпляров этой пары были разъединены при тасовании. Вероятность этого события МАЛА. С другой стороны, для ``ложной'' пары карт-соседей условием ПОПАДАНИЯ в указанную совокупность является случайная встреча этих карт при тасовании, что при неполном ``блочном'' тасовании ТАКЖЕ МАЛОВЕРОЯТНО. Таким образом, большинство ``ИСТИННЫХ'' пар карт-соседей ПОПАДУТ в нашу совокупность, а большинство ``ЛОЖНЫХ'' -- НЕ ПОПАДУТ в нее. В итоге, существенную часть этой совокупности составят ``истинные'' пары карт-соседей. Рассмотрев все пары карт, которые где-либо в К оказались соседями, и вычислив для каждой такой пары значение разнесения (то есть количество карт, разделяющих эту пару в колоде К), мы получим набор целых чисел -- значений разнесения между соседями в К. По этому набору построим график -- ГИСТОГРАММУ ЧАСТОТ РАЗНЕСЕНИЙ КАРТ-СОСЕДЕЙ следующим образом. Отложим по горизонтальной оси все возможные значения разнесений между картами в колоде К (ясно, что разнесения не могут превосходить длины К), а по вертикальной оси -- частоту, с которой данное значение встречается в наборе разнесений. По такой гистограмме легко выделяются ``необычно'' частые значения разнесений: на местах таких значений гистограмма имеет ярко выраженный локальный максимум (всплеск). Например, если гистограмма частот разнесений карт-соседей имеет вид как на рис. 18, то существует два ``необычно частых'' значения разнесений: р и р. 1 2 Если ``необычно'' частых значений разнесения между картами-соседями в колоде К нет, то соответствующая гистограмма ВООБЩЕ НЕ БУДЕТ СОДЕРЖАТЬ ВСПЛЕСКОВ (доказательство см. в главе 2). В ЭТОМ СЛУЧАЕ СЛЕДУЕТ ПРЕДПОЛОЖИТЬ, ЧТО ДУБЛИКАТОВ ОПИСАННОГО ВЫШЕ ТИПА В КОЛОДЕ К НЕТ. В противном случае, дубликаты по-видимому имеется и их следует проанализировать. Сдвиги между дубликатами (исходными колодами) в этой структуре определяются как значения, на которых гистограмма делает всплески. 4. 7. МЕТОД ПОСТРОЕНИЯ МАТРИЦ СВЯЗЕЙ. ПРЕДНАЗНАЧЕН ДЛЯ ПОИСКА ДУБЛИКАТОВ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ Здесь мы на приведенном выше модельном примере изложим лишь ОБЩУЮ ИДЕЮ методики. Метод был предложена авторами в [10, 12]. Подробно он изложена в главе 3. Анализ дубликатов (исходных малых колод) в колоде К можно осуществить на основе следующих простых соображений. Предположим, что имеющаяся в нашем распоряжении колода К была действительно получена описанным выше способом из нескольких экземпляров более короткой (исходной) колоды. Рассмотрим два отрезка А и А колоды К. Будем называть отрезки А и А 1 2 1 2 ДУБЛИКАТАМИ, если они соотвественно содержат карты, которые в экземплярах исходной колоды находились рядом (рис. 19). Заметим, что при этом может случиться, что отрезки А и А 1 2 вовсе не содержат одинаковых карт и тем не менее, являются дубликатами. Такая ситуация возникает, когда в отрезок А при 1 тасовании попали одни карты из некоторого малого отрезка А исходной колоды, а в отрезок А -- другие карты из того же 2 ``прообраза'' А (рис. 19). Подобная ситуация возникает и в реальных хронологических списках имен, когда в одном дубликате использованы одни имена, а в другом -- другие имена одних и тех же людей. Однако в любом случае, если А и А -- действительно 1 2 дубликаты, то есть содержат части, восходящие к общему прообразу А в исходной короткой колоде, то среди множества экземпляров их прообраза А, разбросанных при тасовании по колоде К и как-то искаженных при этом, должны встретиться и такие экземпляры, которые содержат как карты, попавшие из А в А, так и карты, 1 попавшие в А (на рис. 19 такой экземпляр А обведен кружком). 2 Следовательно, в том случае, когда А и А -- дубликаты, 1 2 вероятность встреч карт из А и А где-нибудь в колоде К, БОЛЬШЕ, 1 2 чем аналогичная вероятность в случае, когда А и А дубликатами 1 2 не являются (естественно, имеются в виду не сами экземпляры карт из А и А, а такие же карты). 1 2 В самом деле, в первом случае действует описанный механизм, объединяющий карты из А и А в колоде К, а во втором -- это 1 2 объединение может произойти лишь чисто случайным образом. Приведенные соображения позволяют предложить методику, разделяющую всевозможные пары отрезков А и А колоды К на два 1 2 множества: множество пар-дубликатов (в статистическом смысле) и множество ``независимых'' пар. Эта методика требует значительного объема вычислений на ЭВМ. При применении к хронологическим спискам имен ее результатом является так называемая МАТРИЦА СВЯЗЕЙ списка, дающая его разложение на систему дублирующих друг друга ``слоев''. Методика была впервые предложена авторами в [11-13]. Подробное изложение метода см. в главе 3. p3'2'1 Глава 2. ОПРЕДЕЛЕНИЕ СДВИГОВ В ХРОНОЛОГИИ ПО ГИСТОГРАММАМ
ЧАСТОТ РАЗНЕСЕНИЙ СВЯЗАННЫХ ИМЕН 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 1. 1. БОЛЬШАЯ КОЛОДА КАРТ И СОСТАВЛЯЮЩИЕ ЕЕ МАЛЫЕ КОЛОДЫ Вернемся к модельной задаче о колодах карт (уже описанной в предыдущем параграфе), в терминах которой будут сформулированы необходимые определения. Предположим, что в нашем распоряжении имеется некоторая последовательность карт К (колода карт), которая может содержать ПОВТОРЯЮЩИЕСЯ КАРТЫ. Будем говорить, что колода К СОДЕРЖИТ ДУБЛИКАТЫ, если она получена из нескольких одинаковых по составу и порядку более коротких колод карт Х (также содержащих, возможно, повторяющиеся карты), которые были сложены подряд в одну общую колоду ХХ... Х, а затем получившаяся таким образом БОЛЬШАЯ КОЛОДА БЫЛА ПЕРЕТАСОВАНА. Мы допускаем, что перед тасованием каждый экземпляр исходной колоды Х был как-то ИСКАЖЕН. Под ИСКАЖЕНИЯМИ будем понимать случайное исключение, дублирование или замену отдельной карты или же последовательности подряд стоящих карт. Предположим однако, что локальные искажения в различных частях каждой из исходных колод НЕЗАВИСИМЫ друг от друга. Если же исследуемая колода ДУБЛИКАТОВ НЕ СОДЕРЖИТ (то есть порядок карт в ней не порожден описанным выше механизмом), будем называть порядок карт в колоде ПРАВИЛЬНЫМ. 1. 2. ФОРМУЛИРОВКА ПРОБЛЕМЫ Задача состоит в том, чтобы по известной последовательности карт в колоде К проверить гипотезу Н о том, что порядок карт в К 0 -- ПРАВИЛЬНЫЙ, то есть К не содержит дубликатов. Если гипотеза Н 0 отвергается, то требуется определить ВЕЛИЧИНЫ СДВИГОВ между экземплярами исходной колоды Х, расположенными в колоде К (и не до конца разрушенными при тасовании -- см. рис. 17). Для решения этой задачи сформулируем следствие гипотезы Н, 0 допускающее проверку методами математической статистики. 1. 3. РАЗБИЕНИЕ БОЛЬШОЙ КОЛОДЫ Пусть общее число карт в колоде К равно n и из них m различных. Разобъем колоду К на отрезки ОДИНАКОВОЙ ДЛИНЫ: К = ( К, К,..., К ), 1 2 N где через N обозначено общее количество отрезков разбиения. Пусть каждый из этих отрезков содержит p карт. Разбиение выберем так, чтобы число карт в отрезке разбиения было существенно меньше общего числа карт в колоде К: p \а<\А n. 1. 4. РАЗНЕСЕНИЕ ПАРЫ КАРТ КАК СЛУЧАЙНАЯ ВЕЛИЧИНА Рассмотрим конечную вероятностную схему равновероятного выбора с возвращением двух карт из колоды К. Это значит, что происходит случайный равновероятный выбор карты в колоде К, эта карта запоминается и возвращается в колоду. Затем также равновероятно выбирается вторая карта. Результатом выбора является (случайный) протокол, в котором записаны порядковые номера в колоде обеих выбранных карт k, k в 1 2 порядке их выбора. Определим случайную величину \Вз\А, которую мы назовем РАЗНЕСЕНИЕМ выбранной пары карт. Пусть i и i -- порядковые 1 2 номера отрезков колоды К, в которых содержатся выбранные карты k и k. По определению положим: 1 2 \Вз\А = |i -- i |. 1 2 Таким образом, РАЗНЕСЕНИЕ \Вз\А -- ЭТО АБСОЛЮТНАЯ ВЕЛИЧИНА РАЗНОСТИ НОМЕРОВ ОТРЕЗКОВ РАЗБИЕНИЯ, СОДЕРЖАЩИХ ВЫБРАННЫЕ КАРТЫ. 1. 5. ЛОКАЛЬНОЕ ИСКАЖЕНИЕ ЛЕТОПИСИ -- КОЛОДЫ КАРТ Пусть А -- некоторое событие, определяемое заданной структурой колоды К (то есть порядком карт в ней и ее разбиением на отрезки) и выбранной парой карт. Событие А назовем ЛОКАЛЬНЫМ СОБЫТИЕМ (локальным условием), если наступление этого события может быть обеспечено заменой карт в одном из отрезков разбиения колоды К (заменой, возможно зависящей от случая). Другими словами, локальное событие -- это такое событие, которое может быть обусловлено ЛОКАЛЬНЫМ ИСКАЖЕНИЕМ колоды К. МАТЕМАТИЧЕСКИЙ ПРИМЕР. Событие А, состоящее в том, что в 0 некотором отрезке разбиения содержатся карты сразу обоих выбранных видов является ЛОКАЛЬНЫМ СОБЫТИЕМ. В самом деле, изменив две карты, скажем, в первом отрезке разбиения так, чтобы в нем оказались такие же карты, как и выбранные, мы обеспечим наступление события А. 0 Если же говорить об исторических хрониках, МОДЕЛЬЮ КОТОРЫХ является колода карт К, то содержательный смысл понятия ``локальное событие'' состоит в следующем. Такие события, с одной стороны, могут возникать в итоге сознательных действий хрониста или переписчика, а с другой стороны, для их возникновения не требуется переделки всего текста хроники. Скажем, в примере с событием А хронист, включивший в 0 какое-то место хроники имена двух персонажей, сделал это на основании своих вполне осознанных представлений о том, что они жили одновременно (или имели сходную судьбу и т. п.) и ему для этого не надо было перекраивать заново весь текст хроники. В отличие от этого, ГЛОБАЛЬНЫЕ характеристики распределения имен в длинных исторических хрониках, мало чувствительные к их локальным искажениям, НЕ МОГЛИ КОНТРОЛИРОВАТЬСЯ ОТДЕЛЬНЫМИ ХРОНИСТАМИ. Изменение глобальных характеристик могло произойти лишь на заключительном этапе компиляции (согласования) крупных хроник и включения их в единую хронологическую шкалу. Поэтому именно ГЛОБАЛЬНЫЕ характеристики полезны при исследовании ``скрытой'' структуры летописей. 1. 6. ЛОКАЛЬНАЯ СВЯЗЬ КАРТ В ``ПРАВИЛЬНОЙ КОЛОДЕ'' НЕ ВЛИЯЕТ НА ГЛОБАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ТАКИХ ЖЕ КАРТ 6. В основе предлагаемой методики лежит следующее интуитивно очевидное утверждение о статистических свойствах ПРАВИЛЬНОГО ПОРЯДКА карт в колоде К. ГИПОТЕЗА Если колода К не содержала дубликатов или же ее тасование было достаточно полным и структура дубликатов (коротких идентичных друг другу колод) в ней полностью разрушена, то ЛОКАЛЬНОЕ УСЛОВИЕ, НАЛОЖЕННОЕ НА ПАРУ ВЫБРАННЫХ КАРТ, НЕ МОЖЕТ ПОВЛИЯТЬ НА ХАРАКТЕР ГЛОБАЛЬНОГО РАСПРЕДЕЛЕНИЯ ТАКИХ ЖЕ КАРТ ВО ВСЕЙ БОЛЬШОЙ КОЛОДЕ. В частности, локальное условие не должно влиять и на закон распределения случайной величины \Вз\А вне некоторой окрестности нуля, определяемой радиусом затухания взаимной зависимости отрезков разбиения колоды К. В самом деле, распределение \Вз\А является ГЛОБАЛЬНОЙ характеристикой порядка карт в целом и мало чувствительно к хаотичным локальным изменениям этого парядка. Это значит, что в случае ПРАВИЛЬНОГО порядка карт в К, условное распределение случайной величины \Вз\А при условии произвольного локального события А должно СОВПАДАТЬ вне некоторой окрестности нуля с безусловным распределением \Вз\А. Иначе говоря, из гипотезы Н вытекает такое следствие: 0 СЛЕДСТВИЕ ГИПОТЕЗЫ H. 0 Пусть А -- некоторое локальное событие, а \Ве\А -- радиус затухания зависимости между отдельными отрезками разбиения колоды К. (В качестве единицы измерения этого радиуса возьмем длину отрезка разбиения. Таким образом \Ве\А -- целое число.) Тогда распределение P{\Вз\А = x|A, \Вз\А \Д>\А \Ве\А} должно совпадать с распределением P{\Вз\А = x|\Вз\А \Д>\А \Ве\А}. С другой стороны, в случае, когда гипотеза Н неверна и 0 колода К содержит дубликаты, указанные распределения могут очень сильно разниться на всем интервале возможных значений случайной величины \Вз\А (0\Д<\Вз\Д<\АN-1). МАТЕМАТИЧЕСКИЙ ПРИМЕР. Возьмем событие А, определенное выше 0 и предположим, что колода К содержит дубликаты. Тогда для некоторых отрезков разбиения К, такие же как и в К карты будут i i содержаться также в дубликатах даного отрезка. Таким образом, пары карт, тождественных с некоторыми картами из К, будут i распределены по колоде К не совсем произвольно. А именно, они будут ``собираться'' в дискретно расположенной серии дубликатов отрезка К. i Значит и разнесение этих пар будет особенно часто принимать значения либо близкие к нулю, либо равные сдвигам между дубликатами этой серии в колоде К. Поскольку условие А 0 существенно ограничивает выбор пар карт -- рассматриваются лишь те, которые (сами или тождественные им) хоть раз попали в один и тот же отрезок разбиения колоды К, -- то описанная ситуация с дубликатами будет довольно типичной для ограниченного таким образом множества пар. Это изменит распределение случайной величины \Вз\А (по сравнению с ее распределением на множестве всех пар) и заставит ее чаще принимать те значения, которые характерны для расстояний между дубликатами в К. Таким образом, условное распределение \Вз\А при условии А будет существенно отличаться от ее безусловного 0 распределения. Сформулированное следствие позволяет проверять гипотезу Н в 0 конкретных хрониках. Более того, анализ условных распределений вида P{\Вз\А = x|A} с различными локальными событиями А дает возможность определить величины сдвигов между дубликатами в К. p3'2'2 2. РАЗНЕСЕНИЯ СВЯЗАННЫХ ИМЕН 2. 1. ПРАВИЛЬНЫЙ ХРОНОЛОГИЧЕСКИЙ СПИСОК ИМЕН В главе 1 было введено понятие ХРОНОЛОГИЧЕСКОГО СПИСКА ИМЕН, снабженного разбиением на главы и приведены примеры реальных хронологических списков. В настоящем разделе мы рассмотрим задачу проверки гипотезы Н_0 о том, что хронология того или иного хронологического списка имен является ПРАВИЛЬНОЙ. Уточним понятие правильного списка по сравнению с определением, данным в главе 1. А именно, будем называть хронологию списка имен Х ПРАВИЛЬНОЙ, если список не является результатом размножения и последующего ``поблочного тасования'' (склейки со сдвигом и локального перемешивания) некоторого другого, БОЛЕЕ КОРОТКОГО списка Y. В противном случае будем говорить, что список Х СОДЕРЖИТ ДУБЛИКАТЫ. Под дубликатами понимаются первоначально одинаковые (при тасовании они могут быть