ИИ раскрывает скрытые языковые закономерности и вероятное авторство в Библии.

Университет Дьюка. под редакцией Сэди Харли , рецензент Роберт Эган

Выявление скрытых языковых закономерностей в слушаниях с помощью ИИ
Графическое представление результатов команды. Сравнивая использование слов и шаблоны предложений, их статистическая модель на основе ИИ выявила три различных стиля письма или традиций переписчиков, показанных здесь желтым, синим и зеленым цветами.
Автор: Файгенбаум-Головин и др.

ИИ трансформирует каждую отрасль, от медицины до кино и финансов. Так почему бы не использовать его для изучения одного из самых почитаемых древних текстов в мире — Библии? Международная группа исследователей, в которую вошла Шира Файгенбаум-Головин, доцент кафедры математики в Университете Дьюка, объединила искусственный интеллект , статистическое моделирование и лингвистический анализ для решения одного из самых актуальных вопросов в библейских исследованиях: идентификации авторов. Исследование опубликовано в журнале PLOS One . Проанализировав тонкие различия в использовании слов в разных текстах, команда смогла выделить три отдельные традиции переписчиков (стили письма), охватывающие первые девять книг еврейской Библии, известные как Эннеатеух. Используя ту же статистическую модель на основе ИИ , команда смогла определить наиболее вероятное авторство других глав Библии. Что еще лучше, модель также объяснила, как она пришла к своим выводам. Но как сюда попал математик?

В 2010 году Файгенбаум-Головин начал сотрудничать с Израилем Финкельштейном, руководителем Школы археологии и морских культур Хайфского университета, используя математические и статистические инструменты для определения авторства надписей, обнаруженных на фрагментах керамики, датируемых 600 годом до нашей эры, путем сравнения стиля и формы букв, начертанных на каждом фрагменте. Их открытия были опубликованы на первой странице The New York Times .

«Мы пришли к выводу, что находки в этих надписях могут дать ценные подсказки для датировки текстов Ветхого Завета», — сказал Файгенбаум-Головин. «Именно тогда мы начали собирать нашу нынешнюю команду, которая могла бы помочь нам проанализировать эти библейские тексты».

Междисциплинарное начинание состояло из двух частей. Во-первых, команда Файгенбаум-Головина и Финкельштейна — Алон Кипнис (Университет Райхмана), Аксель Бюлер (Протестантский факультет теологии Парижа), Эли Пясецкий (Тель-Авивский университет) и Томас Рёмер (Коллеж де Франс) — состояла из археологов, библеистов, физиков, математиков и специалистов по информатике. Команда использовала новую статистическую модель на основе ИИ для анализа языковых моделей в трех основных разделах Библии. Они изучили первые пять книг Библии: Второзаконие, так называемую Второзаконную историю от Иисуса Навина до Царств и священнические писания в Торе. Результаты показали, что Второзаконие и исторические книги больше похожи друг на друга, чем на священные тексты, что уже является консенсусом среди библеистов. «Мы обнаружили, что у каждой группы авторов свой стиль — что удивительно, даже в отношении простых и распространенных слов, таких как «нет», «который» или «король». Наш метод точно определяет эти различия», — сказал Рёмер.

Для проверки модели команда выбрала 50 глав из первых девяти книг Библии, каждая из которых уже была отнесена библеистами к одному из стилей письма, упомянутых выше. «Модель сравнила главы и предложила количественную формулу для отнесения каждой главы к одному из трех стилей письма», — сказал Файгенбаум-Головин. Во второй части исследования команда применила свою модель к главам Библии, авторство которых вызывало более жаркие споры. Сравнивая эти главы с каждым из трех стилей письма, модель смогла определить, какая группа авторов с большей вероятностью их написала. Еще лучше: модель также объяснила, почему она делала эти призывы. «Одним из главных преимуществ метода является его способность объяснять результаты анализа, то есть указывать слова или фразы, которые привели к отнесению данной главы к определенному стилю письма», — сказал Кипнис. Поскольку текст Библии многократно редактировался и переиздавался, команда столкнулась с большими трудностями при поиске фрагментов, сохранивших первоначальные формулировки и язык. После обнаружения эти библейские тексты часто были очень короткими — иногда всего несколько стихов — что делало большинство стандартных статистических методов и традиционное машинное обучение непригодными для их анализа. Им пришлось разработать индивидуальный подход, который мог бы обрабатывать такие ограниченные данные. Ограниченные данные часто вызывают опасения неточности. «Мы потратили много времени, убеждая себя, что полученные нами результаты — не просто мусор», — сказал Файгенбаум-Головин. «Мы должны были быть абсолютно уверены в статистической значимости». Чтобы обойти эту проблему, вместо использования традиционного машинного обучения, требующего большого количества обучающих данных, исследователи использовали более простой и прямой метод. Они сравнили шаблоны предложений и частоту появления определенных слов или корней слов (лемм) в разных текстах, чтобы увидеть, были ли они написаны одной и той же группой авторов.

Удивительная находка? Команда обнаружила, что хотя два раздела Повествования о Ковчеге в Книгах Царств посвящены одной и той же теме и иногда рассматриваются как части единого повествования, текст в 1-й Книге Царств не совпадает ни с одним из трех корпусов, тогда как глава во 2-й Книге Царств демонстрирует сходство с девтерономической историей (от Иисуса Навина до Царств). Заглядывая вперед, Файгенбаум-Головин сказал, что тот же метод может быть использован и для других исторических документов. «Если вы смотрите на фрагменты документов, чтобы узнать, были ли они написаны, например, Авраамом Линкольном, этот метод может помочь определить, являются ли они настоящими или просто подделкой». «Исследование вводит новую парадигму анализа древних текстов», — резюмировал Финкельштейн. Файгенбаум-Головин и ее команда теперь изучают возможность использования той же методологии для открытия новых открытий о других древних текстах , таких как свитки Мертвого моря. Она подчеркнула, насколько ей нравится долгосрочное междисциплинарное партнерство. «Это уникальное сотрудничество между наукой и гуманитарными науками», — сказала она. «Это удивительный симбиоз, и мне повезло работать с людьми, которые используют инновационные исследования, чтобы раздвигать границы».

Дополнительная информация: Шира Файгенбаум-Головин и др., Критические библейские исследования посредством анализа частоты слов: раскрытие авторства текста, PLOS One (2025). DOI: 10.1371/journal.pone.0322905

Информация о журнале: PLoS ONE 

Предоставлено Университетом Дьюка 

источник: https://phys.org/news/2025-06-ai-reveals-hidden-language-patterns.html?utm_source=nwletter&utm_medium=email&utm_campaign=weekly-nwletter