Слово как улика. Всё, что вы скажете, будет использовано против вас - Джон Олссон
Шрифт:
Интервал:
Отсутствие подобного опыта стало сказываться с самого начала. Например, профессор неправильно подошел к отбору текстов, и, на мой взгляд, некоторые его предположения о распределении слов в речи были ошибочны. Его статистические методики также вызывали вопросы. Однако что подумают судьи? Вот что было самое главное.
Я также заметил, что профессор Уиллерби (имя изменено), по-видимому, не был объективен при написании отчета. К примеру, он утверждал, что его задача заключалась в том, чтобы «предоставить отчет о лингвистических сходствах ряда текстов (писем обычных и электронных), написанных мистером Биллом Джонсоном, и другим рядом текстов, взятых из Икс…» Автор отчета, кажется, уже принял решение о том, что сходства будут значительными, и теперь просто искал подтверждение своим взглядам. Расследование подобного дела должно быть совершенно беспристрастным, и цели его следует заявлять куда более нейтральным тоном, например: «…предоставить отчет о возможных лингвистических сходствах Икс и Игрек». Я также отметил, что Уиллерби не упомянул о том, что его отчет был написан в помощь какому бы то ни было суду. Судебный лингвист работает не ради клиента – даже будучи нанятым, он помогает суду.
В предисловии Уиллерби утверждает, что:
…область судебной лингвистики, занимающаяся подобными вопросами, называется установлением авторства. У этой области давняя история, известная широкой публике главным образом по делам об оспаривании авторства таких известных писателей, как Уильям Шекспир. Однако эти же методы использовались и в таких судебных расследованиях, как идентификация Унабомбера, которая была произведена на основе его личного блокнота и широко распространенного манифеста.
В приведенной цитате, раз уж она выражает взгляд эксперта, есть несколько сомнительных моментов. Во-первых, судебная лингвистика – область сравнительно новая, у нее не было «долгой истории». Термин forensic linguistics («судебная лингвистика») впервые использовал в 1968 году Ян Свартвик. Я однажды спросил его о том, как он придумал это словосочетание, и он сказал, что в 60-х годах смотрел телесериал «Quincy». В каждом эпизоде звучало слово forensics («криминалистика»), и он подумал, что его можно вполне успешно применить в качестве прилагательного к слову «лингвистика». Это же словосочетание стало заглавием самой первой научной работы об этом предмете[35]. Однако широко этот термин стал употребляться лишь в 1994 году, когда начал издаваться первый академический журнал с этими словами в заголовке. Более того, установление авторства не является подразделом только лишь судебной лингвистики. Оно является обычным делом в литературной поэтике с ее куда более богатой историей. Авторство произведений Шекспира не относится к судебной области: это давний публичный диспут, малоинтересный в академическом смысле, а каноническое литературное авторство относится к области академических исследований, не имеющих никакого законодательного аспекта и поэтому не могущих называться судебной лингвистикой. Ошибочны даже замечания Уиллерби об Унабомбере: сперва он был идентифицирован на основе стилистических факторов, обнаруженных в его письмах к брату и свояченице, а не на основании его блокнотов, как заявляет Уиллерби; блокноты были найдены уже после ареста Унабомбера. Я располагаю этими сведениями из первых рук, от весьма уважаемого спецагента ФБР, работавшего над этим делом, – Джима Фитцджеральда.
Говоря об установлении авторства, Уиллерби заявляет о существовании трех процедур и перечисляет их: 1) неформальный анализ лингвистического своеобразия, 2) статистический анализ распределения служебных слов и 3) обучение нейросетей с помощью технологий искусственного интеллекта.
На самом деле Уиллерби, по-видимому, путается в терминологии. Сначала он говорит о трех типах процедур. Затем упоминает «общий метод», который в дальнейшем называет «процедурой», потом снова «методом» и, наконец, останавливается на «приеме». Из-за этой путаницы в терминологии я полагаю, что Уиллерби не понимает разницы между методами, процедурами и приемами. А о подходах он даже не заговаривает.
Было бы правильно начать с подхода к задаче. Простейшим подходом является субъективная оценка лингвистического своеобразия, то есть черт, специфически присущих некоторому автору (или кажущихся таковыми). У этого подхода есть свои области применения, но кто-то считает его «ненаучным» из-за того, что он плохо поддается численному выражению. Альтернативным подходом является количественный: любой из количественных методов может быть применен к любым лингвистическим аспектам. Три основные области количественного подхода связаны с измерением и статистическим анализом1) лексики текста, 2) служебных слов[36] и 3) моделированием языка, например, с помощью алгоритмов сжатия, нейросетей и так далее. В рамках каждого из этих подходов существует множество методов измерения и анализа.
О своем втором «методе» Уиллерби говорит: «Второй общий метод заключается в статистическом анализе распределения контекстонезависимых слов». Затем он цитирует двух авторов, библиографические ссылки на которых приведены в конце отчета, но конкретные номера страниц не указаны. В отчетах и вообще в академических работах совершенно необходимо предоставлять читателю точные ссылки на справочный материал. Просто привести названия работ недостаточно по той простой причине, что у читателя тогда не будет всех сведений, необходимых для проверки утверждений автора отчета.
Затем в отношении своего второго «метода» Уиллерби утверждает, что «эта процедура получила широкое признание в этой области», но я должен возразить. Широкого признания в этой области не получила ни одна процедура. И, в любом случае, о какой области идет речь? Если о судебной лингвистике, то это попросту неверно: я не знаю ни об одном лингвисте, представившем суду отчет по установлению авторства на основании подсчета служебных слов. Если речь идет об области компьютерной лингвистики, которая интенсивно занимается вопросами авторства, но положение которой не позволяет ей сделать вклад в судебную лингвистику, то, возможно, это действительно так. Однако следует отметить, что специалисты по компьютерной лингвистике обычно работают с очень длинными текстами: романами, крупными эссе и прочими объемными трудами. Судебной лингвистике приходится иметь дело с анализом почти исключительно кратких текстов. Нередко приходится проводить расследование, располагая лишь тремя текстами не более нескольких сот слов каждый, а то и меньше пятидесяти. По этой причине приемы судебной лингвистики обычно несколько отличаются от приемов установления авторства литературного произведения. В любом случае я никогда не слышал о специалисте по компьютерной лингвистике, который давал бы в суде экспертную оценку в области установления авторства.
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!