"Я мало что знаю о китах. Я никогда в жизни не видел кита", — говорит Майкл Бронштейн — израильский ученый-компьютерщик, преподающий в Имперском колледже Лондона, Англия.
Он может показаться не идеальным кандидатом для проекта, связанного с общением кашалотов, но его навыки как эксперта в области машинного обучения могут стать ключом к амбициозному начинанию, которое официально стартовало в марте 2020 года: междисциплинарная группа ученых хочет использовать искусственный интеллект (ИИ) для "расшифровки" языка кашалотов.
Если этот проект под аббревиатурой CETI увенчается успехом, это будет первый раз, когда мы действительно поймем, о чем болтают животные, и, возможно, мы даже сможем поговорить с ними.
Все началось в 2017 году, когда международная группа ученых провела год вместе в Гарвардском университете в Кембридже, штат Массачусетс, участвуя в программе Radcliffe Fellowship, программе, которая обещает "возможность отойти от обычных рутинных дел".
Однажды Шафи Гольдвассер, ученая-компьютерщик и эксперт по криптографии также из Израиля, пришла в офис Дэвида Грубера, морского биолога из Городского университета Нью-Йорка.
Гольдвассер, которую только что назначили новым директором Симонсовского института теории вычислений при Калифорнийском университете в Беркли, и услышала в его кабинете серию щелкающих звуков, которые напомнили ей шум, производимый неисправной электронной схемой или азбуку Морзе.
"Вот как кашалоты разговаривают друг с другом", — сказал ей Грубер.
"Я в ответ сказала ему "Может быть, нам стоит сделать проект, в котором мы переведем звуки китов в нечто, что мы, люди, можем понять", — вспоминает Голдвассер. "Я сказала это просто так, я никогда не думала, что он отнесется к этой идее всерьез".
Но дальнейшее общение дало им возможность серьезно отнестись к далеко идущим идеям. На званом обеде они представили свою идею Майклу Бронштейну, который давно следил за достижениями в области обработки естественного языка (нейролингвистическое программирование — НЛП), ветви ИИ, которая занимается автоматическим анализом письменной и устной речи — правда пока это был только человеческий язык.
Бронштейн был убежден, что коды, так называемые краткие сигналы кашалотов, имеют структуру, которая позволяет использовать их для такого рода анализа.
К счастью, Грубер знал биолога по имени Шейн Геро, который с 2005 года регистрировал множество кодов кашалотов в водах вокруг Карибского острова Доминика. Далее Бронштейн применил к этим данным некоторые алгоритмы машинного обучения.
"Похоже, они работали очень хорошо, по крайней мере, с некоторыми относительно простыми задачами", — говорит он.
Но это было не более чем доказательством правильности концепции. Для более глубокого анализа алгоритмам требовалось больше контекста и больше данных — миллионы кодов китов.
Но есть ли у животных вообще язык как таковой? Этот вопрос долгое время вызывает споры среди ученых. Для многих язык — один из последних бастионов человеческой исключительности.
Животные общаются, но не разговаривают, говорит австрийский биолог Конрад Лоренц, один из пионеров науки о поведении животных, который написал о своем собственном опыте "общения" с животными в своей книге 1949 года "Кольцо царя Соломона" . "Животные не владеют языком в полном смысле этого слова", — уверен Лоренц.
"Я думаю, что мы просто еще недостаточно к ним присмотрелись», — возражает Карстен Бренсинг, немецкий морской биолог, написавший несколько книг по общению с животными.
Бренсинг убежден, что высказывания многих животных, безусловно, можно назвать языком. Это не просто собачий лай: необходимо выполнить несколько условий.
"Во-первых, у языка есть семантика. Это означает, что определенные вокализации имеют фиксированное значение, которое не меняется".
Сибирские сойки, один из видов птиц, например, известны тем, что имеют в словарном запасе около 25 разных криков, некоторые из которых имеют определенное фиксированное значение.
Второе условие — грамматика: правила построения предложений. Долгое время ученые были убеждены, что в общении с животными отсутствует структура предложений. Но в 2016 году японские исследователи опубликовали в Nature Communications исследование о вокализации больших синиц.
В определенных ситуациях эти птицы объединяли два разных сигнала, чтобы предупредить друг друга о приближении хищника. Они также отреагировали, когда исследователи проиграли им эту последовательность. Однако, когда порядок звонков был изменен, птицы отреагировали гораздо меньше. "Это грамматика", — говорит Бренсинг.
Третий критерий: вы бы не назвали вокализации животных языком, если они полностью врожденные. Лоренц считал, что животные уже родились с определенным репертуаром звуков и мало чему учились в течение своей жизни.
"Все выражения эмоций животных, например, крики галки "Киа" и "Киав", не сопоставимы с нашим разговорным языком, а сопоставляются только с такими выражениями, как зевота, движение бровей и улыбка, которые выражаются бессознательно как врожденные действия", — писал Лоренц.
Доказано, однако, что несколько видов животных хорошо учатся новым звукам — они приобретают новый словарный запас, развивают диалекты, идентифицируют друг друга по имени. Некоторые птицы даже учатся имитировать мелодии мобильного телефона. Дельфины приобретают индивидуальные свистки, которые они используют в качестве идентификатора для себя, почти как люди используют имя.
Щелчки кашалотов — идеальные кандидаты для попытки расшифровать их значения — не только потому, что, в отличие от непрерывных звуков, производимых другими видами китов, их легко перевести в единицы и нули. Эти животные ныряют в самые глубокие места океана и общаются на больших расстояниях, поэтому они не могут использовать язык тела и выражения лица, которые являются важными средствами общения для других животных.
"Реалистично предположить, что киты общаются в основном с помощью акустических сигналов", — говорит Бронштейн.
У кашалотов самый большой мозг в животном мире, в шесть раз больше человеческого. Когда два кашалота болтают друг с другом в течение длительного периода времени, разве мы не должны задаваться вопросом, неужели им есть что сказать друг другу? Дают ли они друг другу советы о лучших местах для рыбалки? Обмениваются ли китовые мамы историями о воспитании своего потомства, как их человеческие собратья? Стоит попытаться выяснить это, считают исследователи программы CETI.
Выучить незнакомый язык легче, если есть что-то вроде знаменитого Розеттского камня. Эта каменная стела, обнаруженная в 1799 году, содержит один и тот же текст на трех языках и поэтому она стала ключом к расшифровке египетских иероглифов. Конечно, в животном мире такого не бывает. У нас нет ни человеко-китового словаря, ни книги с грамматическими правилами языка кашалотов.
Но есть способы обойти это. Очевидно, что дети изучают свой родной язык без этих инструментов, просто наблюдая за языком, на котором говорят их родители и другие близкие люди. Исследователи пришли к выводу, что такое обучение носит в основном статистический характер: к примеру, ребенок помнит, что слово собака часто произносится, когда это пушистое животное входит в комнату, что определенные слова часто используются в связи с некоторыми другими, что определенная последовательность слов более вероятно, чем другое.
За последние 10 лет методы машинного обучения имитировали этот тип обучения. Исследователи скармливали большим нейронным сетям огромное количество языковых данных. И эти сети могли находить структуры на языках на основе статистических наблюдений, ничего не сообщая о содержании.
Одним из примеров являются так называемые языковые модели, наиболее известной из которых является GPT-3, разработанная компанией OpenAI. Языковые модели — это машины завершения — например, GPT-3 получает начало предложения и завершает его слово за словом, аналогично предложениям, которые делают смартфоны при вводе текстовых сообщений, только гораздо более изощренно.
Статистически обрабатывая огромные объемы текста, взятого из Интернета, языковые модели не только знают, какие слова часто встречаются вместе, но и изучают правила составления предложений. Они создают правильно звучащие предложения и зачастую эти предложения потрясающе качественные. Они способны писать автоматические новостные статьи на заданную тему, резюмировать сложные юридические тексты простыми словами и даже переводить с одного языка на другой.
Эти подвиги имеют свою цену: требуются огромные объемы данных. Программисты обучили нейронную сеть GPT-3 примерно 175 миллиардам слов. Для сравнения, проект Gero по исследованию кашалотов в Доминике собрал менее 100 000 кодов кашалотов. Первой задачей нового исследовательского проекта будет значительное расширение этой коллекции с целью собрать четыре миллиарда слов — хотя никто еще не знает, что такое "слово" на языке кашалотов.
Фото: Will Falcon aka Vitaly Sokol / commons.wikimedia.org
Если идея Бронштейна сработает, вполне реально разработать систему, аналогичную моделям человеческого языка, которая генерирует грамматически правильные высказывания китов.
Следующим шагом будет интерактивный чат-бот, который попытается вступить в диалог со свободноживущими китами.
Конечно, сегодня никто не может сказать, примут ли животные его в качестве собеседника.
"Может, они просто ответят нам "Прекратите болтать всякую чушь!"- шутит Бронштейн.
Но даже если эта идея сработает, обратная сторона всех языковых моделей заключается в том, что они ничего не знают о содержании языка, на котором общаются. Было бы иронично, если бы исследователи создали бота, который мог бы бегло разговаривать с китом, но тогда они сами бы не понимали ни слова. Вот почему они хотят с самого начала аннотировать записи голоса данными о поведении китов — где были эти животные, с кем разговаривали, какова была реакция? Задача состоит в том, чтобы найти автоматизированный способ создания хотя бы некоторых из этих миллионов аннотаций.
Еще предстоит разработать множество технологий — в том числе датчики для регистрации отдельных китов и отслеживания их местоположения. Это необходимо, чтобы четко назначить отдельные звуки конкретному киту.
Пока проект CETI успешно подал заявку на пятилетнее финансирование от Audacious Project, проводимого TED, организацией конференции. Ряд организаций являются частью проекта, в том числе Национальное географическое общество и Лаборатория компьютерных наук и искусственного интеллекта Массачусетского технологического института (MIT).
Исследователи CETI признают, что их поиск смысла в китовых кодах может не дать ничего интересного. «
"Мы понимаем, что один из самых больших рисков — это то, что киты могут оказаться невероятно скучными", — говорит Грубер, руководитель программы. "Но мы не думаем, что это так. По моему опыту биолога, когда я действительно смотрел на что-то внимательно, никогда не было случая, чтобы животные меня не восхищали".
Название проекта CETI вызывает ассоциации с SETI, программой по поиску внеземного разума, которая сканировала небо на предмет радиосигналов инопланетных цивилизаций с 1960-х годов, и пока не нашла ни одного сообщения.
Поскольку никаких признаков инопланетян обнаружено не было, Бронштейн убежден, что мы должны попробовать наши навыки декодирования сигналов, которые мы можем обнаружить здесь, на Земле. Ведь вместо того, чтобы направлять наши антенны в сторону космоса, мы можем подслушивать культуру в океане, которая, по крайней мере, столь же чужда нам как инопланетяне.
"Я считаю очень высокомерным думать, что Homo sapiens- единственное разумное и разумное существо на Земле", — говорит Бронштейн. "Если мы обнаружим, что целая цивилизация, по сути, находится у нас под носом, возможно, это приведет к некоторому сдвигу в том, как мы относимся к окружающей среде. И, возможно, это приведет к большему уважению к живому миру".
The post Можем ли мы наконец поговорить с китами? first appeared on X-Digest.