Искусственный интеллект, который может изучать образцы человеческого языка

Искусственный интеллект, который может изучать образцы человеческого языка



Искусственный интеллект

Модель может автоматически изучать лингвистические шаблоны более высокого уровня, применимые ко многим другим языкам.

Новый алгоритм машинного обучения самостоятельно находит лингвистические нормы, часто совпадающие с нормами, разработанными экспертами-людьми.

Из-за необычайной сложности человеческих языков лингвисты долгое время считали, что машину нельзя обучить оценивать звуки речи и образцы слов так же, как это делают люди-исследователи.

Тем не менее исследователи из Массачусетского технологического института, Корнеллского и Макгиллского университетов уже добились успехов в этом направлении. Они продемонстрировали способность системы ИИ обучаться фонологическим и грамматическим правилам человеческого языка.

Эта модель машинного обучения разрабатывает правила, которые иллюстрируют, почему формы этих слов меняются, когда заданы слова, и примеры того, как эти слова изменяются для передачи различных грамматических функций в одном языке. Например, он может обнаружить, что в сербско-хорватском языке женская форма слова требует добавления буквы «а» в конце.

Чтобы получить лучшие результаты, эта модель ML также может автоматически изучать лингвистические шаблоны более высокого уровня, которые применимы ко многим другим языкам. Модель смогла создать правильный набор правил для описания этих изменений словоформы для 60% задач.

Этот метод можно использовать для исследования лингвистических гипотез и обнаружения тонких различий в значениях слов между несколькими языками. Это особенно важно, потому что система изучает модели, используя небольшие биты данных, такие как несколько десятков слов, которые люди легко понимают. Кроме того, система использует множество крошечных наборов данных, а не один большой. Это ближе к тому, как исследователи выдвигают гипотезы, то есть рассматривают многочисленные связанные наборы данных и разрабатывают модели для рассмотрения явлений в этих наборах данных.

Исследователи решили изучить взаимосвязь между фонологией и морфологией в попытке создать систему искусственного интеллекта, которая могла бы автоматически обучать модель из множества связанных наборов данных.

READ  Может ли TikTok быть поисковой системой? Для многих пользователей это уже

Поскольку многие языки имеют схожие основные характеристики, а упражнения в учебниках подчеркивают определенные языковые явления, данные из учебников по лингвистике стали отличным испытательным стендом. Учащиеся колледжей также хорошо справляются с проблемами, связанными с учебниками, хотя они часто опираются на прошлые знания фонологии из предыдущих курсов при решении новых задач.

Исследователи использовали метод машинного обучения, называемый байесовским программным обучением, чтобы создать систему, которая могла бы изучать грамматику или набор правил для составления слов. С помощью этой стратегии модель решает проблему, создавая программу.

Программное обеспечение в данном случае — это грамматика, которую модель считает наиболее правдоподобным средством объяснения слов и их значений в лингвистической задаче. Они создали модель с помощью Sketch, известного программного синтезатора, созданного Солар-Лезама в Массачусетском технологическом институте.

Кроме того, они создали модель, чтобы научить ее характеристикам «отличных» программ. Например, поскольку эти два языка похожи, он может усвоить некоторые общие правила, решая простые задачи на русском языке, которые затем будет использовать для решения более сложной задачи на польском языке. Это упрощает модель решения польской проблемы.

Когда система была протестирована с использованием 70 задач из учебника, она обнаружила грамматику, которая точно соответствовала большинству модификаций словоформ в 79% задач и всему набору слов в 60% случаев.

Затем исследователи попытались предварительно запрограммировать модель с некоторой информацией, которую она «должна была» узнать, если бы она была зачислена в лингвистическую школу, и продемонстрировали, что она может более эффективно решать все проблемы.

Модель часто предлагала оригинальные решения. В одном случае он нашел правильный ответ на проблему с польским языком, которая использовала ошибку в учебнике в дополнение к ожидаемому ответу.

READ  Обзор «Черного телефона»: жуткий поверхностный триллер | Цифровые тренды

Модель также подверглась испытанию, чтобы увидеть, сможет ли она изучить некоторые общие шаблоны фонологических правил, которые можно применить ко всем задачам.

В будущем исследователи намерены использовать эту идею для решения непредвиденных проблем в самых разных областях. Они также могут использовать этот метод в других обстоятельствах, когда можно применить передовые знания к связанным наборам данных. Например, они могут создать систему для вывода дифференциальных решений из наборов данных о движении различных объектов.

Сообщение Искусственный интеллект, который может изучать образцы человеческого языка, впервые появилось на Analytics Insight.



Source link