В наши дни Википедия может быть ресурсом практически для всего, но, по словам Меты, она заполнена хитрыми и неточными цитатами.
Но не волнуйтесь, компания говорит, что ее ИИ здесь, чтобы помочь, разработав Sphere, модель, способную автоматически сканировать сотни тысяч цитат одновременно, чтобы проверить, действительно ли они подтверждают соответствующие утверждения.
Meta утверждает, что создала новый набор данных из 134 миллионов общедоступных веб-страниц в качестве источника знаний для модели, которая, по словам разработчиков, «на порядок больше и значительно сложнее, чем когда-либо использовавшаяся для такого рода исследований».
Сфера (откроется в новой вкладке) использует открытые веб-данные, а не традиционные проприетарные поисковые системы, такие как Google, и уже собрал 134 миллиона документов из Интернета.
Построен с использованием CCNet (откроется в новой вкладке)вариант Common Crawl, Meta говорит, что Sphere поможет другим исследователям ИИ, работающим над проектами по поиску знаний.
Мета говорит, что конечной целью проекта является создание платформы, которая поможет редакторам Википедии систематически выявлять проблемы с цитированием и быстро исправлять цитирование или корректировать содержание соответствующей статьи в масштабе.
Сообщается, что этот инструмент привлекает внимание к сомнительным цитатам, позволяя редакторам-людям оценивать случаи, которые, скорее всего, ошибочны, без необходимости просеивать тысячи правильно цитируемых утверждений.
Если цитата кажется неуместной, Meta говорит, что ее модель предложит более подходящий источник, даже указав на конкретный отрывок, подтверждающий утверждение.
Эта новость появилась, когда Википедия ищет новые способы увеличения доходов, помимо пожертвований.
Викимедиа Энтерпрайз (откроется в новой вкладке) Платформа недавно объявила, что начнет взимать плату с таких компаний, как Google, Amazon и Facebook, которые используют Википедию в качестве ресурса.
Вы можете получить исходный код проекта на GitHub. здесь (откроется в новой вкладке)а заинтересованные стороны также могут прочитать полный отчет о результатах проекта. здесь (откроется в новой вкладке) или получить доступ к демо здесь (откроется в новой вкладке).