
Модели ИИ обучаются на множестве данных, собранных за многие годы. Но роль ИИ заключается не в решении общей проблемы, а в решении конкретных. Шансы не найти необходимое количество наборов данных, подходящих для вашей конкретной задачи, очень высоки. Есть все шансы, что команда может продолжить марафон по сбору данных только для того, чтобы оказаться в тупике, называемом тупиком. ловушка данных. модели ИИпонимание основано на чистых цифрах и холодных расчетах, позволяющих им делать предположительно точные прогнозы. Но на самом деле им не хватает уверенности в понимании контекста, которую демонстрируют люди. Чтобы восполнить этот пробел, участие человека считается неизбежным элементом в выполнении ML цикл. Это где ХИТЛ или Люди в петле приходит механизм. человек в курсе модель позволяет людям проверять модель машинного обучения как правильную или неправильную во время обучения.
А машинное обучение Проект начинается именно с подготовки данных, и, к сожалению, именно на эту задачу уходит большая часть драгоценного времени проекта. Подготовка данных абсолютно необходима, потому что отсутствие достаточного количества времени для понимания и маркировки данных — верная формула провала проекта. В модели HITL задача маркировки возлагается на здравомыслящего человека, который может различать и классифицировать, чтобы упростить работу алгоритма машинного обучения по выбору правильного набора данных. Вопрос о том, насколько должен быть вовлечен человек, сводится к принципу Парето, который искренне принимают разработчики машинного обучения: 80% компьютерного ИИ, 19% человеческого ввода и 1% случайности. В 2020 году медицинская система искусственного интеллекта Google Health, DeepMind, обнаружила более 2600 случаев рака груди, чем мог бы обнаружить радиолог. В медицинских случаях возможны исключения. Аргумент здесь заключается в том, что использование модели HITL повысит точность диагностических тестов, при этом несколько случаев могут оказаться нераковыми кистами. Определенно, мы бы предпочли точность от 99% до 80%.
Почему HITL так важен для разработки модели машинного обучения?
Чтобы ответить на этот вопрос, нам нужно понять, что происходит на протяжении всего цикла. Сначала люди маркируют данные, что является частью подготовки данных, поскольку модели получают только высококачественные данные. Учитывая разнообразие и сложность практических ситуаций, модель ML должна быть настроена на все возможные ситуации, включая переобучение, обучение классификаторов пограничным случаям или новые категории данных в поле зрения модели. Довольно часто случается так, что, несмотря на всю подготовку и настройку, модель оказывается неуверенной в суждении или чрезмерно уверенной в неверном решении. В модели HITL человек может просто налететь со своей обратной связью. Таким образом, HITL достигает того, чего человек или машина не могут достичь в одиночку, а благодаря постоянной обратной связи машина учится работать лучше. Кроме того, HITL предоставляет более широкую площадку для тестирования моделей машинного обучения, что является одной из наиболее важных практик MLOps.
HITL поддержит вас, когда большие данные сдадутся
Когда данные слишком малы по размеру, высока вероятность переобучения значений данных. Это означает, что модель делает обобщения по небольшому набору данных, и при представлении редких значений сделанные выводы являются прямым результатом закономерности, которую она изучает из не очень связанных данных. Эту проблему можно решить, добавив больше данных, увеличив размер набора данных с помощью методов преобразования данных, упорядочив данные, удалив функции из данных или увеличив сложность модели. Даже в случае недообучения, когда модель не может распознать основной паттерн только потому, что в нем есть некоторые выбросы, искажающие картину, работают аналогичные методы. Все эти методы имеют несколько недостатков — нежелательных и приводящих к субоптимальным прогнозам. HITL может помочь двумя способами. Либо инженер машинного обучения может приостановить модель, чтобы скорректировать модель, чтобы перезапустить ее с улучшенной архитектурой, либо попытаться исправить метки на лету, чтобы уменьшить ошибки классификации. Модели машинного обучения обречены на смещение с изменением баз данных и, следовательно, необходимость корректировки, поскольку прошлые результаты никогда не могут гарантировать результаты в будущем. Во всех таких случаях HITL является рулем направления.
Больше популярных историй
- Что именно нужно для того, чтобы ИИ стал идеально «разумным»?
- Генеративный ИИ поможет людям создать гиперреальное население в Метавселенной
- Hertzbleed взламывает компьютерные чипы для кражи конфиденциальных данных
- AlphaFold2 от DeepMind решает давнюю проблему свертывания белков
- Получит ли разумный ИИ равные права с людьми в будущем?
- У Crypto Sphere сейчас 20 000 токенов! 10 лучших покупок сегодня
- Python больше не переоценивают благодаря Python 3.11
Сообщение Human In the Loop Machine Learning Can Save You from Data Trap впервые появилось на .