Твердые науки потрясены машинным обучением

Твердые науки потрясены машинным обучением


Физики элементарных частиц научили алгоритмы решать ранее неразрешимые проблемы и решать совершенно новые задачи.

От электронной почты до Интернета физики элементарных частиц исторически были первыми пользователями технологии, если не ее создателями. Поэтому неудивительно, что исследователи начали обучать компьютерные модели распознавать частицы в хаотических струях, образующихся в результате столкновений, еще в 1997 году. С тех пор эти модели работали и становились все лучше и лучше, хотя не всем это нравилось. продвижение.

Физики элементарных частиц научили алгоритмы решать ранее неразрешимые проблемы и решать совершенно новые задачи в течение последних десяти лет, наряду с более крупной революцией в области глубокого обучения.

БАК необходимо хранить 600 петабайт данных в течение следующих нескольких лет сбора данных, даже при наличии эффективного триггера. Поэтому исследователи ищут способы сжать данные.

Начнем с того, что данные, используемые в физике элементарных частиц, сильно отличаются от обычных данных, используемых в машинном обучении. Хотя сверточные нейронные сети (CNN) преуспели в категоризации фотографий обычных предметов, таких как деревья, котята и еда, они хуже справляются со столкновениями частиц. Хавьер Дуарте утверждает, что проблема в том, что данные о столкновениях из таких источников, как Большой адронный коллайдер, по своей природе не являются изображением.

Яркие изображения столкновений LHC могут обманчиво заполнить весь детектор. На самом деле белый экран с несколькими черными пикселями представляет собой миллионы входных данных, которые на самом деле не регистрируют сигнал. Хотя полученное изображение не соответствует стандартам из-за слабого ввода, более поздний дизайн, известный как графовые нейронные сети, может эффективно его использовать.

Инновации необходимы для решения большего количества проблем физики элементарных частиц. По словам Дэниела Уайтсона, «мы не просто импортируем молотки, чтобы забивать гвозди». Нам нужно создать новые молотки, так как есть странные новые типы гвоздей. Одним из странных аспектов является большой объем данных, производимых на БАК — примерно один петабайт в секунду. Сохраняется лишь небольшая часть этого огромного объема высококачественных данных. Чтобы создать лучшую триггерную систему, которая сохраняет как можно больше выдающихся данных, удаляя при этом некачественные данные, исследователи работают над тем, чтобы обучить зоркий алгоритм сортировке лучше, чем тот, который жестко запрограммирован.

READ  Определите улыбающуюся собаку! Капча зашла слишком далеко, чтобы блокировать ботов

Однако, по словам Дуарте, такая программа должна выполняться всего за несколько микросекунд, чтобы быть эффективной. Физики элементарных частиц раздвигают границы машинных методов, таких как обрезка и квантование, чтобы ускорить свои алгоритмы для решения этих проблем. Исследователи ищут способы сжатия данных, поскольку БАК необходимо хранить 600 петабайт в течение следующих пяти лет сбора данных (что эквивалентно примерно 660 000 фильмов в разрешении 4K).

Благодаря машинному обучению физики элементарных частиц теперь могут иначе подходить к данным, которые они используют. Они учатся учитывать множество других событий, происходящих во время столкновения, вместо того, чтобы концентрироваться на одном событии, например, на распаде бозона Хиггса до двух фотонов. Такие исследователи, как Талер, теперь принимают более всеобъемлющий взгляд на факты, а не просто фрагментарную точку зрения, которая возникает в результате оценки взаимодействия событий за взаимодействием, даже если между любыми двумя событиями нет причинно-следственной связи.

Программирование уже окружено стигмой, которую иногда отвергают как «ненастоящую физику», и аналогичные опасения возникают в отношении машинного обучения. Одна из проблем заключается в том, что машинное обучение может запутать физику, превратив анализ в черный ящик автоматизированных операций, которые людям трудно понять.

Сообщение «Твердые науки, потрясенные машинным обучением» впервые появилось в Analytics Insight.



Source link