
В дополнение к историям успеха есть много находок сомнительных и ненадежных.
Вычислительные области революционизируются наукой о данных, которая также закладывает основу для того, чтобы компьютеры могли решать проблемы. Умные алгоритмы улучшают, а в некоторых случаях и спасают человеческие жизни в самых разных областях, включая разработку медицинских препаратов и машинное зрение. Однако, помимо историй успеха, есть много находок сомнительных и ненадежных.
Многочисленные выводы науки о данных очевидны
Банк обнаружил, что люди без средств с большей вероятностью прекращали выплаты по своим кредитам, пытаясь предсказать дефолт по кредиту. Было обнаружено, что недостаток сна является важным предиктором, когда больницы исследовали причины ошибок врачей. Более высокие люди испытывают больше ударов головой. Многие из вопросов, которые мы исследуем, имеют простые решения, которые преобладают в анализе.
Иногда там ничего нет
Многие из запросов, которые получают ученые данных, предназначены для подтверждения связей, которые установил человеческий мозг. Иногда что-то есть, а иногда нет.
Хотя это может быть неприятно, знание того, что нет четкой статистической связи, часто является ценным результатом. Те, кто ожидал решения, считают, что статистики что-то упустили, а сомневающиеся могут только претендовать на бессмысленный выигрыш. Наука о данных может только показать, что конкретное исследование не смогло выявить какие-либо статистически значимые закономерности, а не то, что взаимосвязей вообще нет.
Алгоритмы имитируют прошлое, а не будущее
Науку о данных можно использовать только для обобщения прошлого в нескольких дисциплинах, потому что она подвержена быстрым изменениям. Что могут сделать бренды одежды, учитывая, что узкие галстуки были популярны в 1960-х годах, а к 1970-м покупатели покупали галстуки шириной до шести дюймов? Умные специалисты по данным могут подогнать периодическую функцию к колебанию, но к 2010 году рынок уже фрагментирован.
Базовая динамика того, что мы исследуем, не будет изменена наукой о данных. Мы должны сделать предположение, будет ли это полезно для нас в будущем, потому что оно может раскрыть только то, что произошло в прошлом.
Когда данные недороги, фильтрация обходится дорого
Некоторые данные непрерывно поступают на наши компьютеры. Терабайты данных о том, кто запрашивал какое-либо изображение GIF или файл CSS, хранятся в файлах журналов веб-серверов. Жесткие диски постоянно переполнены потоками фотографий высокого разрешения с камер видеонаблюдения. Когда возникает проблема, поиск подходящего фрагмента данных представляет собой борьбу.
Невозможно получить некоторые данные
Проще говоря, многие другие типы данных не существуют. Поскольку люди слишком заняты, чтобы заполнять опросы, маркетинговые команды должны делать обоснованные предположения. Камеры кажутся повсюду, но их разрешения может быть недостаточно или они могут быть направлены не в ту сторону.
Сбор данных занимает большую часть работы в науке о данных, и пока данные не собраны, наука о данных не может начаться.
Больше популярных историй
- Ethereum станет криптовалютой будущего, говорит этот генеральный директор
- Китай дает жизнь антиутопическому ИИ и использует его для проверки партийной лояльности
- Nothing Phone поставляется с Web3 Twist благодаря партнерству с Polygon
- Что такое параметры GPT-3?
- Человекоподобные роботы часто переоцениваются, чтобы быть мыслимыми: исследование
- Теперь ИИ будет решать, оставить игрока FIFA в игре или нет
- Google и Microsoft называют «эмоциональный ИИ» рискованным, но только ограничивают использование
- Топ-10 акций компаний Web3, которые достигнут новой высоты в 2022 году
Пост «Вещи, которых вы не знаете о науке о данных» впервые появился на .