Шесть лучших наборов данных с открытым исходным кодом для компьютерного зрения

Шесть лучших наборов данных с открытым исходным кодом для компьютерного зрения



Компьютерное зрение

Давайте посмотрим на 6 лучших наборов данных с открытым исходным кодом для компьютерного зрения, которые заслуживают изучения.

Компьютерное зрение — одна из главных технологических тенденций, которая переживает бум в наши дни. Эта технология ускоряет развитие всех областей отрасли, помогая организациям революционизировать способы использования машин. А для создания надежной модели глубокого обучения для компьютерного зрения необходимо применять высококачественные наборы данных на этапе обучения. Давайте посмотрим на 6 лучших наборов данных с открытым исходным кодом для компьютерного зрения, которые заслуживают изучения.

  • Имиджнет:Это непрерывная исследовательская работа, направленная на предоставление исследователям доступной базы данных изображений. Это одна из самых известных баз данных изображений, которая нравится исследователям и учащимся и предоставляет в среднем 1000 изображений для иллюстрации каждого синсета.
  • СИФАР-10 и СИФАР-100:CIFAR-10 и CIFAR-100 — это набор изображений, которые используются для обучения алгоритмов машинного обучения и компьютерного зрения для начинающих, работающих в полевых условиях. Это также одни из самых популярных наборов данных для машинного обучения для быстрого сравнения алгоритмов, поскольку они фиксируют слабые и сильные стороны, не накладывая большой нагрузки на процесс настройки параметров.
  • МС КОКО:Набор данных MS COCO, также известный как Microsoft Common Objects in Context, состоит из 328 тыс. изображений. Он аннотирует для обнаружения объектов, обнаружения ключевых точек, паноптической сегментации, субтитров и оценки плотной позы человека.
  • Поза человека MPII:Этот набор данных используется для оценки сочлененной оценки позы человека. Он состоит из около 25 тысяч изображений, на которых изображено более 40 тысяч людей с аннотированными суставами тела. Каждое изображение извлекается из разных видео YouTube и поставляется с предыдущими. В целом набор данных охватывает около 410 человек, и каждое изображение помечено разной активностью.
  • Баркли ДипДрайв:Этот набор данных используется для обучения автономных транспортных средств. Он содержит более 100 000 видеопоследовательностей с различными типами аннотаций, такими как ограничивающие рамки объектов, области движения, теги на уровне изображения, маркировка дорожек и многое другое. Кроме того, он представляет большое разнообразие в представлении различных географических, экологических и погодных условий.
  • Городские пейзажи:Это база данных, содержащая разнообразный набор стерео- и видеофрагментов, записанных на улицах 50 разных городов. Он также включает семантические, экземплярные и плотные пиксельные аннотации для 30 разделов, сгруппированных в 8 категорий. CityScapes предоставляет аннотации на уровне пикселей для 5000 кадров и 20 000 кадров с грубыми аннотациями.
READ  Операции с данными: 10 вещей, которые вы должны соблюдать в отношении данных для вашего бизнеса

Пост «6 лучших наборов данных с открытым исходным кодом для компьютерного зрения» впервые появился на .



Source link