Нейротехнологии и Искусственный интеллект (ИИ)/Компьютерное зрение

Материал из CDTOwiki
Перейти к: навигация, поиск

dt2i_ai_1.png Компьютерное зрение Область искусственного интеллекта (ИИ), которая позволяет компьютерам и системам получать значимую информацию из цифровых изображений, видео и других визуальных входов - и предпринимать действия или давать рекомендации на основе этой информации 100 Цифровые сквозные технологии Средняя Полезно IT/soft Да Инфраструктура и инструменты (раздел) Цифровые технологии (раздел) Производные понятия (раздел) Межотраслевое (раздел) Искусственный интеллект (раздел) Технологические решения (раздел) 4 Нейротехнологии и Искусственный интеллект (ИИ)/Компьютерное зрение

Компьютерное зрение
Область искусственного интеллекта (ИИ), которая позволяет компьютерам и системам получать значимую информацию из цифровых изображений, видео и других визуальных входов - и предпринимать действия или давать рекомендации на основе этой информации
Сегмент
IT/softIT/soft
Рекомендовано
ПолезноПолезно
Сложность
СредняяСредняя
Направление исследований
 

Компьютерное зрение работает почти так же, как человеческое зрение, за исключением того, что у людей есть преимущество. Человеческое зрение имеет преимущество в контексте жизни, чтобы научиться различать объекты, как далеко они находятся, движутся ли они и многое другое. Компьютерное зрение тренирует машины для выполнения этих функций, но оно должно делать это гораздо быстрее с помощью камер, данных и алгоритмов, а не сетчатки, зрительных нервов и зрительной коры.

Компьютерное зрение используется в различных отраслях, от сельского хозяйства до автомобильной промышленности, и рынок растет. Ожидается, что к 2022 году он достигнет 48,6 млрд долларов США.

Как работает компьютерное зрение

Компьютерное зрение требует много данных. Оно анализирует данные снова и снова, пока не распознает различия и в конечном итоге не распознает изображения. Например, чтобы научить компьютер распознавать яблоки, ему нужно показывать огромное количество изображений яблок и предметов, связанных с яблоками, чтобы узнать различия и распознать яблоко.

Для этого используются две важные технологии: тип машинного обучения, называемый глубоким обучением, и сверточная нейронная сеть (CNN).

Машинное обучение использует алгоритмические модели, которые позволяют компьютеру обучать себя контексту визуальных данных. Если через модель подается достаточное количество данных, компьютер «смотрит» на данные и учит себя отличать одно изображение от другого. Алгоритмы позволяют машине учиться самостоятельно, а не тому, кто ее программирует для распознавания изображения.

CNN помогает модели машинного обучения или глубокого обучения «выглядеть», разбивая изображения на пиксели, которым присваиваются метки или метки. Он использует метки для выполнения сверток (математическая операция над двумя функциями для создания третьей функции) и делает предсказания о том, что он «видит». Нейронная сеть запускает свертки и проверяет точность своих предсказаний в серии итераций, пока предсказания не начинают сбываться. Затем он распознает или видит образы, похожие на людей.

Как и человек, создающий изображение на расстоянии, CNN сначала различает четкие края и простые формы, а затем заполняет информацию, выполняя итерации своих предсказаний. CNN используется для понимания отдельных изображений. Рецидивирующий нейронная сеть (РНН) используется аналогичным образом для видео - приложений , чтобы помочь понять , как компьютеры фотографии в серии кадров связаны друг с другом.

Почему компьютерное зрение важно?

В области компьютерного зрения проводится много исследований , но это не просто исследования. Реальные приложения демонстрируют, насколько важно компьютерное зрение для бизнеса, развлечений, транспорта, здравоохранения и повседневной жизни. Ключевым фактором роста этих приложений является поток визуальной информации, поступающей со смартфонов, систем безопасности, дорожных камер и других визуально оснащенных устройств. Эта информация создает испытательный стенд для обучения приложениям компьютерного зрения и стартовой площадке, на которой они становятся частью различных видов человеческой деятельности:

  • IBM использовала компьютерное зрение для создания My Moments для турнира по гольфу Masters 2018 года. IBM Watson просматривал сотни часов видеоматериалов Мастеров и мог определять природу (и звуки) значительных кадров. Он курировал эти ключевые моменты и передавал их фанатам в качестве персонализированных роликов.
  • Google Translate позволяет пользователям направлять камеру смартфона на знак на другом языке и практически сразу же получать перевод знака на предпочитаемом им языке. (6)
  • Разработка транспортных средств с самостоятельным вождением опирается на компьютерное зрение, чтобы понять визуальный вклад от камер автомобиля и других датчиков. Важно идентифицировать другие автомобили, дорожные знаки, указатели полосы движения, пешеходов, велосипедов и другую визуальную информацию, встречающуюся на дороге.
  • IBM применяет технологию компьютерного зрения вместе с флуоресцентным красителем и инфракрасной камерой, чтобы помочь хирургам определять рак с помощью фотонов. И он применяет компьютерное зрение, чтобы помочь диагностировать рак кожи.
  • Компьютерное зрение используется для обеспечения того, чтобы технология анализа лица была построена и обучена ответственно.
  • «Яндекс» разрабатывает систему управления беспилотным автомобилем, которая использует лидары, камеры, радары, GPS и IMU (гиростабилизатор) для достижения пятого уровня автономности (полной автономности автомобиля).
  • VisionLabs специализируется на создании программных решений и сервисов на базе технологий компьютерного зрения. Основной продукт компании - платформа распознавания лиц VisionLabs Luna.

Компьютерное зрение в промышленности

Дополнительные материалы

Дата последней редакции 27 мая 20202020/05/27