Прогресс машинного зрения в автоматизации: технологии и их применение

Робот офтальмолог

Машинное зрение (МЗ) позволяет получить изображения локаций и объектов существующих в реальности. Данное научное направление в области искусственного интеллекта, прежде всего, в робототехнике даёт возможность не просто получить изображение, но ещё и совершать ряд других действий, при этом вовлечения живого персонала не требуется или его значение частично.

Важные события в развитии технологии МЗ

Сама идея возможности МЗ появилась достаточно давно и впервые о ней во всеуслышание было сказано в 1955 году в статье Оливера Селфиджа «Глаза и уши компьютера». Спустя три года, Фрэнк Розенблатт представил компьютерную реализацию персептрона.

Уже в 60-е годы прошлого века были предприняты попытки в создании первых систем обработки изображений. А в следующем десятилетии Лавренс Роберт разработал концепцию машинного построения трёхмерных образов объектов. В конце 70-х Ганс-Хельмут Нагель предложил рабочую теорию анализа динамических сцен.

Прорывом стала работа учёных в 80-х и 2000-х годах. В этот период появились первые системы, позволяющие управлять автотранспортом в беспилотном режиме, а в 2003 запущены корпоративные системы распознавания лиц. Конечно, на этих достижениях развитие машинного зрения не могло остановиться и сегодня новые горизонты открываются значительно чаще.

Система МЗ состоит:

  • из камер. Подходят как аналоговые, так и цифровые, количество также определяется индивидуально в соответствии запросом. Камера, чёрно-белая или цветная обязательно должна быть оснащена соответствующей оптикой для получения картинки;
  • программного обеспечения. Возможности ПО должны быть достаточными для создания картинки для дальнейшей обработки. Если речь идёт о налоговой камере, то ПО заменяет оцифровщик изображений;
  • процессора. Он может быть многоядерным для современного ПК или встроенным, к примеру, ЦСП;
  • ПО, созданного специально для работы МЗ. В ПО представлены инструменты, которые нужны для разработки приложений;
  • устройства ввода-вывода или возможность связи с целью передачи данных о полученных результатах;
  • умной камеры. Это устройство является альтернативой обладающей всеми перечисленными характеристиками и возможностями;
  • узкоспециализированные источники освоения, могут быть любыми;
  • специфичные приложения ПО используемые с целью обработки изображения и определения необходимых характеристик на нём;
  • многофункциональный датчик, он способен синхронизировать часть обнаружения, захватывать и обрабатывать изобретения или его участок. Датчик может быть оптическим или магнитным;
  • для сортировки и вывода из использования деталей с браком используют приводы определенной формы.

Наиболее часто машинное зрение используют в промышленности, в частности проведение автономных робот и работа системы визуальной проверки и измерений требует внедрения этого интерфейса. Таким образом, становится понятно, что технологии, по которым работают датчики изображения и теоретическая часть управления имеют связь с обработкой видеоданных с целью управления роботом. В то же время обработка данных в режиме реального времени требует программного или аппаратного вмешательства.

Прежде всего речь идёт об изображениях в формате 2D, их чаще всего анализирую и обрабатывают с целью интеграции одной картинки в другую. В качестве примеров наиболее актуальных действий можно привести операции следующих типов:

  • попиксельные для увеличения контрастности;
  • выделение краёв;
  • устранению шумов;
  • Геометрическое преобразование.

Все перечисленные действия осуществляются вне зависимости от содержания изображений.

Непосредственно компьютерное зрение, прежде всего, направлено на работу с трехмерными сценами, они могут быть спроектированы на любое количество изображений. Базы из одного или более изображений достаточно для того, чтобы восстановить структуру или другие данные конкретной сцены в формате 3D.

Говоря о машинном зрении, нельзя забывать и о визуализации. Изначально она неотрывно связывалась с созданием изображений, однако в некоторых случаях речь идёт о проведении обработки и анализа.

В свою очередь распознавание образов требует использования различных методик получения информации из видео. Оно работает, опираясь на статистический подход, с целью использования методик на практике.

Сегодня термин МЗ остаётся очень многогранным и включает все перечисленные выше возможности и функции.

Интересно? Поделиться: