Идеи и тенденции: Компьютерное зрение имитирует человеческое

When Computer Vision Imitates Life

By Linda Roach, Contributing Writer
Edited by Brian A. Francis, MD

American Academy of Ophthalmology

Исследователи искусственного интеллекта из Массачусетского технологического института разработали систему компьютерного зрения, которая позволяет машине распознавать объекты на фотографиях настолько точно, насколько это может человеческий мозг, даже когда фон заполнен визуальными помехами или изображение показывается боком.

Возможно, это не должно быть сюрпризом, что эта перспективная модель появилась только после того, как кто-то пытался воспроизвести то, что уже существует в природе, то есть зрительную систему человека. Дизайнеры модели постарались включить ключ нейробиологических механизмов распространения визуальных сигналов и нейронных вычислений в мозге. (Предыдущие системы были больше ориентируются на архитектуру компьютеров, чем на зрительные системы.)

Но усилия, чтобы вытеснить за пределы ранее подходы к компьютерному зрению результаты были поразительными, однако, сказал ведущий автор двух последних докладах о специализированных компьютерных системах видения, немедленное распознавание тестирования показало, что программное обеспечение может распознавать объекты на фотографиях так же часто, как это делают люди (т. е. около 80% времени).

“Целью данной работы является разработка математической модели зрительной коры, которая старается учитывать все известные факты о зрительной системы. Так что модель действительно является нейробиологической моделью”, — сказал Thomas Serreр, кандидат наук, который работает научным сотрудником в центре биологического и компьютерного обучения Массачусетского технологического института .

“Сюрпризом для нас было то, как хорошо он работал”, Dr. Serre добавил, “Нет никаких гарантий, что модель, которую вложат всю биологическую информацию — будет хорошей. Есть определённое волнение потому, что система способна справиться с реальной визуальной ситуацией. Это не бар-линии или решетки, которые в предыдущих моделях использовались”.

Исследователи сначала “тренировали” их программного обеспечения распознавать лица и объекты, а затем показал его стандартную картину-наборы для определения точности идентификации. Компьютер был точным, как предыдущие искусственного видения системы на обнаруживать самолеты, мотоциклы и некоторые изображения лица (точность от 95.9% до 98.2%). Однако, это было от 5 до 19,7 процентных пункта лучше, чем более ранние системы в виде листьев, автомобилей и второго лица.

После тонкой настройки программного обеспечения, ученые выставили его против “золотого стандарта” человеческого зрения. Двадцати четырем добровольцам было предложено определить, существует ли животное когда 1200 образов замелькали перед ними по 20 мс каждый. Фотографии показывали с близкого расстояния, на изменчивых пейзажах, содержащие небольшое животное. Респонденты отвечали, нажав «да» или «нет». (Компьютерная модель также “видела” образы по 20 мс, но ограничения вычислительной мощности давали задержки ответов в несколько секунд.)

«Исследователи, делали проблески коротким для того, чтобы изолировать первую стадию обработки зрительной коры, которая имитирует компьютерную модель и обеспечивает сопоставимость между двумя наборами данных», сказал Dr. Serre.

“Если флэш-картинка сменяется достаточно быстро, там достаточно информации, чтобы позволить человеческому мозгу знает, что это за образы, но не хватает времени для нейронной обратной связи, чтобы сделать их активными”, — сказал он. Часто испытуемые не имели осознание ничего не видя. Несмотря на этот факт, люди зарегистрировали правильные ответы во всех вариантах в 80 процентов. Система искусственного интеллекта набрала 82 процента.

Даже старший в исследованиях автора, давний исследователь искусственного интеллекта Tomaso Poggio, Ph.D., профессор мозга и когнитивных наук в Массачусетском технологическом институте, был удивлен, что на матче между биологическими и инженерии, Dr. Serre напомнил. “До этого, Dr. Poggio и многие другие в поле сказал бы вам, что биология и компьютерное зрение не могут взаимодействовать в любой точке,” сказал Dr. Serre, “С другой стороны, можно подумать: Эволюция формирования зрительной системы в течение многих тысяч лет, так что если есть один набор нейробиологических параметров, что является оптимальным в жизни, следует тоже очень хорошо для машины.”

Использованные источники

American Academy of Ophthalmology Web Site: aao.org, Original URL: aao.org/publications/eyenet/200705/news.cfm
Serre, T. et al. IEEE Trans Pattern Anal Mach Intell 2007;29(3):411–426.
Serre, T. et al. Online April 2, 2007. Proc Natl Acad Sci USA.

Апрель 2024
Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Оставьте комментарий Отменить ответ