В ближайшем будущем роботы будут использоваться в качестве транспортных средств. Они будут выполнять роль доставщика грузов, привезут вам на дом почту, еду. Но это в том случае, если они могут найти вашу дверь.

Стандартные подходы для роботизированной навигации включают картографирование области, которое делается заранее. Затем в дело идут алгоритмы ведущие робота к определенной цели или GPS-координаты на карте. 

Но все это имеет смысл при определенных условиях. Планируя конкретное задание нам надо будет запланировать и возможную полосу препятствий. А это может стать решающим и непреодолимым условием для выполнения задания.

Только представьте себе, вам придется заранее составить карту каждого отдельного района в зоне доставки робота, включая конфигурацию каждого дома в этом районе вместе с конкретными координатами каждой входной двери каждого дома. 

Представили? Такая задача нереальна, если речь идет о всем городе. Тем более, что внешний вид домов меняется в зависимости от сезона. Определение местонахождения каждого отдельно взятого здания также может столкнуться с проблемами безопасности и конфиденциальности.

Но все не так плохо. Инженеры MIT разработали метод навигации, который не требует заблаговременного картографирования. Вместо этого они предлагают роботу при передвижении к месту назначения использовать подсказки. Ученые отказываются от координат на карте и описывают подсказки в общих семантических терминах “входная дверь” или “гараж”. 

Например, если робот получает задание доставить посылку к чьей-то входной двери, он может начать свой путь с дороги. Затем он увидит въезд, который робот обучен распознавать как вероятный путь к тротуару, который, в свою очередь, вероятно, приведет к входной двери.

Новый метод может значительно сократить время, которое робот тратит на изучение недвижимого объекта, чтобы добраться до цели. И ему теперь не нужна карта конкретного частного владения.

На международной конференции по интеллектуальным роботам и системам Майкл Эверетт, аспирант кафедры механики MIT представил результаты работы группы ученых.

” Мы отказались от карт для каждого двора или здания, которые будет искать робот», — говорит Майкл Эверетт. “С помощью нового метода мы планируем оставлять робота на тротуаре и научить его самостоятельно искать дверь.”

Несколько лет исследователи работали над внедрением естественного семантического языка в робототехнические системы. Они обучали роботов различать объекты по их семантическим меткам, чтобы те могли визуально опознавать дверь как дверь, а не просто как твердое прямоугольное препятствие.

“Теперь у нас есть возможность дать роботам понимать в режиме реального времени какие предметы их окружают ”, — говорит Эверетт.

Новый навигационный подход использует алгоритмы извлечения объекта из визуальных данных для создания другой карты той же реальности, но представленной уже в виде семантических подсказок или контекста.

Исследователи применили алгоритм для построения карты окружающей среды по мере перемещения робота. Они использовали семантические метки каждого объекта и отображение глубины. Этот алгоритм называется semantic SLAM (одновременная локализация и отображение).

Другие семантические алгоритмы позволяют роботам различать и сопоставлять объекты в своей среде только на условиях «как есть», и не позволяют роботу принимать решения при навигации в новой среде, и двигаться по наиболее эффективному пути.

«Раньше было просто. Шлепнул робота понизу, сказал ” вперед», и он будет двигаться. И в конечном итоге доберется до цели. Но это будет медленно», — шутит Эверетт.

Исследователи поставили цель — ускорить планирование пути робота через семантический, окрашенный контекстом мир. Они разработали новый оценивающий алгоритм, который преобразует семантическую карту созданную ранее существующими алгоритмами SLAM, во вторую карту, учитывающую вероятность того, что робот находится неподалеку от цели.

“Мы руководствовались возможностью подмены одного изображения другим. Например вы берете фотографию кошки и делаете ее похожей на собаку”, — поясняет Эверетт. “Тоже самое и здесь. Вы берете один образ, который выглядит как карта окрестностей, и трансформируете его в другой образ, который также выглядит как карта окрестностей, но теперь окрашен в зависимости от того, насколько близки различные точки карты к конечной цели.”

Вновь созданная карта окрашена в серый цвет. Более темный цвет у мест далеких от цели, а более светлые объекты — это области, близкие к месту назначения. Например, тротуар на семантической карте закодирован желтым цветом. Но на новой карте алгоритм cost-to-go показывает его как более темную область, по сравнению с подъездной дорогой, изображение которой становится все светлее по мере приближения ее к входной двери — самой светлой области на новой карте.

Исследователи апробировали новый алгоритм используя спутниковые карты Bing, содержащие 77 домов городского района и трех пригородов. Система преобразовала семантическую карту в оценочную карту и наметила наиболее эффективный путь. Каждому спутниковому изображению были назначены свои семантические метки и цвета контекстным объектам в типичном переднем дворе, таким как серый для входной двери, синий для подъездной дорожки и зеленый для живой изгороди.

Во время этого тренировки команда применяла маски к каждому изображению, чтобы имитировать частичный вид, который зафиксирует камера робота когда он пересекает двор.

«Наша хитрость была в том, что мы предоставили системе большое количество различных изображений», — объясняет Эверетт. «Нам нужно было понять, как все это взаимосвязано.”

Затем исследователи протестировали свой подход в моделировании изображения совершенно нового дома, вне обучающего набора данных. Сначала они использовали ранее существовавший алгоритм SLAM для создания семантической карты. Затем ученые применили свою новую методику создания второй карты и поиска пути к цели — входной двери.

Новый метод cost-to-go, дал возможность роботу отыскать входную дверь на 189 процентов быстрее, чем когда он использовал классические навигационные алгоритмы, которые не учитывают контекст или семантику и вместо этого тратят чрезмерные усилия на изучение областей, которые вряд ли будут рядом с их целью.

Эверетт говорит, что результаты иллюстрируют, как роботы могут использовать контекст для эффективного поиска цели, даже в незнакомых несопоставленных средах.

“Если робот получил задание доставить пакет в место, где никогда не был, он может найти подсказки, которые раньше где-то видел”, — говорит Эверетт. 

Это исследование частично поддерживается компанией Ford Motor Company.