Компьютеры учатся видеть в высших измерениях

Компьютеры учатся видеть в высших измерениях

  • Компьютеры теперь могут водить машины, побеждать чемпионов мира в настольных играх, таких как шахматы и го, и даже писать прозу. Революция в искусственном интеллекте происходит в значительной степени от силы одного конкретного вида искусственной нейронной сети, дизайн которой вдохновлен связанными слоями нейронов в зрительной коре млекопитающих. Эти «сверточные нейронные сети» (CNN) оказались удивительно хорошими в изучении шаблонов двумерных данных, особенно в задачах компьютерного зрения, таких как распознавание рукописных слов и объектов на цифровых изображениях.

    Оригинальная история перепечатана с разрешения Журнал Quanta, редакционно независимая публикация Фонда Саймонса, чья миссия заключается в улучшении общественного понимания науки путем освещения научных исследований и тенденций в области математики и физических наук и наук о жизни.

    Компьютеры учатся видеть в высших измерениях

    Но при применении к наборам данных без встроенной плоской геометрии, скажем, моделей неправильной формы, используемых в трехмерной компьютерной анимации, или облаков точек, генерируемых самоходными автомобилями для отображения своего окружения, эта мощная архитектура машинного обучения не работает Что ж. Около 2016 года возникла новая дисциплина под названием «Глубокое геометрическое обучение» с целью выведения CNN из равнин.

    Читайте также

    • Подключение телевизора к маршрутизатору с помощью кабеля
      Подключите телевизор к компьютеру с помощью кабеля локальной сетиИногда вы хотите посмотреть фильм или поиграть в игры на большом экране телевизора, потому что монитор относительно маленький и ваши глаза быстро устают. Кроме того, я не хочу ждать, по...
    • Бесплатное обновление скорости Vodafone остается лучшим предложением оптоволоконной широкополосной связи сейчас
      Конечно, мы не жалуемся! Теперь это означает, что в среднем скорость составляет 63 МБ всего за 23 фунта в месяц, когда вы подписываетесь на пакет Superfast Fiber 2 от Vodafone или, другими словами, это довольно непревзойденное предложение в Интернете...
    • Как подключить два наушника к телефону
      Как подключить беспроводные наушники к моему телефону?Казалось бы, все просто, но не всем это удается. Мы расскажем вам все о беспроводных наушниках Bluetooth: как подключиться и что делать, если вы не можете.Казалось бы, все просто, но не всем это у...
    • Телевизионный сериал Loki представляет новостной репортаж Gugu Mbatha-Raw от Black Mirror
      Четвертый актерский состав после Тома Хиддлстона, Оуэна Уилсона и Софи Ди Мартино. Gugu Mbatha-Raw в утреннем шоу Сериал Локи выходит весной 2021 года на Дисней Хотзтар в Индии Мбата-Роу снялась в фильме «Красавица и чудовище», «Утреннее шоу» Произво...
    • Что такое последнее обновление на iPhone 6
      Обновите свой iPhone, iPad или iPod touchУзнайте, как обновить iPhone, iPad или iPod touch до последней версии iOS или iPadOS по беспроводной сети или с компьютера.На iPhone, iPad или iPod touch вы можете обновить iOS или iPadOS по беспроводной сети ...
    • Microsoft не заставит пользователей Office 365 перейти на Bing в конце концов
      Хорошая попытка, MicrosoftВ контексте: Microsoft, как известно, время от времени навязывает своим пользователям Windows 10 часто нежелательное программное обеспечение (и обновления программного обеспечения), но эта тенденция стала особенно неприятной...
    • Как переключить iPhone на русский
      Настройки клавиатуры для iPhone, iPad и iPod touchУзнайте, как использовать встроенные клавиатуры устройства в каждом приложении. Доступны переключения между клавиатурами, ввод одной рукой, использование сторонних клавиатур и другие функции.Изменить ...
    • Как обновить Android Samsung Galaxy Tab
      Как вручную обновить версию Android на планшете SamsungВ современном компьютерном мире все течет и меняется одним щелчком мыши. Разработчики и разработчики приложений пытаются быстро исправлять ошибки, но, к сожалению, для российских пользователей эт...

    Теперь исследователи создали новую теоретическую основу для построения нейронных сетей, которые могут изучать шаблоны на любой геометрической поверхности. Эти «калибровочно-эквивариантные сверточные нейронные сети», или калибровочные CNN, разработанные в Университете Амстердама и Qualcomm AI Research Тако Коэном, Морисом Вейлером, Беркаем Киканаоглу и Максом Веллингом, могут обнаруживать закономерности не только в двумерных массивах пикселей, но и на сферах и асимметрично изогнутых объектах. «Эта структура является довольно определенным ответом на эту проблему глубокого обучения на криволинейных поверхностях», — сказал Веллинг.

    Уже сегодня калибровочные CNN значительно превзошли своих предшественников по шаблонам обучения в смоделированных глобальных климатических данных, которые естественным образом отображаются на сфере. Алгоритмы могут также оказаться полезными для улучшения зрения дронов и автономных транспортных средств, которые видят объекты в 3D, и для обнаружения закономерностей в данных, собранных с нерегулярно изогнутых поверхностей сердца, мозга или других органов.

    Решение исследователей о том, чтобы получить глубокое обучение работе за пределами равнинной области, также имеет глубокие связи с физикой. Физические теории, описывающие мир, такие как общая теория относительности Альберта Эйнштейна и Стандартная модель физики элементарных частиц, обладают свойством, называемым калибровочной эквивалентностью. Это означает, что величины в мире и их отношения не зависят от произвольных систем отсчета (или «датчики»); они остаются неизменными независимо от того, движется ли наблюдатель или стоит на месте, и независимо от того, насколько далеко друг от друга находятся числа на линейке. Измерения, выполненные в этих разных датчиках, должны быть конвертируемыми друг в друга таким образом, чтобы сохранять основные взаимосвязи между вещами.

    Например, представьте, что вы измеряете длину футбольного поля в ярдах, а затем снова измеряете ее в метрах. Числа изменятся, но в предсказуемой форме. Точно так же два фотографа, снимающие объект с двух разных точек обзора, будут создавать разные изображения, но эти изображения могут быть связаны друг с другом. Калибровочная калибровка гарантирует, что физические модели реальности остаются последовательными, независимо от их перспективы или единиц измерения. И калибровочные CNN делают то же самое предположение о данных.

    Читайте также

    • Как очистить историю посещений на компьютере
      Как очистить историю просмотровВсе страницы, которые мы просматриваем в Интернете, записываются в специальный журнал. И если кто-то сидит за нашим компьютером, он может пойти туда. Это значит, что он сможет увидеть все места, куда мы ходили, и даже п...
    • Как подключить Samsung Watch к iPhone
      Как подключить фитнес-браслет к вашему Android-телефонуФитнес-браслет. это устройство, которое позволяет контролировать ряд параметров тела и повышает удобство общения во время занятий спортом и ведения активного образа жизни.Он может использоваться ...
    • Как отвязать Apple Iwatch от iPhone
      Apple Watch: сопряжение и стирание данныхПри разрыве пары с Apple Watch заводские настройки по умолчанию восстанавливаются.Если вы используете Apple Watch в Японии и добавили карту Suica в кошелек, вы должны извлечь карту Suica перед разрывом пары.Де...
    • Как перенести контакты на смартфон Android
      Перенос контактов с вашего телефона на Android: 4 простых и быстрых способа передачи контактов.Перенесите контакты телефонной книги со своего телефона Android на другую тему смартфона Android Рано или поздно каждый владелец смартфона или планшета And...
    • Как настроить телевизор Hyundai на цифровой
      Настройки Samsung Digital TVЦифровое телевидение появилось несколько лет назад и с тех пор активно используется. И это понятно. Во-первых, после того, как вы завершили настройку только один раз, вам не нужно постоянно настраивать антенну или настраив...
    • Предварительные заказы Galaxy S20 стартуют 21 февраля
      Samsung начнет предварительные заказы Galaxy S20 21 февраля. Устройства будут доступны в магазине 6 марта. Это также означает, что Galaxy S20, скорее всего, появится за пару дней до даты запуска 6 марта. Если вы делаете предварительный заказ достаточ...
    • Как отправить фото с телефона на телефон
      4 способа отправки фотографий с компьютера на телефонВсем привет! Сегодня мы рассматриваем 4 способа отправки фотографий на телефон через компьютер (ПК). Уже знаете, что это можно сделать через интернет или обычное локальное соединение?Многие люди уж...
    • Как записать разговор на iPhone iPhone
      Как записать телефонный разговор на iPhone?Запись телефонного разговора без уведомления другого человека в США запрещена законом. Apple. американская компания и строго соблюдает законы этой страны. Поэтому в iPhone нет встроенных регистраторов телефо...

    «Та же идея [от физики], что нет особой ориентации — они хотели внедрить ее в нейронные сети», — сказал Кайл Крэнмер, физик из Нью-Йоркского университета, который применяет машинное обучение к данным физики элементарных частиц. «И они выяснили, как это сделать».

    Майкл Бронштейн, специалист по информатике в Имперском колледже Лондона, ввел термин «геометрическое глубокое обучение» в 2015 году, чтобы описать возникающие попытки выйти из равнинной местности и спроектировать нейронные сети, которые могли бы изучать шаблоны в непланарных данных. Термин — и исследовательская работа — скоро завоевал популярность.

    Бронштейн и его сотрудники знали, что выход за пределы евклидовой плоскости потребует от них переосмысления одной из базовых вычислительных процедур, которые сделали нейронные сети настолько эффективными в первую очередь для распознавания 2D-изображений. Эта процедура, называемая «сверткой», позволяет слою нейронной сети выполнять математическую операцию над небольшими участками входных данных, а затем передавать результаты на следующий уровень в сети.

    Компьютеры учатся видеть в высших измерениях

    «Вы можете думать о свертке, грубо говоря, как о скользящем окне», — объяснил Бронштейн. Сверточная нейронная сеть скользит по многим из этих «окон» по данным, таким как фильтры, каждое из которых предназначено для обнаружения определенного типа паттерна в данных. В случае фотографии кошки обученный CNN может использовать фильтры, которые обнаруживают низкоуровневые элементы в необработанных входных пикселях, таких как края. Эти функции передаются на другие уровни в сети, которые выполняют дополнительные свертки и извлекают функции более высокого уровня, такие как глаза, хвосты или треугольные уши. CNN, обученный распознавать кошек, в конечном итоге будет использовать результаты этих многослойных сверток, чтобы назначить метку — скажем, «кошка» или «не кошка» — всему изображению.

    You may also like