зык — уникальная человеческая способность и воплощение нашего интеллекта. Но через ИИ — в частности, через обработку естественного языка (NLP) — мы предоставляем машинам языковую функциональность, открывая новую область возможностей того, как мы будем работать с ними.

Сегодня вы можете зайти в темную гостиную и попросить Алексу включить умный свет до приятной 75% -ной яркости. Или вы можете запросить информацию о погодных условиях на другом конце света. Прогресс, достигнутый в индустрии, был показан в недавней демо-версии Duplex от Google, в которой ИИ-агент созванивался с бизнесами и назначал встречи. То, что когда-то казалось научной фантастикой, теперь реальность, но для поддержания действительно высококлассных отношений человек-машина, машины должны быть способными к более интуитивным, контекстуальным и естественным разговорам – это все еще остается сложной задачей. Я строил свою карьеру, сосредотачиваясь на NLP, области исследований, почти такой же старой, как и сам ИИ, и мы все еще находимся на начальной стадии этого путешествия.

Язык — это механизм обмена информацией и связи с окружающими, но машины должны понимать тонкости языка и то, как мы, люди, общаемся, используя его. Успехи в анализе эмоциональной окраски, ответы на вопросы и совместное многозадачное обучение позволяют ИИ по-настоящему понимать людей и то, как мы общаемся.

Анализ эмоциональной окраски

Язык по своей сути труден. Он постоянно развивается, он сильно нюансирован, и среднестатистическому человеку требуются годы, чтобы достичь высокого уровня владения языком. С анализом эмоциональной окраски, мы можем использовать ИИ для понимания определенных вещей о некоем высказывании, например, упоминание бренда или обзор фильма является положительным, отрицательным или нейтральным. Но мы можем также разобраться в таких вещах, как отношение и намерения спикера (Она сердится? Счастлива? Удивлена? Готова купить?). От обслуживания клиентов до модерации онлайн-сообществ до алгоритмической торговли чрезвычайно важно, чтобы компании могли понимать общественное мнение по отношению к бренду, анализируя тысячи твитов или сотни обзоров продуктов мгновенно.

Анализ эмоциональной окраски уже используется некоторое время, но он не всегда был очень точным. Однако это меняется по мере достижений в NLP. В Salesforce, где я руковожу исследовательскими работами, наша услуга Einstein AI позволяет брендам получать в режиме реального времени анализ настроений в электронных сообщениях, социальных сетях и текстах чатов, чтобы обеспечить более эффективное обслуживание клиентов. Точный анализ эмоциональной окраски позволяет, например, обслуживающим агентам получить представление о том, каким недовольным клиентам нужно помочь в первую очередь или кому направить рекламные предложения. Также возможно выявить недостатки продукта, измерить общую удовлетворенность продуктом и даже промониторить восприятие бренда через каналы социальных сетей. Другие технические компании предлагают аналогичные услуги.

Нам также нужен контекст. Предположим, у вас есть мыльный бизнес и кто-то твитнул «Это мыло действительно хорошее для младенцев». Это можно рассматривать как позитивный отзыв о мыле для младенцев или язвительный комментарий, что это мыло ужасно для детей. В этом утверждении так много контекста, и это довольно простое высказывание! Обучение ИИ анализу всех возможных значений конструкции предложения и понимания того, что человек имеет в виду в данном контексте, является одной из важнейших задач в исследованиях NLP. Это требует как маркированных данных для улучшения модели обучения, так и новых моделей, которые могут изучать контекст и совместно использовать знания по многим различным задачам одновременно.

Ответы на вопросы

По мере того как NLP будет лучше распознавать значение текстов, интеллект цифровых ассистентов, помогающих управлять нашей жизнью, так же улучшится. Такие приложения, как Siri и Google Assistant, уже предоставляют довольно хорошие ответы на общие вопросы и выполняют довольно простые команды. В идеале, однако, мы должны иметь возможность задавать нашим компьютерам произвольные вопросы и получать хорошие ответы.

Один из способов дать лучшие ответы — убедиться, что компьютер понимает вопрос. Если вы спросите: «Когда прибудет мой самолет?», как компьютер узнает, говорите ли вы о своем рейсе или деревянной модели, которую вы заказали на Amazon? Компьютеры все лучше могут угадывать смысл через более глубокое понимание семантики, а также более разумное использование контекстуальных данных. В NLP мы выясняем, как преподать каждый из этих уровней контекста, чтобы ИИ мог обрабатывать все сразу и не пропускать важную информацию.

Например, динамические сети взаимодействия могут интерпретировать один документ по-разному в зависимости от того, какие вопросы задавали сети — «Какая команда представляла NFC в Super Bowl 50?» Или «Кто сделал тачдаун в четвертой четверти?» С помощью этой условной интерпретации она может затем итеративно выдвигать гипотезу о нескольких ответах, чтобы достичь наилучшего, наиболее точного результата.

Совместное многозадачное обучение

Научное сообщество умеет создавать модели ИИ, которые выполняют одну задачу очень хорошо. Но более интуитивные, диалоговые и контекстные интерфейсы потребуют модель ИИ, которая постоянно учится, интегрируя новые задачи со старыми и обучаясь выполнению все более сложных задач. Это относится к ИИ в целом, но в особенности важно, когда речь заходит о языке, что требует гибкости.

Вопрос «Кто мои заказчики?» представляет собой достаточно простую задачу: создать список заказчиков. Но как насчет вопроса «Кто мои лучшие заказчики на Тихоокеанском Северо-Западе для конкретного продукта?» Теперь мы добавили уровень сложности, который требует целого ряда интегрированных задач для ответа на квалифицирующие вопросы, такие как: Как определить кто «лучший»? Где находится каждый заказчик? Какие факторы способствуют тому, чтобы один заказчик интересовался одним продуктом по сравнению с другим? Добавляя один элемент к запросу, сложность вопроса резко возрастает.

Salesforce Research недавно создала Natural Language Decathlon, программу, которая позволяет объединить решение 10 самых сложных задач NLP в одной модели:

  1. ответы на вопросы, 
  2. машинный перевод, 
  3. обобщение, 
  4. формирование рассуждений на естественном языке, 
  5. анализ эмоциональной окраски, 
  6. присвоение семантических ролей, 
  7. извлечение отношений, 
  8. целенаправленный диалог, 
  9. генерация запросов в базе данных 
  10. определение к какому субъекту относится местоимение. 

Используя многозадачную модель ответ-вопрос, которая ставит каждую задачу в качестве ответа на вопрос, единая модель совместно изучает и обрабатывает различные задачи без каких-либо конкретных параметров или модулей. Это означает не только то, что специалистам по обработке данных больше не нужно создавать, обучать и оптимизировать отдельные модели для каждой задачи, но это также означает, что модель будет иметь возможности обучения с нуля — другими словами, модель может решать задачи, которые не видела раньше или которым не была специально обучена.

Поскольку исследователи продолжают улучшать модели, подобные этой, мы видим, что интерфейсы ИИ становятся более умными, поскольку они решают более сложные задачи.


Источник : edwvb.blogspot.com

Похожая запись