Как точная наука о данных использует ИИ с помощью Wolfram Research

Математические формулы и фигура

Порой сложно отделить реальность технологий от шумихи и рекламных сообщений, которые ежедневно осаждают наши почтовые ящики. За последние пять лет мы, вероятно, слишком много слышали о таких темах, как метавселенная, блокчейн и виртуальная реальность. В настоящее время мы находимся в разгаре ажиотажа вокруг часто злоупотребляемого термина «ИИ», и только время покажет, будет ли этот шум воспринят как нечто незначительное.

Новости об Искусственном Интеллекте (AI News) взяли эксклюзивное интервью у Джона МакКлуна, директора по техническим коммуникациям и стратегическому развитию в одной из самых зрелых организаций в сфере вычислительного интеллекта и научных инноваций — Wolfram Research, чтобы помочь нам углубиться в современные представления об ИИ и его практическом применении.

Джон работает в Wolfram Research уже 32 года в различных ролях и в настоящее время возглавляет команду европейских технических служб. Обученный как математик и обладающий опытом во многих аспектах анализа данных, мы начали наше интервью с просьбы описать деятельность Wolfram в формате краткой презентации (elevator pitch).

Джон МакКлун
Джон МакКлун

«Наша ценностная позиция заключается в том, что мы знаем вычисления и технологии Wolfram. Мы адаптируем наши технологии к проблеме, с которой сталкивается организация, и это охватывает широкий спектр задач. У нас нет “типичного” клиента. То, что их объединяет, — это то, что они занимаются чем-то инновационным.»

«Мы занимаемся решением проблем, для которых нужны вычисления и наука о данных. Мы создаём единую платформу для вычислений, и когда мы говорим о вычислениях, мы имеем в виду технические процессы, такие как инженерные расчёты, анализ данных и машинное обучение. Это включает такие вещи, как анализ социальных сетей, бионауки, актуарные расчёты и финансовые вычисления. Абстрактно говоря, это всё сущностно математические задачи.»

«Наш мир — это все эти структурированные области, в которые мы за 30 лет вложили усилия по созданию различных онтологий. У нас есть символическое представление не только математики, но и таких вещей, как графы и сети, документы, видео, изображения, аудио, временные ряды, а также реальные сущности, такие как города, реки и горы. Моя команда делает самую интересную часть — находит этим технологиям полезное применение!»

«Мы рассматриваем ИИ как ещё одну форму вычислений. Есть разные алгоритмы, разработанные за долгие годы, некоторые из них появились сотни лет назад, другие — всего несколько десятилетий назад. Генеративный ИИ просто добавляется к этому списку.»

Заявления об ИИ в 2024 году порой кажутся излишне оптимистичными, поэтому важно трезво оценивать его возможности, понимая, в чём он хорош, а где пока не справляется.

«Человеческий интеллект по-прежнему остаётся стратегическим элементом. Вы не скажете, что через пять лет ИИ будет управлять вашей компанией и принимать решения. Генеративный ИИ очень красноречив, но ненадёжен. Его задача — выглядеть правдоподобно, а не быть точным. И особенно в тех областях, которыми занимается Wolfram, он плох, потому что скажет вам что-то, что будет похоже на математический ответ, но на самом деле таковым не является.»

Работа Wolfram Research в этом контексте сосредоточена на том, что Джон называет «символическим ИИ». Для того чтобы объяснить разницу между генеративным и символическим ИИ, он привёл аналогию с моделированием траектории брошенного мяча. Генеративный ИИ учился бы на тысячах подобных бросков и смог бы представить описание этой траектории. «Это описание было бы правдоподобным. Такой тип модели богат данными, но плохо понимает суть.»

Wolfram Research

Символическое представление брошенного мяча, с другой стороны, включало бы дифференциальные уравнения для движения по траектории и представление таких элементов, как, вязкость атмосферы, трение и многие другие факторы. «Тогда можно было бы спросить: “Что произойдёт, если я брошу мяч на Марсе?” И [модель] дала бы точный ответ. Она не ошибётся».

Идеальный способ решения бизнес-задач (или научных, медицинских или инженерных проблем) – это комбинация человеческого интеллекта, символического рассуждения, которое воплощено в Wolfram Language, и того, что мы сегодня называем ИИ, выступающего в роли связующего элемента. ИИ – отличная технология для интерпретации смысла и работы как интерфейс между компонентами.

«Один из интересных аспектов заключается в том, что мы превращаем естественный язык в некую структурированную информацию, с которой можно производить расчёты. Человеческий язык очень хаотичен и неоднозначен, и генеративный ИИ очень хорошо справляется с преобразованием его в структуру. Как только вы попадаете в структурированный мир чего-то, что синтаксически формально, тогда вы можете с этим работать».

Недавний пример комбинации «традиционного» ИИ с работой Wolfram касался медицинских записей:

«Недавно мы делали проект по обработке медицинских отчётов, которые были как рукописными, так и напечатанными, и цифровыми. Но они содержат слова, и попытка проводить статистику на основе этих данных невозможна. Поэтому нужно использовать генеративный ИИ для преобразования всех этих слов в такие категории, как: была ли это предотвратимая смерть? Да. Нет. Это чёткая структура в виде ключ-значение. А затем, когда информация структурирована (например, в виде JSON или XML, или любой другой выбранной вами структуры), мы можем использовать классическую статистику, чтобы начинать искать тенденции: “Есть ли тренд? Может ли быть сделан прогноз? Был ли COVID причиной увеличения числа вреда в больницах?” Это понятные, чёткие вопросы, которые можно решать символически, используя такие вещи, как средние, медианы и модели».

Во время нашего интервью Джон также дал краткое изложение своей презентации, в которой примером работы его организации выступало вымышленное предприятие по производству арахисовых конфет. Какие могут быть последствия смены определённого ингредиента или изменения какого-то аспекта рецепта для срока годности продукта?

«Крупные языковые модели (LLMs) могут сказать: “О, они, вероятно, продержатся несколько недель, потому что арахисовые конфеты обычно лежат на полках несколько недель”. Но если обратиться к вычислительной модели, которая может учитывать ингредиенты, то можно рассчитать и узнать, что этот продукт должен храниться восемь недель, прежде чем испортится. Или как это изменение может повлиять на производственный процесс? Вычислительная модель может подключиться к цифровой модели (digital twin) завода и выяснить: “Это замедлит процесс на 3%, и ваша продуктивность снизится на 20%, потому что создаст узкое место здесь”. LLMs отлично подходят для того, чтобы связывать вас и ваш вопрос с моделью, математикой, наукой о данных или базой данных. И это действительно интересная трёхсторонняя встреча умов».

Источник: Artificial Intelligence News

Интересно? Поделиться: