Несколько лет назад любимым модным словечком в мире бизнес-технологий было "Большие данные’ – отсылка к массовому сбору организациями информации, которая может быть использована для предложения ранее неизученных способов работы и распространения идей о том, каких стратегий им лучше придерживаться.

Изображение создано нейросетью NanoBanana в KolerskyAI

Становится все более очевидным, что проблемы, с которыми компании сталкивались при использовании больших данных в своих интересах, все еще остаются, и именно новая технология – искусственный интеллект – заставляет эти проблемы снова всплыть на поверхность. Без решения проблем, связанных с большими данными, внедрение искусственного интеллекта будет продолжать давать сбои.

Итак, какие проблемы мешают ИИ выполнять свои обещания?

Подавляющее большинство проблем связано с самими информационными ресурсами. Чтобы понять проблему, рассмотрим следующие источники информации, используемые в течение обычного рабочего дня.

В малом и среднем бизнесе:

  • Электронные таблицы, хранящиеся на ноутбуках пользователей, в Google Таблицах, облаке Office 365.
  • Платформа менеджера по работе с клиентами (CRM).
  • Обмен электронной почтой между коллегами, клиентами, поставщиками.
  • Документы Word, PDF-файлы, веб-формы.
  • Приложения для обмена сообщениями.

В корпоративном бизнесе:

  • Все вышеперечисленное, а также,
  • Системы планирования ресурсов предприятия (ERP).
  • Потоки данных в режиме реального времени.
  • Озера данных.
  • Разрозненные базы данных, лежащие в основе нескольких точечных продуктов.

Стоит отметить, что приведенный выше простой список не является исчерпывающим и не предназначен для этого. Он демонстрирует, что всего в пяти строках содержится около дюжины мест, где можно найти информацию. Что требовалось (возможно, все еще требуется) для больших данных и на чем основываются проекты с использованием искусственного интеллекта, так это каким-то образом объединить все эти элементы таким образом, чтобы компьютерный алгоритм мог разобраться в этом.

В цикле ажиотажа маркетингового гиганта Gartner в области искусственного интеллекта в 2024 году данные, готовые к использованию искусственного интеллекта, были размещены на восходящей кривой цикла ажиотажа, по оценкам, пройдет 2-5 лет, прежде чем они достигнут ‘плато производительности’. Учитывая, что системы искусственного интеллекта добывают данные, большинство организаций – за исключением организаций самого большого размера – не имеют фундамента, на котором можно строить, и могут не получить помощи искусственного интеллекта в своих усилиях еще 1-4 года.


Основная проблема внедрения искусственного интеллекта та же, что и с упорными инновациями в области больших данных, поскольку в прошлом они проходили через цикл ажиотажа – от запуска инноваций, пика завышенных ожиданий, спада разочарований, спада просветления до плато производительности – данные поступают во многих формах; они могут быть непоследовательными; возможно, они соответствуют другим стандартам; они могут быть неточными или предвзятыми; это может быть высокочувствительная информация или старая и, следовательно, неактуальная.

Преобразование данных таким образом, чтобы они были готовы к работе с искусственным интеллектом, остается процессом, который сегодня так же актуален (возможно, даже больше), как когда-либо. Те компании, которые хотят начать с нуля, могли бы поэкспериментировать со многими доступными в настоящее время платформами обработки данных и, как это становится общепринятым советом, могли бы начать с отдельных проектов в качестве тестовых площадок для оценки эффективности новых технологий.

Преимущество новейших систем подготовки и сбора данных заключается в том, что они предназначены для подготовки информационных ресурсов организации таким образом, чтобы данные могли использоваться платформами создания ценности с помощью искусственного интеллекта. Они могут предложить, например, тщательно закодированные ограждения, которые помогут обеспечить соответствие данных требованиям и защитить пользователей от доступа к предвзятой или коммерчески важной информации.

Но проблема создания согласованных, безопасных и хорошо сформулированных информационных ресурсов остается постоянной проблемой. По мере того, как организации получают все больше данных в ходе своей повседневной деятельности, составление актуальных информационных ресурсов, которые можно использовать, становится постоянным процессом. Там, где большие данные можно считать статичным активом, данные для использования искусственным интеллектом должны подготавливаться и обрабатываться как можно ближе к реальному времени.

Таким образом, сохраняется трехсторонний баланс между возможностями, риском и затратами. Никогда прежде выбор поставщика или платформы не был столь важен для современного бизнеса.

Статья переведена KolerskyAI

Изображение сгенерировано в NanoBanana