Вводная по системам управления знаниями
При построении систем управления знаниями используется, в том числе, и текстовая аналитика. Сегодня рассмотрим технологии и возможное применение текстовой аналитики.
Текстовая аналитика (Text analytics)
– это разносторонняя технология, позволяющая понимать смысл большого объема неструктурированного текста. Технология используется в самых разнообразных приложения в различных отраслях промышленности.
Пример из здравоохранения
Например, технология Text Miner применяется в области здравоохранения.
Рассмотрим на примере компании UnitedHealthcare, предоставляющей услуги по медицинскому страхованию и имеющей порядка 70 миллионов абонентов и 80 000 человек сотрудников.
Компания UnitedHealthcare имеет множество неструктурированного текста, который колеблется от заметок о взаимодействии с клиентами до медицинской документации.
Чтобы получить как можно больше понимания из своих информационных хранилищ, компания UnitedHealthcare выбрала одним из продуктов по текстовой аналитики SAS TextMiner, которая обладает функциональностью по:
- Извлечение сущности информации
- Синтаксический анализ
- Морфологический поиск
- Аналитика
Система SAS TextMiner предоставляет возможность анализа миллиарда строк текста в сжатые сроки, позволяя моделировать и анализировать информацию.
Например, осуществлять анализ разговоров с клиентами и сделанные заметки, для того чтобы определить какими вопросами обеспокоены клиенты и насколько успешно эти вопросы решаются сотрудниками компании.
С этим программным решением компания может изучить каждый звонок и убедиться, что он наилучшим образом обработан.
Также программное обеспечение SAS TextMiner позволяет искать закономерности, которые указывают на потенциальные возможности, например, на непонимание клиентом границ плана покрытия страховки.
Система позволяет компании предупреждать конфликтные ситуации, для обеспечения наилучшего качества обслуживания и качественного выполнения своих обязательств.
Четыре области деятельности Text analytics
Другое приложение по текстовой аналитике, позволит компании UnitedHealthcare исследовать данные отчетов здравоохранения, анализировать тексты в примечаниях докторов и медсестер, и изучать темы влияния лечения на результат.
Система по текстовой аналитики UnitedHealthcare позволяет выявлять модели лечения, в которых диагностические показатели не одинаковые, а модели лечения схожи.
Что поможет достичь наилучших результатов при лечении пациентов.
Руководитель по глобальному маркетингу продукции SAS Fiona McNeill, выделяет 4 области деятельности в текстовой аналитики:
- Возникающие вопросы и неблагоприятные события
- Анализ первопричин
- Прогнозирующая аналитика
- Разведка содержания
В качестве примера Fiona McNeill приводит компанию, которая используя технологию TextMiner, объединяет научную и медицинскую литературу, информацию из СМИ и других источников, предоставляя своим клиентам услуги по консалтингу и рекомендации по организации питания.
Fiona McNeill предлагает использовать TextMiner для выявления первопричин и прогнозирующей аналитики.
Например, информация по выполнению гарантийных обязательств является хорошим индикатором проблем продукта.
Такой анализ позволит выявить причины и проблемы на самых ранних стадиях, предупредить и избежать их появление у других клиентов.
Также такой подход повысит лояльность ваших клиентов и увеличит качество ваших продуктов.
Для детального анализа информации и выявления закономерностей Fiona McNeill рекомендует использовать 10% от всего объема информации.
Работа с объемом информации
Производимый в настоящее время большой объем информации является одновременно и активом и пассивом.
С одной стороны, понимание ценной информации из всего объема дает конкурентные преимущества, с другой стороны весь этот объем информации нужно где-то хранить и должным образом обрабатывать.
Основная ценность текстовой аналитики (Text analytics ) – это способность текстового анализа автоматически классифицировать информацию.
По словам Seth Earley, генерального директора компании Earley Associates, предоставляющей услуги в сфере управления контентом: «Такие процессы как извлечение сущности, кластеризация и определение моделей,- обнаруживают такую информацию высшего порядка, которой люди не пользовались, потому что не знали о ней».
Тестовая аналитика является жизненно важным инструментом в борьбе с большими данными, как говорит Seth Earley, существует большое количество источников как в структурированном виде (например, показатели продаж), так и не в структурированном (социальные сети, в которых потребители сообщают свои реакции на продукты).
И все сводится к тому, что количественные данные показывают
что происходит, но понимание почему это происходит дают не структурированные источники.
Например, посетитель сайта не может найти продукт.
Первопричина может быть как в проблеме навигации, как в проблеме описания продукта (контента сайта), может быть проблема в системе поддержки, а может быть и в самом продукте.
И как говорит Seth Earley технологии текстовой аналитики решают эти проблемы в режиме реального времени.
Аудио аналитика
Более 50% взаимодействий с клиентами осуществляется по телефону.
Это могут быть как клиенты, так и потенциальные клиенты.
Телефонные разговоры с клиентом являются не структурированной информацией, которая может быть проанализирована и переконвертирована в текст – сообщает Daniel Ziv, вице президент голосовой аналитики forVerint.
Как и текстовая аналитика, аудио аналитика использует для поиска ключевые слова.
Но в аудио аналитике есть и свои недостатки – система не распознает знаки препинания, сама по себе речь -обычно содержит большое число повторений.
Но и здесь есть типовые ключевые слова, которые являются индикаторами «зон риска по клиентам», например «смешно», «вы люди» (в нашей российской действительности набор таких слов намного разнообразнее =).
Анализ потенциальных клиентов «в зоне риска» позволяет формировать списки категорий клиентов в зоне риска, а подключение дополнительных консультантов, просматривающих этот список и обзванивающих этих клиентов (особенно высокодоходных клиентов), позволяет исключить отток клиентов.
Как сообщает Daniel Ziv , проведенное исследование показало, что решение по аудио аналитике и такой подход по обработке клиентов «в зоне риска» позволяет компании сохранять 86% клиентов, и, напротив, в случае если клиенты попадали «в зоны риска» и с ними не связывались консультанты, исследование показало 98% отказ клиентов от предоставляемых услуг.
Решения forVerint извлекают аудио, видео и текстовую информацию и распространяют через различные департаменты, интегрируясь в маркетинговые и CRM решения.
Поиск направлений
«Важным фактором, определяющим успех в использовании текстовой аналитики в системе управления знаниями является наличие сплоченной команды на местах» – как говорит Melissa Pippine, вице президент по маркетингу в компании Clarabridge.
Со снижением эффективности рекламы в печати и прямой рассылки по почте, ни для кого не секрет, что новых клиентов труднее заполучить.
Всем сотрудникам компании нужно понимать, что если они не будут слушать своих клиентов, то это будут делать их конкуренты, – говорит Melissa Pippine.
Некоторые компании, особенно в розничной торговле и телекоммуникациях, анализируют публикации Facebook и Tweets (twitter.com), которые адресованы проблемам их конкурентов.
Такой подход позволяет компаниям выстраивать свои маркетинговые компании вокруг выявленных проблем конкурентов, тем самым получая конкурентное преимущество.
Продукты компании Clarabridge сосредоточены на управлении потребительским опытом, и включают: аналитические решения, возможность совместной работы, возможности по формированию отчетов для акционеров в рамках всей компании, а также поддерживают технологию Hadoop.
О разновидности приложений в системах управления знаниями (от мирского к мошенничеству)
Не все приложения текстовой аналитики, представляющие значительную ценность, сложно устроены.
Как сообщает Tom Reamy, главный архитектор по знаниям в компании KAPS Group, одна компания разработала большую таксономию, но не обновляла ее 10 лет.
KAPS Group использует текстовую аналитику, чтобы выявить возникающие новые термины для разработки новых категорий и назначения метаданных.
Другое простое приложения, использующее текстовую аналитику в системах управления знаниями – защита от дублирования документов.
Как сообщает Tom Reamy, с помощью технологии можно выявить актуальную версию и удалить все не нужные версии документов в системе управления контентом.
Инструменты бизнес аналитики уже давно используются для выявления закономерностей в структурированных данных, которые указывают на мошенничество; текстовая аналитика используется для тех же целей.
Были проведены исследования, которые показали, что люди используют слова по разному: когда они лгут и когда они говорят правду.
Выявлены различия в моделях употребления слов, аналитика в обнаружении обмана достигает приблизительно 75% точности.
Барьеры использования текстовой аналитики все еще существуют, как у любой новой технологии.
По приведенным оценкам Reamy, сейчас рынок по текстовой аналитике растет порядка 20-25 % в год, что показывает, что потребность в обработке неструктурированного контента не собирается уменьшаться в ближайшее время.
Изучение контекста слов
Большая часть программного обеспечения по текстовому анализу использует статистические, семантические методы или аналитику, основанную на правилах или их комбинациях.
Nathan – программное обеспечение от компании ai-one, это технология для построения машинно-обучаемых приложений.
Nathan поглощает документы, чтобы сформировать модель информации, используя комбинацию слов и ассоциаций.
Система создает легкую онтологию, которая показывает отношения среди всех слов.
Одним из наиболее распространенных видов использования является система с условным названием «отпечатки пальцев», которая позволяет найти, сравнить и сопоставить тексты, которые имеют схожие идеи.
По словам Olin Hyde, вице президента по развитию бизнеса ai-one, решение Nathan подходит в случаях, когда идея может быть выражена с множеством различных сочетаний (комбинаций) слов и затруднителен поиск традиционным способом по ключевым словам.
Nathan описывается как «платформа изучения», т.к. спроектирован для усвоения и понимания информации в нескольких форматах:
- NathanAPP – как сервис ориентированная платформа (PaaS)
- NathanNODE – для развертывания в частном облаке
- NathanCORE – для встраивания в компьютеры и другие устройства, включая смартфоны
По словам Olin Hyde, Nathan использует тот же тип автономной параллельной обработки нейронов, как и человеческий мозг, поэтому он может анализировать текст быстрее и точнее.
———–
Используемые ресурсы:
Статья переведена и подготовлена на базе статьи «Text analytics: versatile and growing», Judith Lamont, Ph.D. Text analytics: versatile and growing
loading...