Glagol – СКОРО во всех телефонах страны!
В настоящие время автоматизация всех процессов приняла лавинообразный эффект. Это явление не могло пройти мимо нашей компании и мы создали "Glagol"
В закладки
Откуда ноги растут? Наша компания занимается call-центрами уже 5 лет. А лично я в этом направлении 7 лет, и имел опыт руководства call центром Сбербанка России. Также вторым направлением бизнеса у нас была разработка программного обеспечения под заказ.
И вот в один прекрасный день мы сидели за столом на совещании и подняли вопрос об автоматизации разговоров операторов. И в голову пришла мысль о создании робота, который смог бы заменить операторов первой линии. Сказано – сделано… мы приступили к разработке.
Это, что получилось в итоге:
1:54
2
×1
Тут надо отметить один момент. Мы начали разработку именно с архитектуры самих разговоров (как люди ведут разговор), а не с технологии (каким образом это запрограммировать). Это было обусловлено тем, что в первую очередь мы – это call-центр, и наши клиенты не должны были заметить разницы между нашими операторами и "роботом". В этом у нас фундаментальное отличие от подобных разработок.
По началу все было очень топорно. Все технологии, которые существовали, хоть и охватывали большой кусок разработки, но не хватало в них самого важного: КАК и КУДА вести диалог. И тут на выручку пришла великая и могучая МАТЕМАТИКА, а именно матричная алгебра (благо с ней мы знакомы очень близко). Создали ядро, которое, как человек, могла вести диалог. Прыгая с темы на тему, помня все, что говорили, подстраиваться под диалог и настаивать на своем. Мы подцепили различные сервисы распознавания и генерации речи. И тут пошли косяки:
  • Сгенерированная речь очень НЕчеловекоподна.
  • Распознавание неточное (ни один сервис не распознавал речь с необходимой точностью – ни великий Яндекс, ни страшный и огромный Google.
И тут появился клиент, который хотел нашу разработку, хоть она и не была полностью готова. А клиент был очень хороший.
Осознавая, что обратного пути нет, мы принялись за работу.
  • Мы разработали систему записи и склеивания звуковых файлов. Это не только система, но и список рекомендаций к процессу записи аудио файлов.
Теперь люди не отличали речь робота и речь живого оператора.
Женский голос - робот
  • Понимая, что обучить свою нейронную сеть для распознавания у нас не хватит времени, мы сосредоточились на адаптации того, что передают нам API сторонних систем по распознаванию (таких как Яндекс, Google и так далее).
У нас получилась система смыслов, которая учится на диалогах, и адаптирует полученные данные по API в смысловой контекст. Если проще, система предполагает, что в этом смысловом ряду не может быть того, что она услышала, и подбирает похожие слова или фразы под звучание (например: “Да, говорите” и “Договорились” звучание у этих единиц похоже, а вот использование в смысловой конструкции разное).
Теперь точность прохождения блоков выросла.
  • После всех манипуляций с кодом, мы подключили первого клиента. Это большая компания, которая занимается ценными бумагами.
Клиент остался доволен.
После обучения системы для клиента, мы провели небольшое состязание между человеком и нашим ”роботом”, они звонили по одной базе, деленной "рандомно". По итогам у человека конверсия 11%, а у нашего робота 12%. Вот так люди и начинают проигрывать компьютерам.
После этого к нам начали подключаться новые клиенты. При этом мы никак не были представлены на рынке. Про нас просто рассказывали друг другу довольные клиенты (впервые видел, как работает сарафанное радиоO)
Но был один недостаток – наша система довольно дорога в настройке, приходиться адаптировать код под конкретного клиента, что занимает часы работы программистов. Немного подумав, мы решили, что надо дать возможность любому человеку, без навыков и знаний в программировании, использовать нашу разработку. Сказано- сделано...Мы приступили к разработке(где-то я это уже писалO)
Для начала надо было определиться с концепцией, и у нас получилось четыре пункта:
  • Это должен быть конструктор с визуальным интерфейсом.
  • В него должны подключаться все API по распознаванию и генерации речи, при этом наши разработки по интерпретации текста, получаемого по API, и система создания звонка из записей должны быть в этой системе.
  • В систему должны заводиться свои sip линии.
  • И все должно быть очень гибко.
Как оказалось, разработать подобного монстра не так уж и просто. Сама система есть сочетание матричной алгебры и нейронных сетей. А пользователю не надо знать подобных вещей. И вот спустя полгода разработки интерфейса, у нас появилась первая версия личного кабинета. Урааааа =))
Теперь почти любой человек, после небольшого обучения может создавать своих “роботов” для входящих и исходящих звонков. У нас получился своеобразный конструктор для роботов.
P. S.Выбрал VC для публикации отчетов о нашем дальнейшем развитии, так что ждите новых статей о наших подвигах в будущем
Материал опубликован пользователем. Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Комментарии