Новая технология потоковой обработки чеков
Новая технология потоковой обработки чеков
5 лет назад, с появлением рынка онлайн-касс и операторов фискальных данных, начался новый этап технологического изменения сферы розничной торговли и услуг
Алексей Баров, генеральный директор «Платформы ОФД», крупнейшего оператора фискальных данных страны, на специальной пресс-конференции компании отметил, что благодаря ОФД за прошедшие пять лет появились новые сервисы для бизнеса, связанные с оптимизацией издержек, автоматизацией бухгалтерских задач, анализом продаж. На агрегированных фискальных данных сформировалась Big Data.
Постепенно базовая задача ОФД трансформировалась в «комплексную» услугу. Через оператора фискальных данных предприниматели и организации сейчас решают блок вопросов, включая:
· работу с системой маркировки
· электронный документооборот
· электронную отчетность в госорганы
· инструменты контроля торговли, аналитику продаж.
Сервисы ОФД помогают сделать эти бизнес-процессы простыми и удобными.
Драйверами цифрового развития торговли на ближайшие годы станут ЭДО (электронный документооборот) и маркировка товаров. Поэтому растёт интерес к связанным с этими направлениями решениям.
«Платформой ОФД» зафиксированы 3-кратный рост (в сравнении «год к году») подключений клиентов к сервису по работе с цифровой маркировкой товаров, 2-кратный рост – к системе электронного документооборота и 2-кратный рост – к сдаче электронной отчетности.
Предприниматели активно пользуются сервисами оператора фискальных данных в режиме одного окна:
· маркировка товаров – ежедневно в систему Честный ЗНАК передается 10 млн кодов маркировки в день (в прошлом году было 3 млн кодов). Для магазинов разработан комплексный сервис «Учет марок»
· ЭДО (электронный документооборот) – ежедневно клиенты компании через ЭДО отправляют 3,5 тыс. документов (в прошлом году было 2 тыс документов). Растет популярность сервиса «Платформа ЭДО»
· электронная отчетность – ежедневно в системе проходит 1500 документов (в прошлом году было 600 документов). Для упрощения работы с электронными документами создан сервис «Платформа Госотчет».
До 2024 года маркировка станет обязательной для большинства категория розничной торговли. Она вводится поэтапно и сейчас уже распространяется на такие категории, как табачная продукция, лекарства, обувь, некоторые виды одежды и текстиля, парфюмерия, шины и покрышки.
Также в течение 3 лет планируется активное вовлечение бизнеса в применение системы ЭДО. В рамках проекта «Цифровая экономика», государство намерено перевести в электронную форму 90-95% счетов-фактур, не менее 70% товарных и транспортных накладных, участвующих в хозяйственном обороте. Уже сейчас многие предприниматели осваивают электронный документооборот, чтобы автоматизировать процесс работы, экономить время сотрудников и свести к минимуму ошибки при работе с документами.
«Платформа ЭДО» регулярно обнаруживает грамматические ошибки, опечатки и сокращения, которые допускаются в 60-65% кассовых чеков из магазинов
«Часто в чеках встречается короткое наименование товара и его характеристик, либо в названии допущены ошибки или опечатки. Это связано с ограничениями по объему символов в строках фискальных документах, которые выдаются покупателю. Другая причина – пресловутый человеческий фактор.
Благодаря технологиям Machine Learning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию. Это позволяет находить смыслы в наборе букв и цифр. Сегодня такая потоковая обработка охватывает до 21 миллиона товаров (SKU) из 3,5 тыс. категорий, с 6 уровнями вложенности. С ростом объема данных, технология будет совершенствоваться и становиться «умнее». Мы планируем развивать это направление еще интенсивнее», - отметил Алексей Баров.
IT-компания «Платформа ОФД» ежедневно обрабатывает 48 - 50 млн кассовых чеков в день. В системе компании уже 55 млрд фискальных документов.
На основе накопленного опыта работы с агрегированными обезличенными данными – компания разработала собственное ноу-хау - технологию обработки коротких текстов, которая позволяет точно определять и идентифицировать товары и категории, указанные в чеках.
Процесс обработки происходит в режиме реального времени, позволяя в «потоке» фискальных документов скоростью более 1 000 транзакций в секунду - классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие грамматические ошибки.
База для работы с короткими текстами «Платформы ОФД» на данный момент включает 5 млрд уникальных записей товаров, 150 млн написаний товаров в день. На потоке определяется более 3 млн брендов. При этом данные для классификации агрегируются как из чеков, так и из свободного доступа (отраслевые классификаторы/ каталоги с сайтов ретейлеров/ данные маркировки).
Ноу-хау помогло выявить, какова доля чеков с сокращениями и ошибками. По оценкам «Платформы ОФД», грамматические ошибки, опечатки и сокращения ежедневно допускаются в 60-65% всех чеков из продуктовой розничной торговли. При этом еще два года назад этот показатель был на уровне 80-85%. Меньше всего неточностей в фискальных документах организаций и предпринимателей сектора медицинских услуг – порядка 20-25%.
Аналитика имеющихся данных позволяет сделать, например, рекламуу точечной и действенной. Так, например анализ чеков магазинов и киосков вокруг вузов позволил правильно подобрать ассортимет продукции, пользующейся наибольшим спроом у студентов.
Создание сайтов NewMark