Новости

Новая технология потоковой обработки чеков

Новая технология потоковой обработки чеков

5 лет назад, с появлением рынка онлайн-касс и операторов фискальных данных, начался новый этап технологического изменения сферы розничной торговли и услуг

Алексей Баров, генеральный директор «Платформы ОФД», крупнейшего оператора фискальных данных страны, на специальной пресс-конференции компании отметил, что благодаря ОФД за прошедшие пять лет появились новые сервисы для бизнеса, связанные с оптимизацией издержек, автоматизацией бухгалтерских задач, анализом продаж. На агрегированных фискальных данных сформировалась Big Data.

Постепенно базовая задача ОФД трансформировалась в «комплексную» услугу. Через оператора фискальных данных предприниматели и организации сейчас решают блок вопросов, включая:

·      работу с системой маркировки

·      электронный документооборот

·      электронную отчетность в госорганы

·      инструменты контроля торговли, аналитику продаж.

Сервисы ОФД помогают сделать эти бизнес-процессы простыми и удобными.

Драйверами цифрового развития торговли на ближайшие годы станут ЭДО (электронный документооборот) и маркировка товаров. Поэтому растёт интерес к связанным с этими направлениями решениям.

«Платформой ОФД» зафиксированы 3-кратный рост (в сравнении «год к году») подключений клиентов к сервису по работе с цифровой маркировкой товаров, 2-кратный рост – к системе электронного документооборота и 2-кратный рост – к сдаче электронной отчетности.

Предприниматели активно пользуются сервисами оператора фискальных данных в режиме одного окна:

·      маркировка товаров – ежедневно в систему Честный ЗНАК передается 10 млн кодов маркировки в день (в прошлом году было 3 млн кодов). Для магазинов разработан комплексный сервис «Учет марок»

·     ЭДО (электронный документооборот) – ежедневно клиенты компании через ЭДО отправляют 3,5 тыс. документов (в прошлом году было 2 тыс документов). Растет популярность сервиса «Платформа ЭДО»

·   электронная отчетность – ежедневно в системе проходит 1500 документов (в прошлом году было 600 документов). Для упрощения работы с электронными документами создан сервис «Платформа Госотчет».

До 2024 года маркировка станет обязательной для большинства категория розничной торговли. Она вводится поэтапно и сейчас уже распространяется на такие категории, как  табачная продукция, лекарства, обувь, некоторые виды одежды и текстиля, парфюмерия, шины и покрышки.

Также в течение 3 лет планируется активное вовлечение бизнеса в применение системы ЭДО. В рамках проекта «Цифровая экономика», государство намерено перевести в электронную форму 90-95% счетов-фактур, не менее 70% товарных и транспортных накладных, участвующих в хозяйственном обороте. Уже сейчас многие предприниматели осваивают электронный документооборот, чтобы автоматизировать процесс работы, экономить время сотрудников и свести к минимуму ошибки при работе с документами.

«Платформа ЭДО» регулярно обнаруживает грамматические ошибки, опечатки и сокращения, которые  допускаются в 60-65% кассовых чеков из магазинов

«Часто в чеках встречается короткое наименование товара и его характеристик, либо в названии допущены ошибки или опечатки. Это связано с ограничениями по объему символов в строках фискальных документах, которые выдаются покупателю. Другая причина – пресловутый человеческий фактор.

Благодаря технологиям Machine Learning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию. Это позволяет находить смыслы в наборе букв и цифр. Сегодня такая потоковая обработка охватывает до 21 миллиона товаров (SKU) из 3,5 тыс. категорий, с 6 уровнями вложенности. С ростом объема данных, технология будет совершенствоваться и становиться «умнее». Мы планируем развивать это направление еще интенсивнее», - отметил Алексей Баров.

IT-компания «Платформа ОФД» ежедневно обрабатывает 48 - 50 млн кассовых чеков в день. В системе компании уже 55 млрд фискальных документов.

На основе накопленного опыта работы с агрегированными обезличенными данными – компания разработала собственное ноу-хау - технологию обработки коротких текстов, которая позволяет точно определять и идентифицировать товары и категории, указанные в чеках.

Процесс обработки происходит в режиме реального времени, позволяя в «потоке» фискальных документов скоростью более 1 000 транзакций в секунду -  классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие грамматические ошибки.

База для работы с короткими текстами «Платформы ОФД» на данный момент включает 5 млрд уникальных записей товаров, 150 млн написаний товаров в день. На потоке определяется более 3 млн брендов. При этом данные для классификации агрегируются как из чеков, так и из свободного доступа (отраслевые классификаторы/ каталоги с сайтов ретейлеров/ данные маркировки).

Ноу-хау помогло выявить, какова доля чеков с сокращениями и ошибками. По оценкам «Платформы ОФД», грамматические ошибки, опечатки и сокращения ежедневно допускаются в 60-65% всех чеков из продуктовой розничной торговли. При этом еще два года назад этот показатель был на уровне 80-85%. Меньше всего неточностей в фискальных документах организаций и предпринимателей сектора медицинских услуг – порядка 20-25%.

Аналитика имеющихся данных позволяет сделать, например, рекламуу точечной и действенной. Так, например анализ чеков магазинов и киосков вокруг вузов позволил правильно подобрать ассортимет продукции, пользующейся наибольшим спроом у студентов.

 

 

Перейти к архиву >>

НАШИ ПАРТНЕРЫ

           

Создание сайтов NewMark