РосРоскошь

РосРоскошь

Поиск закупок дорогих машин с помощью текстового анализа проектной документации. Цель данного проекта: автоматически находить закупки дорогих машин стоимостью от 1 000 000 р.

Актуальность проблемы:

  1. Детали гос-закупки (тип автомобиля и количество) находятся в документации, анализировать которую затратно для человека. Так необходимо не путать закупки автомобилей скорой помощи, 10 автомобилей Lada Kalina и одного Toyota Land Cruiser. Согласно проведенному анализу за 2013 г., каждый день появляются заказы автомобилей категории Люкс, оплачиваемые из средств бюджета.

Выполненные задачи проекта:

  1. Поиск контрактов по закупке легковых автомобилей через API ГосЗатраты
  2. Поиск документации по заключенным контрактам через сайт zakupki.gov.ru
  3. Создание статистической модели анализа текстов, способной выделять названия дорогих автомобилей, учитывающей возможные ошибки в написании, русские названия и вариативность лексики названий моделей автомобилей
  4. Анализ проектной документации разных форматов(PDF, Ms Word, Ms Excel, архивы)

Развитие проекта:

Модель можно масштабировать на поиск именных сущностей из других предметных областей

blog comments powered by Disqus

Проект Госзатраты размещает информацию, полученную исключительно из официальных источников.

Редакция Госзатрат не несет ответственности за публикацию неточных, неполных или неверных данных о юридических лицах, а также за раскрытие персональных данных физических лиц в случаях, если такие данные опубликованы на официальных источниках.

Запросы на исправление таких данных на сайте Госзатрат принимаются исключительно через форму «Напишите нам!» и рассматриваются не менее 5 рабочих дней.