РосРоскошь
Поиск закупок дорогих машин с помощью текстового анализа проектной документации. Цель данного проекта: автоматически находить закупки дорогих машин стоимостью от 1 000 000 р.
Актуальность проблемы:
- Детали гос-закупки (тип автомобиля и количество) находятся в документации, анализировать которую затратно для человека. Так необходимо не путать закупки автомобилей скорой помощи, 10 автомобилей Lada Kalina и одного Toyota Land Cruiser. Согласно проведенному анализу за 2013 г., каждый день появляются заказы автомобилей категории Люкс, оплачиваемые из средств бюджета.
Выполненные задачи проекта:
- Поиск контрактов по закупке легковых автомобилей через API ГосЗатраты
- Поиск документации по заключенным контрактам через сайт zakupki.gov.ru
- Создание статистической модели анализа текстов, способной выделять названия дорогих автомобилей, учитывающей возможные ошибки в написании, русские названия и вариативность лексики названий моделей автомобилей
- Анализ проектной документации разных форматов(PDF, Ms Word, Ms Excel, архивы)
Развитие проекта:
Модель можно масштабировать на поиск именных сущностей из других предметных областей
О проекте:
Категория: Веб-проектыВеб-сайт: http://egorlakomkin.github.io/clearspending/
Автор: Лакомкин Егор Дмитриевич