Расработка Парсер для сайта https://soliq.uz/activities/debtor
1. Цель проекта:
Автоматизация сбора данных о налоговой задолженности предприятий по списку ИНН из Excel-файла и сохранение данных в отдельные CSV-файлы для каждого ИНН.
2. Исходные данные:
URL для парсинга: https://soliq.uz/activities/debtor
Информация для сбора: область, название предприятия, ИНН, сумма налоговой задолженности
Исходный список ИНН в формате Excel
3. Требования к парсеру:
Язык программирования: Python 3.8 или выше
Использование библиотек: BeautifulSoup для HTML-парсинга, Requests для HTTP-запросов, Pandas для обработки данных
Результаты должны сохраняться в отдельные файлы CSV для каждого ИНН
Автоматизация и периодичность обновления: ежедневное обновление
4. Ограничения:
Соблюдение политики использования сайта
Обеспечение конфиденциальности данных
Предотвращение излишней нагрузки на сайт
5. Дополнительные требования:
Логирование действий скрипта
Устойчивость к изменениям на сайте (адаптивность парсера)
6. Бюджет и ресурсы:
Предполагаемый бюджет проекта: 3000 рублей
Ресурсы: один разработчик с опытом в веб-скрапинге и работе с Python