Мы в Telegram
Добавить новость
smi24.net
Все новости
Сентябрь
2022

Парсинг раздела объявлений сайта newsakh.com

0
ПО должно быть написано на pyton , должна работать с моего компьютера на ОС windows 7-10, без использования хостинга, без платных функций.

Парсер должен состоять из 4 частей :
- парсер раздела объявления https://marketsakhcom.ru/
- парсер раздела недвижимость https://domsakhcom.ru/
- парсер раздела авто https://autosakhcom.ru/

На выходе каждой части парсера должен быть xls файл (БД), который содержит следующие колонки:
- Id объявления,
- номер телефона в формате "79140001122",
- дополнительный номер телефона (если был указан),
- e-mail (если был указан),
- дата время подачи объявления,
- город,
- заголовок и текст объявления,
- ссылка на объявление,
- адрес или координаты (для раздела недвижимости),
- фото (для раздела авто) - хранятся в отдельном месте в исходном качестве, в самом xls файле - ссылка на файл с фотографией.

Добавить возможность объединения всех xls файлов в один.

Для диалога с пользователем и контроля процесса ПО достаточно консольного окна.

При первом запуске (или отсутствии БД) парсер должен скачать в БД все что в настоящий момент есть на сайте, а при последующих включениях - дополнять БД вновь опубликоваными объявлениями.

Для ускорения процесса парсинга использовать многопоточность, без превышения ограничений сайта.

Добавить возможность парсинга в автоматическом режиме в заданое время или через определённый промежуток времени.

При необходимости - в автоматическом режиме использовать прокси для обхода блокировок и бана.

Необходимо графическое представление алгоритма, если есть возможность - IDEF0, если нет - в виде блок-схемы.

Нужно выяснить ограничения сайта - количество запросов, частота запросов, которое отсекается.







Семинар библиотекарей Ленинского округа прошел в Центральной библиотеке

"СВЯТОЙ ЛЕНИН: сенсация о прогнозах направит Америку и Европу творить добро?!

Инго Экосистема стала победителем национальной премии FinTech Awards Russia

«Школа вожатых» прошла в школе №7 в Реутове


LISA FM Александр Белоносов выпустил альбом «Родина Сердца: Дневник Психолога»

«Новая разработка для защиты от огня»: компания из Реутова создала малый модуль пожаротушения «Лавина Комби»-45

Пегас сделал важное заявление о будущих турах на предстоящий зимний сезон

Roberto Cavalli, коллекция Resort 2025


Kai Havertz’s fiancee Sophia stuns in see-through outfit on hen weekend as fans say Arsenal star is ‘so lucky’

America’s Space Infrastructure: So Vulnerable It Destabilizes Geopolitics

Panthers take Game 1 of Stanley Cup Final as Sergei Bobrovsky shuts out Oilers

Creepy King Charles Painting Is Vandalized by Radical Animal Rights Activists, Gets a Cartoon Face and Speech Balloon!


Быстро как. У хуситов появилась гиперзвуковая "Палестина". Наши подвезли?

«Школа вожатых» прошла в школе №7 в Реутове

«Байкал Сервис» снижает тарифы из городов Дальнего Востока

"Дети в шоке". В Новоуральске машина ДПС сбила байк с детьми 13-ти и 8 лет


Состоялся релиз The Case of the Golden Idol на iOS и Android

MMORPG Tarisland выпустили в Китае раньше времени

В новом трейлере Indiana Jones and the Great Circle Индиана спускается на корабле с горы

Life is Strange: Double Exposure продолжит историю Макс Колфилд


Досвідчені садівники обирають великі технічні горщики для своїх рослин і квітів


Азербайджан назначил столицей тюркского мира талышский город Ленкорань. Талышские организации мира бьют тревогу

«СВЯТОЙ ЛЕНИН» и ДЕНЬ РОССИИ: успех России в С В О = мир во всём мире?!

Владимир Путин сенсационно получил ключевое признание от Н А Т О.

Казаков, казачек и казачат Кубанского казачьего центра «Баско» наградили за активное участие в Кадетском движении России


"СВЯТОЙ ЛЕНИН: сенсация о прогнозах направит Америку и Европу творить добро?!

«Полон решимости»: эксперт Куинн заявил, что принц Гарри ищет жилье в Британии

Сергей Собянин. Главное за день

Источник 360.ru: похожий на взрывчатку сверток подложили под машину в Москве


Щелковские единороссы провели флешмоб и автопробег ко Дню России

МИД заявил об угрозе преследования россиян в Дании

Стенд Подмосковья открылся в День России на форуме «Путешествуй!».

АБХАЗИЯ. Хакан Фидан в России: вступит ли Турция в БРИКС?


«Мирра Андреева обладает удивительной выживаемостью» // Олимпийская чемпионка по теннису Елена Веснина об итогах женского Roland Garros

Рейтинг ATP. Синнер стал №1, Алькарас – №2, Циципас выпал из топ-10, Хачанов – из топ-20, Котов обновил личный рекорд

Самсонова вышла во второй круг турнира в Хертогенбосе

Итальянский теннисист Янник Синнер впервые возглавил рейтинг ATP


Стенд Подмосковья открылся в День России на форуме «Путешествуй!».

АБХАЗИЯ. Хакан Фидан в России: вступит ли Турция в БРИКС?

МИД заявил об угрозе преследования россиян в Дании

Акция «Поем двором» прошла в Луховицах в честь Дня России


Музыкальные новости

В Новосибирске полиция проверит Элджея на пропаганду наркотиков

Игорь Бутман рассказал подробности о Московском джазовом фестивале

LISA FM Александр Белоносов выпустил альбом «Родина Сердца: Дневник Психолога»

Певица и телеведущая Ольга Бузова побывает в лабораториях АмГУ


Владимир Путин сенсационно получил ключевое признание от Н А Т О.

Инго Экосистема стала победителем национальной премии FinTech Awards Russia

«СВЯТОЙ ЛЕНИН» и ДЕНЬ РОССИИ: успех России в С В О = мир во всём мире?!

Азербайджан назначил столицей тюркского мира талышский город Ленкорань. Талышские организации мира бьют тревогу


Ресурсный центр на V Общероссийской конференции «Устойчивое развитие этнокультурного сектора» объединил национально-культурные инициативы из разных регионов России

Руководители подразделений электромашинного дивизиона Желдорреммаш прошли обучение в рамках развития производственной системы TOS

"Евро-Футбол.Ру": "Спартак" летом купит форварда только в случае ухода Соболева

ЧЭРЗ прошел ресертификационный аудит системы менеджмента бизнеса


Пассажиры московского транспорта могут услышать поздравления звезд с Днем России

Источник 360.ru: в Москве столкнулись Porsche и Lexus, 5 человек пострадали

СМИ: Беременная девушка пострадала в аварии на юго-востоке Москвы

В Подмосковье росгвардейцы приняли участие в масштабном автопробеге, посвященном Дню России


Путин заявил, что Россия преодолеет любые испытания

Многоходовка Путина опять сработала. Китай строит дорогу в обход России, но Москве это на руку

Указом Путина авторы технологий трансплантации органов получат госпремию

Владимир Путин сенсационно получил ключевое признание от Н А Т О.


Выявлено более 1,8 тысячи случаев заражения COVID-19 за неделю в Москве

Свыше 1,8 тыс. случаев коронавируса выявили в Москве за неделю



30 лет назад в Архангельске открылась первая на Северо-Западе школа «Диабет»

Указом Путина авторы технологий трансплантации органов получат госпремию

Метод терапии: какие бывают исцеляющие кристаллы и как их использовать

«Беспрепятственно уничтожать опухоль»: пять главных вопросов о российской вакцине от рака


Зеленский исключил возможность компромиссов с Россией

Американский полковник: ВС РФ готовятся к окружению Киева, и Зеленский будет собирать чемоданы

Путин готовится отрезать Киев и прогнать Зеленского – американский полковник


Спортивное лето: Представителям «серебряного» поколения рассказали об активном досуге

Крупный строительный кластер возведут у поселка Спортбазы в ТиНАО

В районе Вороново появится новый крупный стройкластер

15 июня в Ростовском городском шахматном клубе на Газетном, 92 поведут рапид памяти международного гроссмейстера Сергея Аслановича Бешукова


В Минске сообщили о телефонном разговоре Путина и Лукашенко

Минск подтвердил готовность наращивать сотрудничество с Баку


Сергей Собянин. Главное за день

Собянин наградил выдающихся москвичей за профессиональные достижения

Собянин расширил программу стимулирования создания мест приложения труда

Собянин: Общегородской школьный выпускной пройдет в Москве 28 июня


Инго Экосистема стала победителем национальной премии FinTech Awards Russia

Метеоролог рассказала о возвращении в Москву аномальной жары

На фестивале «Москва — на волне. Рыбная неделя» у Кремля проходили концерты и кулинарные баттлы

Едят даже птиц. Чем опасны для экосистемы Москвы пришлые испанские слизни


АБХАЗИЯ. Хакан Фидан в России: вступит ли Турция в БРИКС?

Участники «Московского долголетия» смогут укрепить здоровье

Движение поездов на МЦД-2 и МЦД-4 приостановлено по техническим причинам

МИД заявил об угрозе преследования россиян в Дании


Мастер и Принцесса: в «Архангельском» вручили «Хрустальную Турандот»

Архангельская область испытывает нехватку профессиональных химиков

Архангелогородцев и гостей города приглашают посетить мероприятия фестиваля «Гармоничная Россия»

30 лет назад в Архангельске открылась первая на Северо-Западе школа «Диабет»


Музыкально-поэтический вечер «Жизнь не кончена, песня не спета»

В Нижнегорском районе Крыма проведен рейд по бывшим мигрантам

Севастополь появился на вышитой карте Крыма

В районе Симферополя появится крупный жилой микрорайон - ЖК "Республика"


США задумали обложить санкциями фирмы из КНР за поставку чипов в Россию

Движение поездов на МЦД-2 и МЦД-4 приостановлено по техническим причинам

Участники «Московского долголетия» смогут укрепить здоровье

АБХАЗИЯ. Хакан Фидан в России: вступит ли Турция в БРИКС?














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *