Мы в Telegram
Добавить новость
smi24.net
Работа
Июнь
2023

Python. Скрипт для локального запуска из пичарма для парсинга хтмл

0
Новичкам
Нужен примитивный скрипт для работы с локального устройства:
1. скрипт смотрит все html файлы в директории в которой находится
2. при запуске просит указать следующую запись:
<div class="col"><div><div class="font-16 text-dark text-truncate">
*
</div><div class="font-14 text-muted line-clamp-2 mt-1" style="min-height: 42px;">
*
</div></div><div class="mt-2"><div class="font-12 text-truncate"><b>
*
</b</div></div></div>
это хтмл код любого документа, начинающийся и оканчивающийся с каких то тегов - любых, которые указал пользователь, где * - это нужная колонка с тем что мне нужно видеть в итоговой CSV таблице.
3. один хтмл на одну CSV таблицу с тем же название что и хтмл.
4. важно чтобы парсер игнорировал пробелы и переносы строк при парсинге, но только не при работе с информацией помеченной *

В итоге получается такой простой скрипт для парсинга содержимого сохранённого хтмл файла (любого каталога)






Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Исполнитель хита “На Заре 2020” Сергей АРУТЮНОВ оживил ещё один хит из 20-го века и выпустил песню “Лететь” вместе с её создателями - группой Амега.

Компании Группы "Интеррос" взяли ряд наград премии FINAWARD

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”


Исполнитель хита “На Заре 2020” Сергей АРУТЮНОВ оживил ещё один хит из 20-го века и выпустил песню “Лететь” вместе с её создателями - группой Амега.

Аделина Панина: какие элементы фэншуй должны быть на кухне, чтобы есть и худеть

Генералов много, а Норат Тер-Григорьянц один!

Волшебное путешествие в мир музыки и кино


Shocking moment idiot films himself invading pitch and taunting Spurs in major security breach before Newcastle friendly

Full list of cafes and restaurants where kids can eat free or cheap this half term – including Asda and Sizzling Pubs

Johnny Nelson Reveals His Wide Fury-Usyk Scorecard: “Don’t Be Fooled”

Man City star James McAtee lined up for dream Champions League transfer after Sheffield United relegation


Летнее нижегородское утро.

Машина съехала в кювет и опрокинулась. Водитель погиб

Российские туристы назвали города, где лучше путешествовать в одиночестве

В Подмосковье наркодилер сдался полиции из-за суеверий


Зомби-экшен Zombiehood позволяет погрузиться в эпоху 90-х

Bungie wins a little walkin' around money in first of its kind jury trial against Destiny 2 cheat maker, but the victory will likely make it even easier for game companies to keep taking cheaters to court

Представлен кооперативный геймплей Warhammer 40,000: Space Marine 2

Мафия-НН: отличная команда сплоченных коллег, которые стали друг другу почти как семья.


Виставку «Світ Велетнів» в парку Боздош (м.Ужгород) продовжено до 30.06.2024 року

ОіБ - охорона і безпека: замовляй охорону в Харькові


Эксперт Президентской академии в Санкт-Петербурге об инвестировании в отечественные цифровые технологии

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Эксперт Президентской академии в Санкт-Петербурге о переходе российских предприятий на отечественное ПО


Онлайн-знакомства: ключ к новым романтическим возможностям в вашей жизни

«ИМЕНЕМ ЗАКОНА»: «СВЯТОЙ ЛЕНИН» ОТМЕНЯЕТ НАЛОГИ С ЗАРПЛАТ НАРОДА!

«Адвокат Валиевой: ей подсыпали допинг и сделал дедушка». Серьёзное расследование.

Исполнитель хита “На Заре 2020” Сергей АРУТЮНОВ оживил ещё один хит из 20-го века и выпустил песню “Лететь” вместе с её создателями - группой Амега.


Сотрудники Росгвардии задержали устроившего стрельбу с балкона мужчину в Подмосковье

Полина Максимова стала новым амбассадором подписки Газпром Бонус

Дипломатическая бизнес-встреча «Россия - Африка» прошла в Белом Особняке Villa Barvikha

Активисты движения «Всеармянский фронт» принимают активное участие в акции протеста в Армении


Янник Синнер: «Нужно наслаждаться давлением, потому что мы не врачи, которые оперируют людей»

Теннисистка Мария Шарапова снялась в красном облегающем платье

Dagospia: Синнер и Калинская вместе поужинали в ресторане в Париже

Российский теннисист Сафиуллин опустился на две позиции в рейтинге ATP


Военный суд отказал в переводе генерала Попова под домашний арест

Меморандум о Взаимопонимании для Веб-Проектов: полное руководств (МоU)

Ландыши и купальницы распустились на лесных полянах Подмосковья

Почти 15 тыс человек посетили концерты фестиваля «Город танцует в парках»


Музыкальные новости

В Новосибирске общественники потребовали отменить концерт Элджея

Юрий Лоза дал рекомендации фигуристке Камиле Валиево

Дима Билан, MACAN и 10AGE вошли в число артистов VK Fest в Петербурге

Концерт Элджея в Новосибирске требуют запретить


Эксперт Президентской академии в Санкт-Петербурге о переходе российских предприятий на отечественное ПО

Компании Группы "Интеррос" взяли ряд наград премии FINAWARD

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”


КУРОЧКА РЯБА - спектакль театра кукол Бурятии "Ульгэр": Россия, Культура, Театр, Дети

Собянин: Центральный кластер комплекса МГТУ им. Н.Э. Баумана будет готов в июне

Пластический хирург, косметолог и дерматолог Мадина Байрамукова: как правильно спать, чтобы не было морщин

Кукольный коллектив из Бурятии "Ульгэр": Россия, Культура, Театр, Дети, Новости - выступление в дацане на конкурсе по бурятскому языку


Эксперт Президентской академии в Санкт-Петербурге об экспорте бензина

Эксперт Президентской академии в Санкт-Петербурге о передовых разработках отечественного автопрома

Источник 360.ru: автобус протащил зажатую дверями женщину на юго-западе Москвы

Генерал-полковник Владислав Ершов вручил ключи от автомобилей семьям погибших росгвардейцев


Москва готова развивать сотрудничество с Ташкентом и Астаной по поставкам газа – Песков

Эксперт Президентской академии в Санкт-Петербурге о показателях нефтедобычи

Эксперт Президентской академии в Санкт-Петербурге об историческом минимуме уровня безработицы в России

Эксперт Президентской академии в Санкт-Петербурге о развитии ТЭК для достижения национальных целей




Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

В НМИЦ ЛРЦ Минздрава России прошел День открытых дверей, посвященный заботе о женском здоровье

Американская ассоциация клинической онкологии опубликовала исследование российских специалистов о меланоме


Охранник Зеленского предлагал Киеву сдаться в первые дни СВО

В Киеве заявили о причастности Зеленского к покушению на Фицо


Аделина Панина: какие элементы фэншуй должны быть на кухне, чтобы есть и худеть

Эксперт Президентской академии в Санкт-Петербурге о популяризации спорта

ЦСКА шагнул к трофею // Команда обыграла УНИКС в первом матче финала Единой лиги ВТБ

Спортивные прогнозы на OnlyBet


Союзное государство – сила двух суверенных стран


Собянин: Производство одежды в Москве за последние пять лет выросло в 62 раза

Собянин: Под заселение по реновации с начала года передали 20 жилых комплексов

Собянин: Московский предпринимательский форум объединил более 3 тыс. человек

Мэр Москвы поздравил бизнесменов с Днем российского предпринимательства


В Москве заключили соглашение об обмене знаниями в области разведения соколов

Гены устойчивости к антибиотикам сохраняются в сточных водах даже после очистки

На большей части Подмосковья ожидается IV класс пожарной опасности 27 мая

Компании Группы "Интеррос" взяли ряд наград премии FINAWARD


Новый монитор Philips Evnia 49M2C8900L подарит игровой опыт высочайшего уровня

ЧЕ!МПИОНСКИЙ УЛОВ: ВЕДУЩИЕ «ЧЕ!» НА ФЕСТИВАЛЕ «РЫБНАЯ НЕДЕЛЯ»

Ландыши и купальницы распустились на лесных полянах Подмосковья

Юлия Миронова поздравила Международную Ассоциацию партнеров QR


«Ростелекома» установил 1222 камеры для наблюдения за ходом государственной итоговой аттестации в Оренбургской области

Губернатор отчитался о работе Правительства Архангельской области в прошлом году

В Архангельске в результате пожара в жилом доме погиб один человек

Антон Шагин поддержал Всероссийский интеллектуальный забег «Бегущая книга»


Библиотечная лужайка «Хорошие книги читай – о жизни побольше узнай», к Общероссийскому дню библиотек.

Розыск: в Крыму третий день ищут девочку пятнадцати лет

День открытых дверей "Библиотека - дом, где согревают сердца"

Врач сообщила о неочевидных угрозах полотенца для здоровья


«Гениальная идея!»: звезды о новом музыкальном лейбле Детского радио

Аделина Панина: какие элементы фэншуй должны быть на кухне, чтобы есть и худеть

Онлайн-знакомства: ключ к новым романтическим возможностям в вашей жизни

Инновационное Российское решение для крупного онлайн ритейла. Как быть в тренде разработки eCom?














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *