Главные новости Краснокамска
Краснокамск
Январь
2025
1
2
3
4 5
6
7
8
9 10
11
12 13 14 15 16 17 18 19 20 21
22
23
24
25
26
27
28
29
30
31

Python и нечеткое сопоставление: решение проблемы разнобоя в адресах

0

Иногда приходится заниматься сравнением больших списков адресов, в которых адреса записаны совершенно по разному без внятных идентификаторов вроде номера объекта - есть только адрес. Один и тот же адрес может фигурировать в различных списках следующим образом:

???? "д. Малое Шилово, ул. Березовая, д. 7" и "Березовая 7_М Шилово".
???? "п. Ласьва, ул. Весенняя, д. 5" и "Весенняя 5_Ласьва".
???? "Луговой пер 5, Краснокамск г" и "г. Краснокамск, пер. Луговой, 5".
???? "д. Новая Ивановка, ул. Солнечная, 18" и "д.Новая Ивановка, ул.Солнечная, 18".

Уже выделенные отдельно адреса могут выглядеть как на скриншоте Экселя. А пример поставленной задачи может звучать так: «В реестре поданных объектов отметить все согласованные объекты (из общего списка согласованных)».

Если отбросить вариант ручного исполнения и обратиться к скриптам, то мне видится всего два решения:

✅ Использовать алгоритмы нечёткого сопоставления.
✅ Использовать геокодинг адресов.

Ищем приемлемый вариант сопоставления










СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *