address-extractor-rus
v0.1.1
Published
Извлечение и структурирование русскоязычных адресов из неструктурированного текста
Maintainers
Readme
address-extractor
Библиотека для извлечения и структурирования русскоязычных адресов из неструктурированного текста. Устойчива к опечаткам, CAPSLOCK и нестандартным форматам.
📦 Установка
npm install address-extractor-rus🚀 Пример использования
import {
extractCleanUniqueAddresses,
parseAddressEntities,
} from "address-extractor-rus";
const text = `
ФИО: Иванов Иван Иванович
Адрес: Москва ул Ленина 17 кв 3
Временная регистрация — МОСКВА ЛЕНИНА 17 3
`;
const addresses = extractCleanUniqueAddresses(text);
console.log(addresses);🧩 Выход:
["МОСКВА УЛ ЛЕНИНА 17 КВ 3"];✅ Возможности
- Распознаёт адреса с опечатками (использует расстояние Левенштейна)
- Фильтрует неадресные строки (ФИО, даты, долги, телефоны)
- Чистит префиксы:
Адрес:,Прописка,ПМЖи т.п. - Удаляет дубликаты по смыслу (например,
Москва Ленина 17 3иМОСКВА УЛ ЛЕНЕНА 17 КВ 3) - Разбивает строку на структуру:
город,улица,дом,квартира
🛠 Используемые технологии
- fastest-levenshtein — быстрая метрика Левенштейна
📄 Лицензия
MIT
