Определение географических координат по адресу, заголовку и тексту объявления (геокодирование)

Командой m2bomber был создан собственный сервис геокодирования. Он используется в нескольких подсистемах: алгоритм детектирования дублей, расчет статистики, а также для более точного определения географических координат объекта.

Особенности реализации:
  • в определении координат участвует не только поле "адрес", но и поле "заголовок", а также сам текст объявления с различными коэффициентами влияния;
  • составляющие части адреса могут быть написаны на русском, украинском, казахском, белорусском, а также на их "миксе" (например, "Киев, Хрещатик");
  • детектирование собственных имён происходит по словарю, что даёт хорошие результаты вне зависимости от правильности их написания (например, "Киев, ивана лепсе");
  • не чувствителен к "направлению адреса" (результат поиска будет одинаков как для "Киев, Крещатик", так и для "Крещатик, Киев");
  • не чувствителен к ошибкам пунктуации (например, при пропущенной запятой в "Киев Крещатик");
  • распознаёт орфографические ошибки (например "Киев, ОсокАрки");
  • распознаёт ошибки типа (например - написано "улица", а на самом деле - проспект);
  • распознаёт неверно указанный район ("Киев, Оболонский район, ул. Красицкого");
  • определение номера дома (если указан);
  • рассчитывает географические границы города / района / улицы (нужно для правильного масштабирования при показе карты пользователю);
  • достаточно быстрый – до 100 запросов/сек на i7-3770.

На данный момент охвачены: Белорусь, Казахстан, Россия, Украина. Географическое покрытие может быть увеличено по запросу.

Как и в похожих сервисах от Google и Яндекс - мы предлагаем этот сервис в бесплатное пользование при малом и среднем количестве запросов.
Условие - установка нашего логотипа на вашем сайте. Доступные форматы взаимодействия: SOAP и "JSON over HTTP".


Вы можете проверить работу этого алгоритма с помощью формы ниже.