Задался я сегодня вопросом: А как же мне выдернуть базу из 2Гис??? Ведь они не предоставляют ее в свободном доступе, а перепечатовать в ручную долго, муторно, и вообще некорректно...
Нашел решение этой проблемы, получается «Полуавтоматом» можно, ну как говориться хоть что-то чем ничего....
Итак, исходные условия. Компьютер со следующими установленными программами:
- ДубльГИС (версия от сентября 2005 или более свежая);
- VentaFAX (я пользовался версией 5.1, думаю это не принципиально);
- FineReader (версию не помню, что-то не очень новое).
Алгоритм следующий. Открываем нужный раздел ДубльГИСа, «прощелкиваем» мышью по названиям тех предприятий, которые нам интересны, чтобы у них открылась контактная информация (распечатываются, почему-то, только они). Сверху нажимаем кнопку «принтер» и выбираем меню «Печать справочника».
При печати выбираем устройство «VentaFAX». При этом важно заранее, в настройках программы VentaFAX выбрать TIFF-формат для хранения подготовленных факсов. В результате получаем TIFF-файл с «распечатанным» списком предприятий.
Берем этот файл и открываем его в программе FineReader. Распознаем (распознается без проблем) и экспортируем в Excel (в программе FineReader есть такая возможность).
Как говорится, «телемаркет». Задача решена, сэкономлена куча времени на переколачивании данных.
Есть еще одно, гораздо более простое решение. Устанавливаем в системе Generic Text Printer с выводом в файл и распечатываем на него нужную информацию прямо из ДубльГИСа. Единственное, что нужно не забыть — в свойствах драйвера принтера выставить правильную кодировку печати (Cyrillic-1251), иначе вместо русских букв будут печататься точки.
P.S. пробовал таким образом вытаскивать из нового ДубльГис-а (v 3.0), при экспортировании происходит сбой в кодировке, проблему решить не смог (да и не сильно то уж и старался), потому что сделал все из старой ;)
Надеюсь статья вам пригодиться
Популярность: 78% [?]