Секреты IP геолокации

IP геолокация IP

Что такое IP-геолокация?

Адрес интернет-протокола (IP-адрес) — это цифровая метка, назначаемая каждому устройству, подключенному к компьютерной сети. Эта цифровая метка используется для идентификации этих устройств, что позволяет осуществлять прямую связь.

Публичный интернет работает по тем же принципам. Когда устройство подключается к Интернету, оно использует глобально уникальный IP-адрес, чтобы обеспечить правильную доставку как входящей, так и исходящей связи.

В этом контексте IP-адрес действует аналогично почтовому адресу, используемому для доставки обычной почты. Однако, в отличие от почтового адреса, IP-адрес не имеет внутреннего местоположения и не предоставляет никаких географических свойств. Вот почему вы не можете определить местоположение устройства только по его IP-адресу.

IP Geolocation — это важная технология, которая преодолевает это ограничение, помогая организациям определять местоположение своих клиентов на основе их IP-адресов. Такие организации, как операторы онлайн-услуг, финансовые учреждения, поисковые системы, рекламные агентства и любые компании, предлагающие услуги онлайн-шоппинга / электронной коммерции, могут предоставить своим клиентам лучшие продукты и услуги, доступные в их регионе. Эта услуга IP Geolocation также крайне важна для предотвращения мошенничества в Интернете, управления цифровыми правами и предоставления целевых маркетинговых материалов и цен.

Если вам интересно, откуда приходят ваши онлайн-клиенты, или вы хотите настроить работу своих клиентов в Интернете в зависимости от их местоположения, вы, вероятно, знакомы с различными коммерческими услугами IP-геолокации, от бесплатных до дорогих и предназначенных только для предприятий. Большинство из этих провайдеров заявляют о превосходной точности, хотя демонстрируют небольшую прозрачность методологии и предоставляют скудные доказательства в подтверждение своей заявленной точности.

В целом, проверка точности службы геолокации IP является сложной задачей и требует большого пула достоверных данных (т. Е. Огромного количества IP-адресов из известных местоположений). Эти данные обычно собираются от всех активных интернет-провайдеров и должны быть случайными, распределенными по различным географическим регионам. В действительности такие данные, как правило, недоступны, и в этом случае любая заявленная точность определения IP-геолокации без полной прозрачности является сомнительной.

Что такое окончательный источник данных?

Протокол IPv4 использует 32-разрядные адреса, что ограничивает максимальное теоретическое адресное пространство 4 294 967 296 (2 32 ) IP-адресами . IPv6, протокол следующего поколения, использует 128-битные адреса, что делает пул значительно больше, но все же ограниченным. Из-за глобального требования уникальности IP-адресов для обоих протоколов, глобальное распределение пространства IP-адресов строго регулируется.

IANA — « Управление назначенными номерами в Интернете» является функцией ICANN, некоммерческой частной американской корпорации, которая контролирует глобальное распределение IP-адресов, выделение номеров автономных систем, управление корневой зоной в системе доменных имен, типы мультимедиа и другие символы, связанные с интернет-протоколом. и интернет-номера.

IANA отвечает за выделение больших блоков пространства IP-адресов для региональных интернет-реестров (Regional internet Registries (RIRs)):

  • AFRINIC  для региона Африки
  • APNIC для Азиатско-Тихоокеанского региона
  • ARIN для Канады, США и некоторых Карибских островов
  • LACNIC для Латинской Америки и некоторых Карибских островов
  • RIPE NCC для Европы, Ближнего Востока и Центральной Азии

RIR, в свою очередь, делегируют часть своего выделенного адресного пространства локальным интернет-реестрам (  Local internet Registries (LIRs) ), например, APNIC делегирует Японский сетевой информационный центр (  the Japan Network Information Center (JPNIC) ). Все регионы, как региональные, так и местные, выделяют оставшееся доступное адресное пространство организациям, которые хотят использовать его в общедоступном Интернете.

Схема распределения пространства IP-адресов IANA

Бизнес-объекты (или автономные сети), которым назначено пространство IP-адресов для их собственного использования, называются автономными системами ( Autonomous Systems (AS) ). Сначала они должны зарегистрироваться в качестве AS, получив глобально уникальный номер автономной системы ( Autonomous System Number (ASN) ), который затем может быть использован для их идентификации.

Интернет-провайдер ( The internet Service Provider (ISP) ) является наиболее типичным примером оператора AS, но он не единственный. Практически любая организация, которая стремится использовать свои собственные IP-адреса в Интернете, квалифицируется как AS. Распространенным явлением является то, что объекты AS свободно используют выделенное им пространство IP любым способом, которым они хотят, и, что более важно, в любом географическом местоположении, которое им нравится. Они могут назначить его любому объекту / сети AS внутри одного и того же предприятия, независимо от глобального местоположения, или даже передать его в субаренду совершенно не связанному географически удаленному объекту. Несмотря на существующие правила, невозможно географически ограничить выделенное пространство IP-адресов.

Следовательно, единственными в конечном счете точными данными геолокации IP являются те, которые предоставляются операторами AS, единственными, кто уверенно знает, как и где используются их IP-адреса. AS, однако, не обязаны делиться своими внутренними данными с какой-либо другой организацией, за исключением правоохранительных органов в определенных границах юрисдикции.

Существующие коммерческие поставщики услуг IP-геолокации не имеют доступа к внутренним данным AS. Некоторые из этих поставщиков услуг утверждают, что они интегрировали услуги с интернет-провайдерами или получают данные непосредственно от интернет-провайдеров. Учитывая, что существует более 80 000 зарегистрированных AS, из которых более 60 000 являются активными одновременно, практически невозможно установить коммерческие отношения со всеми. Получение данных от небольшого числа местных интернет-провайдеров может в незначительной степени улучшить региональную точность определения местоположения, но этого недостаточно в глобальном масштабе.

Где поставщики услуг IP Geolocation получают свои данные?

Предполагая, что существующие сервисы IP-геолокации не имеют доступа к внутренним данным автономных систем, они не могут быть уверены в фактическом географическом положении маршрутизируемых IP-адресов. Итак, откуда они получают данные о геолокации?

Данные Whois

Whois — самый распространенный источник данных о геолокации. База данных Whois поддерживается региональными и местными организациями Интернет-реестров (RIR / LIR), которые обязаны хранить свои регистрационные записи общедоступными. Эта информация раскрывает все IP-адреса, зарегистрированные для каждого объекта, которому они принадлежат, включая независимые организации или интернет-провайдеров. Поставщики услуг IP Geolocation могут получить эти данные реестра с помощью веб-сайтов и API RIR или могут запросить массовый доступ к данным. Эти данные обычно обновляются ежедневно и включают набор регистрационных данных. Эти регистрационные данные содержат записи блока IP-адресов и в каких организациях они зарегистрированы. Он может дополнительно содержать адрес улицы или координаты сетевого расположения, хотя ни одно из географических свойств не является обязательным. Более того, эти записи поддерживаются зарегистрированной стороной и не проверяются никаким внешним органом. Это означает, что точность данных сомнительна, даже если они доступны.

Смотрите также:  Что такое локальный IP-адрес?

В глобальной базе данных Whois только для IPv4 содержится около 10 миллионов записей, некоторые из которых могут служить очень точным источником геолокации IP. Например, небольшое интернет-кафе со статическим IP-адресом (или небольшим диапазоном адресов), используемое в помещениях и записанное в базу данных RIR, включая его физический адрес. Этот сценарий предоставляет точную информацию о геолокации с точностью до адреса улицы. В большинстве случаев, когда организация сообщает неверную или устаревшую информацию или передает зарегистрированные блоки адресов другой стороне, записи не будут раскрывать местоположение использования IP.

Таким образом, IP-геолокация, основанная только на базе данных Whois, в целом является неточной.

Данные BGP

Border Gateway Protocol (BGP) — это глобальный каталог маршрутизации интернет-адресов. Это стандартизированный протокол внешнего шлюза для обмена информацией о маршрутизации между активными автономными системами (AS) в Интернете. BGP включает в себя объявление о предпочтительных маршрутах и ​​направлениях блоков интернет-адресов (префиксов). Когда объект AS хочет использовать диапазон IP-адресов в общедоступном Интернете, он должен «объявить» об этом ближайшим партнерам. Проще говоря, он отправляет объявление, которое означает: «Я отвечаю за этот диапазон (префикс), поэтому тот, кто хочет установить связь с устройством в этом диапазоне, направляет связь через меня». Это объявление в конечном итоге распространяется по всем другим узлам по всему миру, чтобы информировать их о том, как отправлять трафик в этот диапазон IP-адресов, если это необходимо. Например, если мне нужно отправить пакет в пункт назначения «А», но я знаю только хост «С» и могу перенаправлять трафик на него. Пакет будет по-прежнему достигать желаемого пункта назначения «A», если «C» знает «A» либо напрямую, либо через других промежуточных узлов. В двух словах,

Теперь, как это может быть полезно для IP-геолокации? Во-первых, в отличие от данных Whois, которые показывают организацию, зарегистрированную для определенного блока IP-адресов, данные BGP могут выявить, кто на самом деле их использует. Это не всегда одно и то же предприятие, как мы обсуждали выше. Если, например, мы являемся свидетелем блока, зарегистрированного в ARIN для американской компании с американским уличным адресом, но используемой AS, зарегистрированной в RIPE в Турции, это говорит о том, что в Турции вероятно используется блок IP, что улучшает геолокацию , Во-вторых, данные BGP могут также показать, какие адреса вообще не используются, необъявленное пространство, с которым процесс геолокации даже не должен предприниматься.

IP-адрес не является физическим объектом в физическом местоположении. Это просто числовая метка, которая может быть выделена и нераспределена от отдельных устройств или сетей. Мы не можем определить местоположение метки, которая не используется (выделена). Поэтому, когда ваш поставщик услуг IP Geolocation заявляет, что он может геолоцировать 100% адресного пространства, пожалуйста, интерпретируйте это с осторожностью, так как он может только геолоцировать только объявленное (маршрутизируемое) пространство. Маршрутизируемое пространство для IPv4 можно отслеживать в отчете об адресном пространстве IPv4 .

Некоторые другие способы использования данных BGP основаны на предположении, что IP-адреса, принадлежащие определенным префиксам, предназначены для совместного использования географической близости. Это, однако, не всегда верно. Префиксы имеют тенденцию к агрегации по пути и могут включать кластер из нескольких меньших префиксов, происходящих из разных регионов.

Данные полевых доказательств

Существует много дополнительных источников данных, которые можно использовать для определения местоположения IP-адресов, которые квалифицируются как данные полевых доказательств. Лучшим примером являются данные, полученные непосредственно от пользователей или представленные с использованием устройств с поддержкой GPS, таких как мобильные телефоны или планшеты. Эти данные могут раскрыть предполагаемые географические координаты устройства, использующего общедоступный IP-адрес, и могут служить эмпирическим подтверждением или наземными данными для этого конкретного IP-адреса в данный конкретный момент времени. Другие источники включают в себя: a) источники / каналы данных электронной коммерции, такие как адрес выставления счета / доставки клиента в сочетании с IP-адресом, используемым для транзакции; b) Устройства IoT с известными местоположениями и IP-адресами и пулами устройств, как общедоступные, так и собственные, например, RIPE ALKTLAS проект; и c) добровольно или коммерчески полученные потоки данных о геолокации, такие как самоопубликованные данные геолокации IP .

Существует два важных принципа, связанных с данными полевых исследований IP-геолокации:

  1. Данные всегда ограничены, поскольку для одного объекта практически невозможно получить доступ ко всем подключенным к Интернету устройствам по всему миру.
  2. Этот метод определяет местоположение IP только в определенный момент времени и подвержен ошибкам. Не всем можно доверять как чистым и надежным доказательствам. Неправильная конфигурация устройства или сбои и перенаправление сети, такие как VPN или PROXY, являются одними из многих сценариев неточности данных, которые могут возникнуть в процессе сбора данных.

Научные данные

За прошедшие годы было предпринято много попыток внедрить дополнительный активный метод измерения в решениях IP Geolocation. Большинство из этих подходов основаны на исследованиях преобразования временной задержки в расстояние, такого как триангуляция, вплоть до ближайшей точки присутствия (POP) сетевых интерфейсов (маршрутизаторов). Однако интерфейсы глобального сетевого трафика (общедоступные маршрутизаторы) являются сложными, поскольку предположение о том, что задержка между двумя последовательными интерфейсами пропорциональна физическому расстоянию между ними, является неправильным. Некоторые крупные интернет-провайдеры скрывают свои внутренние подсети. Поэтому многие промежуточные узлы не являются общедоступными и не могут быть учтены. Практические сетевые соображения основаны на маршрутизации с наименьшей стоимостью, которая отличается от общепринятого академического предположения о самой короткой. Из соображений качества обслуживания (QoS), некоторые сетевые интерфейсы также могут быть запрограммированы на искусственную задержку непроизводительного трафика. Следовательно, связь между временем задержки и расстоянием противоречива и не может заложить основу для всеобъемлющих принципов. На сегодняшний день ни один из методов, основанных на теории триангуляции с задержкой по времени, не был введен в сервис и вряд ли появится для глобальной коммерческой реализации.

Обратные данные DNS

Единственный известный коммерчески используемый научный подход был внедрен компанией Digital Envoy, Inc, защищенной патентом США (6 757 740 ), выданным в 2004 году. Этот метод основан на записях DNS (текстовые названия общедоступных интернет-адресов) и сканировании (tracert) до ближайший роутер в попытке определить город и страну пребывания.

Система доменных имен (DNS) — это телефонная книга Интернета. Обычно DNS используется для перевода доменного имени в IP-адрес, поэтому браузеры могут загружать интернет-ресурсы. Тем не менее, он также может работать в обратном порядке, вы можете запросить DNS о том, какая запись доменного имени прикреплена к IP-адресу. Эта текстовая запись, связанная с IP-адресом, не является обязательной. Это вряд ли полезно, когда адрес не участвует в публикации интернет-услуг или расходных материалов. Тем не менее, некоторые интернет-провайдеры могут использовать эту возможность текстовых тегов для маркировки своих IP-адресов для некоторых внутренних целей.

Смотрите также:  Как хакер может использовать ваш IP-адрес

Некоторые записи DNS могут потенциально использоваться для выявления географических свойств. Этот метод демонстрирует дополнительное преимущество для поиска областей с интерпретируемыми именами DNS.

К сожалению, обратный DNS-подход имеет несколько ограничений:

  1. Многие интерфейсы не имеют назначенного имени DNS;
  2. Неверное название интерфейса приводит к неправильному расположению;
  3. Названия городов могут часто повторяться в разных странах или территориях;
  4. Отсутствие общепринятых правил и правил именования означает, что записи требуют ручной обработки, что отнимает много времени и подвержено ошибкам.

Искусство угадывать

Поставщики услуг IP Geolocation могут получать свои данные из нескольких источников, хотя ни один из них не может служить окончательным и несомненным источником правды. Когда данные поддерживают друг друга, то есть несколько источников указывают одно и то же местоположение для IP-адреса, это не представляет сложности. Тем не менее, часто полученные данные очень противоречивы, и именно здесь кроется сложная часть.

Мы часто слышим, как люди говорят, что IP Geolocation — это отчасти наука, отчасти искусство. Ну, вот часть искусства. Искусство угадывать! Давайте попробуем посмотреть, с чем имеет дело ваш средний поставщик услуг IP-геолокации.

  1. Представьте, что у нас есть полевые доказательства, такие как образец данных, предоставленных пользователями, предполагающий, что IP-адрес XXX5 использовался сегодня где-то в Манхэттене, в центре Нью-Йорка, штат Нью-Йорк, США.
  2. Данные WhoIs для этого адреса показывают, что блок XXX0 — XXX255 (к которому относится вышеупомянутый адрес) зарегистрирован для компании Y, расположенной в Онтарио, штат Калифорния, США.
  3. Данные BGP свидетельствуют о том, что этот адрес был объявлен организацией AS «D», зарегистрированной как эксплуатируемая в Остине, штат Техас, США. И размер префикса был / 22 (1024 хоста).
  • Итак, где же находится фактическое местоположение? Можно ли сказать, что блок XXX0 — XXX255 находится в Нью-Йорке?
  • Или, может быть, даже весь префикс / 22 тоже в Нью-Йорке?
  • Может быть, XXX5 — единственный в Нью-Йорке, а другие даже близко не стоят?
  • Или, может быть, полученные нами данные неверны, а фактическое местоположение для всех находится в Онтарио, Калифорнии или даже Техасе?

Окончательный вывод зависит от того, какому источнику данных можно доверять больше всего? Учитывая, что существуют ограниченные инструменты для определения приоритетов источников данных, существующие поставщики услуг IP Geolocation часто заканчивают догадываться.

Их девиз: Любое предположение — хорошее предположение!

Если нам удастся получить больше точек данных доказательств из близлежащих адресных записей, это, вероятно, повысит нашу достоверность, но только если данные поддерживают один из ведущих вариантов предположения.

Однако, если данные противоречивы, это может усложнить оценку геолокации. Что если у нас появятся дополнительные доказательства по адресу XXX128 из Торонто, Канада, за пару дней до этого? Переместился ли бы этот адрес из Канады в США в последнее время или только часть блока, или мы где-то сталкиваемся с ошибкой?

Это еще один сложный вопрос — гранулирование данных. IP-адреса обычно развертываются блоками. Большие блоки лучше для глобальной маршрутизации. Если блоки слишком малы, мировая таблица маршрутизации существенно расширяется, и маршрутизаторы могут в конечном итоге столкнуться с ошибками переполнения памяти. Следовательно, службы IP-геолокации могут логически предполагать, что некоторые последовательные последовательности IP-адресов могут иметь разумную географическую близость. Однако определение фактических границ IP-адреса блока может быть непростым делом и часто включает серию образованных предположений, которые могут потребовать вмешательства со стороны операторов. Например, можно найти сходства в обратных записях DNS для адресов членов блока, которые, возможно, предлагают ту же сеть. Также, IP-адреса могут отслеживаться при поиске корреляции между IP-адресами хоста, которые участвуют в доставке пакетов. Какой бы путь ни был выбран, он обычно подвержен ошибкам. Записи DNS не всегда доступны или могут быть неправильными. Traceroute не всегда показывает все хосты в пути доставки, поскольку некоторые просто не отвечают на запросы ICMP. Идеальная корреляция хоста не всегда возможна, поскольку сетевые маршрутизаторы часто используют несколько портов IP-адресов для одного и того же маршрутизатора. Они могут выглядеть по-другому на трассировке, но в действительности они одинаковы, что также может привести к ошибке. некоторые просто не отвечают на запросы ICMP. Идеальная корреляция хоста не всегда возможна, поскольку сетевые маршрутизаторы часто используют несколько портов IP-адресов для одного и того же маршрутизатора. Они могут выглядеть по-другому на трассировке, но в действительности они одинаковы, что также может привести к ошибке. некоторые просто не отвечают на запросы ICMP. Идеальная корреляция хоста не всегда возможна, поскольку сетевые маршрутизаторы часто используют несколько портов IP-адресов для одного и того же маршрутизатора. Они могут выглядеть по-другому на трассировке, но в действительности они одинаковы, что также может привести к ошибке.

Так как же работают поставщики услуг IP Geolocation?

Поставщики геолокации IP начального уровня, скорее всего, будут использовать меньше источников данных, в основном используя только данные Whois, что ограничивает область их решений гораздо меньшим количеством вариантов. Это делает процесс более простым и, возможно, более быстрым, но в качестве компромисса он гораздо менее точен.

Более продвинутые провайдеры IP Geolocation, по-видимому, усердно работают над организацией и улучшением своих результатов, делегируя многие из окончательных решений личным лицам, в дополнение к некоторому автоматизированному процессу низкого уровня. К сожалению, ручная работа не гарантирует лучших результатов, так как люди также подвержены ошибкам и определенно замедляет процесс. В результате мы часто видим, что коммерческие базы данных геолокации обновляются только ежемесячно или еженедельно как лучшие.

Пространство IP-адресов является очень динамичной областью. Миллионы IP-адресов переходят из рук в руки или перераспределяются непрерывно, каждый час. Поэтому ежемесячные или еженедельные обновления, безусловно, не подходят для большинства приложений геолокации IP.

Таким образом, ни один из существующих в настоящее время методов не является достаточно точным. Хотя комбинация методов позволяет более точно оценить местоположение IP, это не решает проблему точности в глобальном масштабе. Более того, отсутствие полностью автоматизированной и детерминированной методологии не позволяет обновлять существующие базы данных геолокации IP достаточно часто, чтобы справляться с высокодинамичным характером пространства IP-адресов в Интернете.

Оцените статью
Все о IP и VPN
Добавить комментарий