Registro histórico

This data scientist wants to build an archive about the history of internet measurement

Este científico de datos quiere construir un archivo sobre la historia de la medición de Internet

Jim Cowie, cofundador y científico jefe de datos en DeepMacro, publicó recientemente un artículo titulado 'Pensando en la historia de Internet' en el sitio web de APNIC. Tiene más de 25 años de experiencia como narrador de datos en la medición de Internet y recientemente lanzó la Iniciativa de Historia de Internet, con la idea de construir una biblioteca de Internet para futuros historiadores, reuniendo la historia registrada de la Internet.

Historia de InternetOrigen: Empresas de institucionales de Asia-PacíficoPublicado 3 de febrero de 2024
Visual del registro de archivo de This data scientist wants to build an archive about the history of internet measurement
  • Jim Cowie, cofundador y científico jefe de datos en DeepMacro, invita a la creación de una biblioteca en línea sobre la medición de Internet.
  • Él cree que hay tres pasos para perfeccionar una tarea: guardar, narrar y explorar.

Jim Cowie, cofundador y científico jefe de datos en DeepMacro, publicó recientemente un artículo titulado Pensando en la historia de Internet en el sitio web de APNIC. Tiene más de 25 años de experiencia como narrador de datos en la medición de Internet y recientemente lanzó la Iniciativa de Historia de Internet, con la idea de construir una biblioteca de Internet para futuros historiadores, reuniendo la historia registrada de la Internet.

Lea también: ¿Qué es APNIC? Dentro de la columna vertebral de Internet en Asia-Pacífico

Curar la historia para interpretarla y hacerla accesible y significativa para futuros académicos.

Jim Cowie, cofundador y científico jefe de datos en DeepMacro

Cowie sostiene que si queremos asegurar que la historia de Internet se preserve de forma cuantificable para las futuras generaciones de académicos, y que los datos se reúnan para protegerlos de daños irreversibles, básicamente tenemos tres tareas colectivas que cumplir antes de que todos olvidemos cómo funciona:

  • Preservar la historia recolectando registros irremplazables de cómo evolucionó Internet.
  • Recopilar la historia para explicarla y hacerla accesible y significativa para futuros académicos.
  • Explorar la historia y crear herramientas y visualizaciones que todos puedan disfrutar y celebrar.

Paso 1: Guardar

Entonces, ¿qué debemos conservar?

Además de las mediciones activas, necesitamos mantener un registro de los datos de registro – a quién se han asignado estos recursos de red cada día en la historia, de ARIN, RIPE NCC y APNIC – y cualquier información que podamos encontrar sobre el nombre DNS asociado a cada dirección IP en un día determinado. Estas son pistas colectivas sobre lo que están haciendo todos estos hosts de Internet, y también proporcionan pistas de que pueden estar ubicados en la Tierra.

Refactorizar Internet en una base de datos de punto en el tiempo

Finalmente, todos estos datos de DNS y de registro son muy efímeros, lo que significa que pueden cambiar a diario sin previo aviso. Si más tarde queremos construir indicadores creíbles, como la densidad de hosts de Internet en un área determinada, entonces tenemos que rastrear el momento de cada observación breve. Recordemos que en la década de 2010, el agotamiento del conjunto de direcciones IPv4 disponibles desencadenó una ola de ventas y reasignación internacional de bloques de direcciones de red, de modo que (por ejemplo) un bloque de direcciones de red que alguna vez alojó a clientes DSL en Rumania podría desaparecer de Internet por un tiempo, solo para reaparecer en un centro de datos en Arabia Saudita para dar servicio a páginas web. La geografía de Internet cambia rápidamente, por lo que no solo necesitamos un mapa geográfico de todas las direcciones IP y el propósito de cada dirección IP. También necesitamos saber cómo ha sido este mapa a diario durante las últimas décadas a medida que los hosts y los recursos asociados a cada dirección IP se han movido y cambiado de funcionalidad.

Finalmente, todos estos datos de DNS y de registro son muy efímeros, lo que significa que pueden cambiar a diario sin previo aviso. Si más tarde queremos construir indicadores creíbles, como la densidad de hosts de Internet en un área determinada, entonces tenemos que rastrear el momento de cada observación breve.

Recordemos que en la década de 2010, el agotamiento del conjunto de direcciones IPv4 disponibles desencadenó una ola de ventas y reasignación internacional de bloques de direcciones de red, de modo que (por ejemplo) un bloque de direcciones de red que alguna vez alojó a clientes DSL en Rumania podría desaparecer de Internet por un tiempo, solo para reaparecer en un centro de datos en Arabia Saudita para dar servicio a páginas web. La geografía de Internet cambia rápidamente, por lo que no solo necesitamos un mapa geográfico de todas las direcciones IP y el propósito de cada dirección IP. También necesitamos saber cómo ha sido este mapa a diario durante las últimas décadas a medida que los hosts y los recursos asociados a cada dirección IP se han movido y cambiado de funcionalidad.

Paso 2: Narrativa

Una vez que hayamos preservado con éxito todos nuestros conjuntos de datos digitales en peligro, podemos comenzar a gestionarlos y contar sobre ellos. La mayoría de las investigaciones sobre medición de Internet se han centrado en cuestiones operativas en el aquí y ahora: monitorear ralentizaciones y cortes dentro y entre proveedores, y averiguar cómo Internet evita el tráfico enrutado corrupto. La cuestión de la evolución histórica suele ser secundaria. Podemos encontrar nuevas formas de mirar Internet a través del lente de la historia para superar esta “trampa operativa”.

Parte de la razón por la que hacemos esto es para alentar a que las partes de Internet de crecimiento más lento y menos diverso crezcan más rápido, y es cierto que el entorno regulatorio nacional (y el papel central de los proveedores estatales en muchas economías) puede provocar que algunas partes de Internet se comporten de manera específica según la economía. Pero Jim Cowie espera que, por el bien de los futuros historiadores, podamos encontrar mejores formas de mantener la intuición geográfica, en lugar de caer en algún tipo de trampa cognitiva que ve la huella nacional de Internet como una frontera soberana más que defender.

Algunos de estos “fragmentos de carga de trabajo” son muy específicos en tiempo y lugar para aquellos que quieren entender las conexiones de Internet que son consistentes con los eventos históricos. Por ejemplo, ¿cómo era para los usuarios académicos en China usar la búsqueda de Google en 2009? ¿Cómo era para un usuario móvil en El Cairo querer acceder a Wikipedia en 2011? ¿Cómo era el sector financiero en América del Sur en conexión con Bloomberg y Reuters en la década de 2000? ¿Cuán diverso será el nodo Ethereum en 2020 o el servidor Mastodon en 2023 en términos de alojamiento en relación con los consumidores de Internet en todo el mundo? Algunas de estas partes son muy relevantes: podríamos ser capaces de mapear las incrustaciones de hosts en Internet y visualizar las conexiones entre proveedores que soportan una parte determinada de la carga de trabajo.

Paso 3: Explorar

La razón por la que nos esforzamos por preservar y organizar la historia de Internet como producto tecnológico es para ayudar al público a comprender cómo Internet hace su magia. La Internet actual funciona increíblemente bien, en gran parte debido a las condiciones específicas bajo las cuales creció y se desarrolló, bajo una gobernanza de múltiples partes interesadas en lugar de bajo un sistema de tratados multilaterales que a menudo valora la apertura descentralizada y la innovación, mientras que las autoridades centralizadas pueden estar más inclinadas a priorizar la seguridad, la previsibilidad y el control.
Una vez que hayamos guardado la historia de Internet y hayamos reclutado a científicos reflexivos que puedan ayudarnos a cuantificar algunos de los beneficios sociales (costos sociales netos) de Internet, necesitaremos herramientas para ayudar a contar esas historias. Principalmente visualizaciones, tal vez recorridos inmersivos, y ciertamente el tipo de exhibiciones interactivas que los periodistas de datos usan para informar y entretener. “Nuestra inversión en proporcionar estos conjuntos de datos abrirá la puerta a colaboraciones más amplias con artistas, periodistas y narradores visuales”.

Eso es lo que Jim Cowie quiere poner en marcha. Podemos predecir con confianza que, así como Internet ha cambiado la sociedad, la sociedad ciertamente continuará cambiando Internet a través de alguna combinación competitiva de regulación descendente con innovación ascendente y demanda popular.

Para aquellos que se preocupan por el futuro de Internet, la carrera ahora es convertirse en mejores bibliotecarios de la historia de Internet para que podamos preservar y contar las grandes cosas de Internet.