Esta inteligencia artificial ha sido entrenada con la Dark Web
Las inteligencias artificiales como ChatGPT se entrenan a partir de una gran base de datos recolectada por sus compañías padres; en el caso de esta última, OpenAI. Sin embargo, hasta ahora toda la información proviene de más o menos el mismo sitio: enormes librerías del internet que ya conocemos. ¿Pero qué sucedería si entrenáramos una IA usando el lado oscuro de la web? Esta investigación lo ha puesto a prueba, y ya tiene nombre. Te presentamos a DarkBERT.
DarkBERT ha sido diseñado por un equipo de investigadores surcoreanos. Sí, en principio puede parecer una muy mala idea entrenar una inteligencia artificial usando a la Dark Web como fuente, pero no es la primera vez que vemos un uso atípico de esta tecnología. Después de todo, ya tenemos a un robot racista y una IA encargada de destruir y esclavizar a la humanidad.
A pesar de la mala pinta, los creadores de DarkBERT tienen una misión más noble: estudiar a los cibercriminales a fondo para luchar contra ellos.
Al igual que ChatGPT, DarkBERT es una inteligencia artificial de tipo LLM (Large Language Model). Sin embargo, para su entrenamiento fue necesario ir un paso más allá que con la variante de OpenAI. Después de todo, acceder a los datos de la Clear Web no tiene la misma dificultad que extraer información de la Dark Web.
Para esto, el equipo de investigadores tuvo que conectar a DarkBERT directamente a la red Tor, lo cual le permitió acceder a los datos de la Dark Web. Una vez listo este paso, comenzó a crear una base de información pura que recolectó durante sus aventuras por el lado oscuro de internet.
Según el equipo de investigación, DarkBERT fue capaz de crear una mejor imagen de la Dark Web que otras inteligencias artificiales parecidas. Específicamente, mencionan a RoBERTa, un modelo desarrollado por Facebook en 2019 para «predecir secciones de texto ocultas intencionadamente dentro de ejemplos lingüísticos que de otro modo no estarían anotados».
¿Pero cómo podría funcionar la IA de DarkBERT para luchar contra los cibercriminales? Esta tecnología tiene varios usos dentro de este ámbito. Por ejemplo, es capaz de detectar sitios web dedicados a la venta de ransomware o de datos confidenciales. Asimismo, puede mantener bajo vigilancia a innumerables foros de la Dark Web y de esta forma estar al tanto de cualquier intercambio de información ilícita.
Vía: Hipertextual