Se ha filtrado información sobre las IAs de China. Muestran la fuerte censura detrás de las mismas

China ha creado un sofisticado sistema de IA diseñado para ampliar su aparato de censura, considerado a nivel global como uno de los más formidables del mundo. En concreto, se ha descubierto una base de datos con más de 133.000 ejemplos de contenido considerado como "sensible" por parte de un investigador de seguridad conocido como NetAskari.Según recogen en TechCrunch, esta colección está siendo utilizada para entrenar modelos de lenguaje de gran tamaño (también conocidos como LLMs, lo que son productos como ChatGPT o Claude) que identifican automáticamente cualquier contenido considerado como problemático por el gobierno chino.Así funciona la IA de la censuraEste modelo busca críticas sutiles, comentarios satíricos y potenciales fuentes de descontento social. Xiao Quain, investigador de la Universidad de California en Berkeley especializado en censura china, explicaba al medio que entrenar este medio "es una evidencia clara de que el gobierno chino o sus aliados quieren mejorar LLMs para que la represión sea mejor y más eficiente".El sistema está configurado para identificar inmediatamente contenidos clasificados como de "máxima prioridad". Entre ellos destacan denuncias sobre pobreza rural, casos de corrupción escándalos de contaminación, conflictos laborales y cualquier mención a la política de Taiwán. Para quienes no lo sepan, Taiwán como país y territorio es lo que queda de la antigua China imperial. Dicho sea de paso, la palabra "Taiwán" aparece más de 15.000 veces en la base de datos.Volviendo a la filtración descubierta por NetAskari, el investigador de seguridad encontró los datos almacenados en texto plano en un servidor de Baidu, una empresa tecnológica del Gigante Asiático de la que a menudo se habla como el "Google Chino". Las entradas más recientes de la base de datos datan de diciembre de 2024, lo que indica que es un proyecto activo y en desarrollo.Michael Caster, responsable del programa para Asia de la organización Article 19, una organización internacional de Derechos Humanos que protege la libertad de expresión y el acceso a la información, el modelo de lenguaje está "destinado al trabajo de opinión pública", término que en China suele hacer referencia a los esfuerzos de censura y propaganda supervisados por la Administración del Ciberespacio de China.Según el medio, los expertos advierten de que mientras los métodos tradicionales de censura digital dependen de algoritmos básicos que bloquean términos específicos, las nuevas tecnologías de IA pueden hacer la censura mucho más eficiente y a una escala mucho mayor, además de mejorar continuamente a medida que procesan más datos.El artículo Se ha filtrado información sobre las IAs de China. Muestran la fuerte censura detrás de las mismas fue publicado originalmente en Andro4all.

Mar 27, 2025 - 14:07

Se ha filtrado información sobre las IAs de China. Muestran la fuerte censura detrás de las mismas

China ha creado un sofisticado sistema de IA diseñado para ampliar su aparato de censura, considerado a nivel global como uno de los más formidables del mundo. En concreto, se ha descubierto una base de datos con más de 133.000 ejemplos de contenido considerado como "sensible" por parte de un investigador de seguridad conocido como NetAskari.

Según recogen en TechCrunch, esta colección está siendo utilizada para entrenar modelos de lenguaje de gran tamaño (también conocidos como LLMs, lo que son productos como ChatGPT o Claude) que identifican automáticamente cualquier contenido considerado como problemático por el gobierno chino.

Así funciona la IA de la censura

Este modelo busca críticas sutiles, comentarios satíricos y potenciales fuentes de descontento social. Xiao Quain, investigador de la Universidad de California en Berkeley especializado en censura china, explicaba al medio que entrenar este medio "es una evidencia clara de que el gobierno chino o sus aliados quieren mejorar LLMs para que la represión sea mejor y más eficiente".

El sistema está configurado para identificar inmediatamente contenidos clasificados como de "máxima prioridad". Entre ellos destacan denuncias sobre pobreza rural, casos de corrupción escándalos de contaminación, conflictos laborales y cualquier mención a la política de Taiwán. Para quienes no lo sepan, Taiwán como país y territorio es lo que queda de la antigua China imperial. Dicho sea de paso, la palabra "Taiwán" aparece más de 15.000 veces en la base de datos.

Volviendo a la filtración descubierta por NetAskari, el investigador de seguridad encontró los datos almacenados en texto plano en un servidor de Baidu, una empresa tecnológica del Gigante Asiático de la que a menudo se habla como el "Google Chino". Las entradas más recientes de la base de datos datan de diciembre de 2024, lo que indica que es un proyecto activo y en desarrollo.

Michael Caster, responsable del programa para Asia de la organización Article 19, una organización internacional de Derechos Humanos que protege la libertad de expresión y el acceso a la información, el modelo de lenguaje está "destinado al trabajo de opinión pública", término que en China suele hacer referencia a los esfuerzos de censura y propaganda supervisados por la Administración del Ciberespacio de China.

Según el medio, los expertos advierten de que mientras los métodos tradicionales de censura digital dependen de algoritmos básicos que bloquean términos específicos, las nuevas tecnologías de IA pueden hacer la censura mucho más eficiente y a una escala mucho mayor, además de mejorar continuamente a medida que procesan más datos.

El artículo Se ha filtrado información sobre las IAs de China. Muestran la fuerte censura detrás de las mismas fue publicado originalmente en Andro4all.