Presentation for mexico

24
1 Análisis de texto IntuScan y análisis de entidad May 2014

Transcript of Presentation for mexico

1

Análisis de texto IntuScan y análisis de entidad

May 2014

04/1

5/20

23

2

Análisis de texto y

acoplamiento de entidades

IntuScan es una herramienta líder para el análisis de textos semánticos, entre ellos: la explotación de documentos, análisis de los sentimientos, el reconocimiento de entidad, "búsqueda de ideas" y acoplamiento de nombres.

La tecnología IntuScan actualmente soporta plenamente el idioma inglés, el español, francés, árabe, urdu (Pakistán), indonesio con el ruso, somalí y persa en todos los trabajos.

La necesidad

Para extraer información de grandes cantidades de "datos grandes" en relación a las áreas de interés con el fin de descubrir lo "desconocido".

Para separar el "trigo de la paja", y para extraer el significado de los textos.

Para identificar los vínculos no evidentes entre las personas, organizaciones, lugares, objetos e ideas.

Para hacer todo eso en un ambiente global políglota en el que cada pieza del rompecabezas pueda estar en un idioma diferente o "sub-lenguaje".

Funciones clave

Identificación de idioma - identifica el idioma y el "sub - lenguaje" / dialecto y procesa cualquier texto en cualquiera de los idiomas compatibles.

Categorización de múltiples facetas - determina la pertinencia del texto con los requerimientos del usuario y para una serie de grupos de categoría.

Reconocimiento de entidades - reconoce , analiza y agrupa entidades (personas , lugares, organizaciones , etc.), independientemente de su ortografía, y extrae la información implícita y contextual sobre ellos, tales como: el origen étnico, el género, las afiliaciones, apodos, posiciones, títulos y las posibles relaciones con otras entidades identificadas.

Extracción de ideas - basado en la detección de dominio y ontologías de dominio específico con los léxicos asociados, extrae las ideas implícitas y la "hermenéutica" (significado implícito) del texto.

Análisis de sentimientos - identifica opinión matizada a favor de los atributos de las entidades o ideas para generar una imagen completa de sentimiento.

Informe - proporciona un informe de los elementos clave en el texto y permite la búsqueda semántica en grandes cantidades de documentos procesados.

Consultas en la base de datos para encontrar combinaciones de entidades o piezas de información.

5

April 15, 2023

Confidential – Intuview proprietary

DOCEX para campo en tiempo real para las fuerzas de combate puede proporcionar inteligencia inmediata y apoyo a las decisiones para las operaciones que deben integrarse con otras herramientas.

Digitalización de los sitios web y blogs para facilitar la cubierta OSINT.

"Los forenses de contenido" de almacenamiento digital incautado.

La identificación de los riesgos en las redes sociales (preparados para los disturbios, etc.)

Coincidencia de nombres en las listas de vigilancia en los escenarios de control de fronteras.

Identificación de las "recetas" para explosivos improvisados en los medios digitales.

Respuesta de emergencia a través de la caracterización de la alimentación de las redes sociales, en relación con sus áreas geográficas / áreas de responsabilidad en cuanto a los lugares y poblaciones, y difusión de información a los primeros en responder.

Usos de defensa y seguridad

6

April 15, 2023

Confidential – Intuview proprietary

Análisis en tiempo real de grandes volúmenes de información textual para descubrir:

Las entidades en los documentos con la información implícita en ellos.

Co-referencias en términos de quién está asociado con la entidad, con qué organizaciones se afilió, qué lugares están vinculados a él, cuentas bancarias, direcciones de correo electrónico, etc.

El sentimiento expresado a favor de personas o instituciones, tales como la confianza, la sospecha, etc.

Escaneo de sitios web y blogs para identificar a las personas que son de su interés.

Evaluación de SIGINT, incluyendo los medios de comunicación social.

Mejora del análisis forense regular "contenido forense" de almacenamiento digital incautado.

Coincidencia de nombres en listas de vigilancia con nueva inteligencia de entrada.

Policía e investigación de delitos financieros

Confidential – Intuview proprietary

Sector bancario

Sector inversionista

Investigación de mercado

Investigación profesional

Sector IT

Identificación de transferencias sospechosas.

Actualizaciones entre idiomas resumidos de dominios específicos sobre las tendencias para la inteligencia de negocios.

Análisis de grandes bases de datos de dominio específico o blogs no estructurados, chats y foros, en diferentes idiomas.

Búsqueda y resumen de textos específicos de dominio relacionados con las áreas de interés profesional en derecho, seguros, medicina, ciencias, etc.

Búsquedas ontológicas de idiomas cruzados en la web

Usos comerciales

Confidential – Intuview proprietary April 15, 2023

8

Visión general de la tecnología El proceso

04/1

5/20

23

9

Ontología IntuScan

10

Pantalla deIntuScan de análisis de

documentos

11

Pantalla deIntuScan de análisis de

documentos

12

Pantalla deIntuScan de análisis de

documentos

13

Pantalla de IntuScan de informe de

documentos

04/1

5/20

23

14

Documentos analizados

por IntuScan

04/1

5/20

23

15

Textos analizados

por IntuScan

04/1

5/20

23

16

Pantalla de búsqueda

de IntuScan

Hay más de una forma posible para deletrear un nombre…

Al-Zawahiri = Eddhawahri = Eddaouahiri = الظواهري

Xi Jin Ping = Hsi Chin P`ing = 習近平

“Lo deletrean como Vinci y lo pronuncian como Vinchy; lo extranjeros siempre deletrean mejor de lo que pronuncian” Mark Twain

“Dios los cegó antes nuestras identidades” Ayman Al-Zawahiri, hablando de cómo fue arrestado y liberado por los rusos en Dagestan en 1997.

Coincidencia de nombres IntuView

¿Qué hay en un nombre? …bastantes cosas

Género - un nombre en un idioma puede ser masculino y femenino en otro (Carol en Inglés es de sexo femenino y en rumano - masculino).

Origen étnico - un nombre indica el origen étnico de una persona y en muy diversas sociedades incluso subdivisiones de la etnicidad como la religión y secta.

Afiliación tribal - un apellido que indica un clan tribal contiene implícitamente la identidad de la tribu.

Relaciones familiares - en muchas culturas un nombre puede indicar las relaciones entre hermanos / padres e hijos o primos.

Estatus social - un nombre y títulos que pueden parecer un nombre puede indicar la posición social de una persona.

Edad - estadísticas de nombres que se dan en los países pueden dar una indicación de la edad esperada de una persona.

Coincidencia de nombres IntuScan

La solución

Clasificación de los nombres para identificar su origen lingüístico probable.

"Transliteración" de los nombres romanos a su fuente de ortografía.

El uso de las convenciones de nombres para generar variantes potenciales y para extraer información implícita (origen étnico, sexo, religión / secta, estado, familia / vínculos tribales, etc.).

Coincidencia de todos los nombres de las variantes para identificar mismas personas y las relaciones familiares potenciales o anomalías.

Coincidencia de nombres IntuView

El problema

Rendimientos a juego de cuerdas bajos de memoria y que coinciden fonéticamente - baja precisión.

Los nombres reflejan convenciones de nomenclatura culturales, se reciben de diferentes fuentes y son corrompidos por diferentes orígenes lingüísticos de los transmisores y los transcriptores de los nombres.

04/1

5/20

23

20

Resultados

21

Los siguientes productos químicos de doble uso se mencionan en el documento, y pueden ser potencialmente utilizados para preparar los siguientes explosivos:

Clasificación de explosivos Componentes Procedimientos de preparación

Sales de nitrato85% nitrato de amoniaco, 2-5% carbón vegetal,3-10% polvo de aluminio), fertilizante químico

Moler, mezclar

Texto real

Salida

• Identifica en los documentos de textos elaborados con referencias a materiales químicos e instrucciones directas para la fabricación de bombas.

• Deduce los tipos de explosivos u otras armas que se pueden construir mediante las instrucciones en los textos.

Módulo de detección IntuScan IED

April 15, 2023

El análisis de sentimientos IntuView realiza un análisis profundo para identificar:

El "titular" y el "objeto".

El atributo del objeto hacia el que el sentimiento se expresa (por ejemplo, "honestidad", "eficacia", "inteligencia").

El matiz y el grado del sentimiento (qué tan fuerte el sentimiento es).

El "sentimiento agregado" a la entidad por diferentes sentimiento "titulares".

El contexto del sentimiento o el tema del discurso en el que se produce.

El sentimiento inferido a las entidades que no se mencionan explícitamente en el texto pero alude a través de la afiliación de entidades nombradas explícitamente con ellos.

Análisis de sentimientos IntuView

Confidential – Intuview proprietary April 15, 2023

23Identificación de la afiliación semántica

entre los conceptos ontológicos

No confiablePoco fiable

EngañosoSinuoso

“concepto de padres” “falsedad”

La agregación de información de entidades específicas a un sentimiento agregado general hacia las entidades de sus "padres"

Mentiroso Deshonesto

Manipulador

Miembros del gabinete

Análisis de sentimientos IntuView

Gracias