Unauthorized Views only
Red Baron Roost, Bonn
OTL a.D. Dipl.-Ing. Johannes Naumann
Sprachverarbeitungzur
Gesprächsauswertung,
eine Einführung
Unauthorized Views only
Red Baron Roost, Bonn
OTL a.D. Dipl.-Ing. Johannes Naumann
Verfahren der automatisiertenSprachverarbeitung
zurGesprächsauswertung
Unauthorized Views only
Red Baron Roost, Bonn
Johannes Naumann, OTL (a.D.) Dipl. Ing.
38 Jahre Deutsche Luftwaffe
Verwendungen
EloKa Offz Luftwaffenführungsdienstkommando
Leiter der Erfassung FmSkt F, Kötzting
Leiter ZBA, Trier (GEWOSC)
EloKa St Offz LwA, LFlKdo
Leiter Lw-Anteil BwKdo US/CA
Sachgebietsleiter Elo beim ANBw,Gelsdorf
Streitkräfteamt, Fähigkeitsanalyse NG&A & EloKa
Unauthorized Views only
Red Baron Roost, Bonn
Disclaimer
Dieser Vortrag gibt ausschließlich meine eigene Meinung wieder und stützt sich auf unabhängiges Denken gestützt auf 35 Jahre Erfahrung mit fast allen Spielarten der EloKa (EK) IO und auf die Physik, allgemein zugängliches Wissen und die
verfügbare wissenschaftliche Information.
Unauthorized Views only
Red Baron Roost, Bonn
Motivation (Massendaten)
Sprachen - Problem
Kapazitäten - Problem
Automatisierte Verfahren
Netzwerkaufklärung
Reach Back
Gliederung
Technische Randbedingungen
Klassifikatoren
Demo
Unauthorized Views only
Red Baron Roost, Bonn
Warum, Wieso, Weshalb ?
Massendatenproblem wegen sehr stark gestiegener Funknutzung
• bisher: potentieller Gegner war bekannt
• JEDER kann es sein und alle reden miteinander
• seit Bw im Einsatz: potentieller Gegner zivil
Unauthorized Views only
Red Baron Roost, Bonn
Problem: Wer hört die 50.000 Gespräche / h ab ?
24 Mio Afghanen, die jeder 2 Stundentäglich telefonieren, belegen jeder 1/10Kanäle, also 1,2 Mio gleichzeitige Gespräche täglich, macht 50.000gleichzeitige Gespräche je Stunde
Moderne Aufklärungsmittel hören aber mit !
Problem: Versteht der überhaupt die Sprache ?
Unauthorized Views only
Red Baron Roost, Bonn
Uzbeki
Turkmeni
Nuristani
Pashai
Qirgizi
Persian (Dari)
Pashto
Balochi
In Afghanistan werden etwa 49 Sprachen[und über 200 verschiedene Dialekte gesprochen.
Das Sprachenproblem
Unauthorized Views only
Red Baron Roost, Bonn
Problem: Kleine Kapazitäten für viel Umfang
Problem: Wer findet raus, was relevant ist ?
Wo sind die Auswerter, die 40 Sprachen sprechen ?
Problem: Handelt es sich überhaupt umSprache ?
Unauthorized Views only
Red Baron Roost, Bonn
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache oder Geräusch ?
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache oder Geräusch ?(Sprachdetection)
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
Stochastische Verfahren, die Sprachlaute von Geräusch unterscheiden können
Treffgenauigkeit ist begrenzt
Es gibt Verfahren, die „trainiert“ werden müssen
In unterschiedlichen Scenarienunterschiedliche Treffgenauigkeit
z.B. durch Computerprogramme:
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache oder Geräusch ?
2.: Welche Sprache ist das überhaupt ?
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
zunächst: Lautanalyse
Jede Sprache hat spezielle Lautkombinationen
Sprachmelodie (Frequenzanalyse)
Sprachrhythmus, Pausen
Konsonanten, Vokale, Diphtonge
Phoneme
Welche Sprache ist das überhaupt ?
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache, oder Geräusch ?
2.: Welche Sprache ist das überhaupt ?
3.: Erkenne ich den Sprecher?
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
Wie erkenne ich den Sprecher ?
• Frequenzspektrum der Stimme
• Eigenheiten bei den verschiedenen Lauten
Explosivlaute, Vokale: Klangfarbe
Tonfall, Rhythmus Verschleifungen
weitere Eigenheiten
• Sprachraum der Stimme
Unauthorized Views only
Red Baron Roost, Bonn
Es gilt, irrelevante Gespräche zu ignorieren,
um wichtige Hinweise zu finden.
Stichworte können ähnlich Sprechern als Bild, Signatur abgelegt werden
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache oder Geräusch ?
2.: Welche Sprache ist das überhaupt ?
3.: Erkenne ich den Sprecher ?
4.: Erkenne ich Stichworte ?
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
Stichworterkennung durch Vergleichen
Erstellen von Mustern
Vergleich der Muster mit dem Sprachmaterial
Aufwendig.
Spezielle Software, die nur charakteristischeTeilmuster verwendet ist schneller
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache oder Geräusch ?
2.: Welche Sprache ist das überhaupt ?
3.: Erkenne ich den Sprecher ?
4.: Erkenne ich Stichworte ?
5.: Erkenne ich Zusammenhänge ?
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
Wie erkenne ich Zusammenhänge ?
• Kombination aus Stichworten und Ereignissen oder Daten
• Zusammenhang ergibt sich aus mehreren Stichworten
Keywordspotting
Unauthorized Views only
Red Baron Roost, Bonn
1.: Ist das Sprache oder Geräusch ?
2.: Welche Sprache ist das überhaupt ?
3.: Erkenne ich den Sprecher ?
4.: Erkenne ich Stichworte ?
5.: Erkenne ich Zusammenhänge ?
6.: Erkenne ich ein geplantes Ereignis ?
Wie kann automatisierte Sprachverarbeitung helfen ?
Unauthorized Views only
Red Baron Roost, Bonn
Sprecher, Stichworte und Zusammenhängekönnen zu geplanten Ereignissen führen
Dabei helfen Informationen aus anderenDiensten, wie z.B. Netzwerkaufklärung
Erkenne ich ein geplantes Ereignis ?
Unauthorized Views only
Red Baron Roost, Bonn
Wie findet man heraus, was relevant ist ?
IMSI-Catcher liefert ID, Standort, und gestattetdas Mithören
„ IMSI-Catcher für 1500 Euro im Eigenbau.“
Heise-online, 1. August 2010.
Netzwerkaufklärung
Unauthorized Views only
Red Baron Roost, Bonn
IMSI-Catcher:
„Das Gerät arbeitet dazu gegenüber dem Mobiltelefon wie eine Funkzelle (Basisstation) und gegenüber dem Netzwerk wie ein Mobiltelefon; alle Mobiltelefone in einem gewissen Umkreis buchen sich bei dieser Funkzelle mit dem stärksten Signal, also dem IMSI-Catcher, ein. Der IMSI-Catcher simuliert also ein Mobilfunknetzwerk.“
(Wikipedia)
Unauthorized Views only
Red Baron Roost, Bonn
Datenstrom
Statistische Verfahren zur Massendaten-Auswertung
Netzwerkaufklärung
Ich erfahre:
Wer, Wann, Wo, mit Wem, Wie lange, Wie oft telefoniert (kommuniziert) hat.
Unauthorized Views only
Red Baron Roost, Bonn
Sprecher, Stichworte und Zusammenhängekönnen zu geplanten Ereignissen führen
Dabei helfen Informationen aus anderenAktivitäten, wie z.B. Netzüberwachung
Gewonnene Informationen dienen demgezielten Einsatz der Linguisten
Erkenne ich ein geplantes Ereignis ?
Unauthorized Views only
Red Baron Roost, Bonn
Problem: 40 versch. Sprachen im Einsatzgebiet
- Aufkommen schwankt
- Kapazitäts-Engpässe
- Bedrohung, Streß
In der Heimat Pool an (ausgeruhten) Linguisten
Daten erfassen – ableiten – Ergebnisse zurückschicken
Reach Back
Unauthorized Views only
Red Baron Roost, Bonn
1.: Quelle: Funk, Mobilfunk, Glasfaser
2.: Funk: Frequenz beliebig, Zeit unsicher
3.: Mobilfunk: ständiger Datenstrom
4.: Inhalt: unbestimmt, meist wertlos
5.: Charakter: überraschend: manchmal Merkel
6.: Ernüchternd: Normalbürger stört nur
Technische Randbedingungen
Unauthorized Views only
Red Baron Roost, Bonn
Beispiel Boger
Beispiel Medav
Klassifikatoren
Verschriftungssoftware (nicht OCR)
Unauthorized Views only
Red Baron Roost, Bonn
Vielen Dank für Ihre
Aufmerksamkeit
Top Related