Techdays 2012 - Tout sur Microsoft Speech
-
Upload
sputier -
Category
Technology
-
view
2.658 -
download
1
description
Transcript of Techdays 2012 - Tout sur Microsoft Speech
palais des congrès Paris
7, 8 et 9 février 2012
Tout sur Microsoft Speech8 février 2012 – 17h30
Sébastien PutierConsultant / FormateurWinwise
Nicolas CalviMVP Surface, Consultant / FormateurWinwise
Winwise en chiffres : 9,5 M€, 70 collaborateurs, 800 clients qui nous font confiance.
Winwise a été créé en 1996 autour de 2 métiers:- La Formation, centre agréé Microsoft- Le Conseil
Et 3 types d’intervention chez nos clients:- L’expertise- L’accompagnement- La réalisation de projets aux forfaits
Nos clients sont de tout secteur d’activité et sollicitent nos 5 domaines de compétences:- Interfaces Riches et Naturelles- Architecture- Collaboratif- Business Intelligence et Data Management- Infrastructure
Tous nos collaborateurs sont certifiés sur les nouvelles technologies Microsoft.
Sommaire
Introduction à SpeechSpeech c’est quoi ?Survol du FrameworkLes modes d’utilisations
Reconnaissance vocaleMode reconnaissance automatique (Dictée)Mode reconnaissance par grammaire
Synthèse vocaleKinect
INTRODUCTION
La solution de synthèse et reconnaissance vocale de Microsoft
En évolution constante depuis la première release (1995)
Intégré à tous les Windows depuis Windows 95
Integré au framework .Net depuis la release du Framework .Net 3.0
Speech, c’est quoi ?
Une interface NUI (Natural User Interface)
Utilisé pour la commande d’interface à la voix
Très utile pour des interfaces à destination de personnes à mobilité réduite.
Ne nécessite pas d’apprentissage pour fonctionner, mais il est vivement conseillé pour une meilleure reconnaissance.
Speech, c’est quoi ?
A la base vient de la « SAPI ».
Disponible avec l’assembly « System.Speech.dll » :Synthèse vocale : « System.Speech.Synthesis »Reconnaissance vocale : « System.Speech.Recognition »
Un pack par langue à télécharger
Existe aussi en version Serveur : « Microsoft.Speech », qui peut être récupéré au travers d’un SDK gratuit et ne possède pas exactement les même fonctionnalités.
Survol du Framework
La reconnaissance vocaleEn mode dictée pour convertir un discours en donnéesEn mode grammaire pour détecter des mots précis
Les modes d’utilisation
La synthèse vocalePermet de faire parler son ordinateurModulable grâce à des fichiers de configuration
RECONNAISSANCE VOCALE
Point d’entrée : Classe « SpeechRecognitionEngine »
Moteur alimenté par des grammairesObjets de type « Grammar »
Moteur configuré pour une langue à la fois
Plus efficace avec le langage naturel « Ouvrier » au lieu de « Péon »
Reconnaissance vocale
Permet la transcription de la voix en données
Chaîne de caractères
Utilisation d’une « grammaire de dictée »Objet « DictationGrammar »
Exemple d’utilisationTraduire à la volée un discours en utilisant « Microsoft Translation »
Mode reconnaissance automatique (Dictée)
Pour scruter certains mots ou expressions
Une grammaire, c’est :Un ensemble de règles définissant quoi reconnaîtreUn tag permettant d’identifier la règle reconnue
On crée une grammaire :En lisant un fichier SML (Semantic Markup Language)A partir d’un objet GrammarBuilder
Mode reconnaissance par grammaire
GrammarEquivalent en code managé du fichier SMLDéfinit les mots à détecter
GrammarBuilderConstruit des objets « Grammar »Permet de générer du SML
Mode reconnaissance par grammaire
Exemple de fichier SML
Mode reconnaissance par grammaire
DEMO
SYNTHESE VOCALE
Transformer une donnée texte en flux sonore compréhensible
Point d’entréeClasse « System.Speech.Synthesis.SpeechSynthetizer »
Trois types d’input possiblesTexte brutFichier ou texte SSMLPrompt / PromptBuilder
La synthèse vocale
SSML = Speech Synthesis Markup LanguageStandard pour la synthèse vocaleBasé sur XMLSpécification disponible sur le site du W3C
http://www.w3.org/TR/speech-synthesis/
Permet d’améliorer la qualité du rendu de la synthèseSimple : Une quinzaine de balises
<say-as><emphasis><break>…
SSML en bref
Exemple de Fichier SSML
Prompt Equivalent .Net du fichier SSML
PromptBuilderConstruit des objets PromptPermet de générer du SSML
Prompt & PromptBuilder
DEMO
KINECT
Repérage spatial des sources audio
Atténuation native du bruit ambiant
Le SDK Kinect inclue le SDK Microsoft Speech
Kinect
DEMO
Sébastien Putier Blog : http://sputier.wordpress.com Email : [email protected]
Nicolas Calvi Blog : http://blog.nicolascalvi.com/ Facebook : Black Blog Twitter : @nicolascalvi Email : [email protected]
Contacts
Chaque semaine, les DevCampsALM, Azure, Windows Phone, HTML5, OpenDatahttp://msdn.microsoft.com/fr-fr/devcamp
Téléchargement, ressources et toolkits : RdV sur MSDNhttp://msdn.microsoft.com/fr-fr/
Les offres à connaître90 jours d’essai gratuit de Windows Azure www.windowsazure.fr
Jusqu’à 35% de réduction sur Visual Studio Pro, avec l’abonnement MSDN www.visualstudio.fr
Pour aller plus loin
10 février 2012
Live Meeting
Open Data - Développer des applications riches avec le protocole Open Data
16 février 2012
Live Meeting
Azure series - Développer des applications sociales sur la plateforme Windows Azure
17 février 2012
Live Meeting
Comprendre le canvas avec Galactic et la librairie three.js
21 février 2012
Live Meeting
La production automatisée de code avec CodeFluent Entities
2 mars 2012
Live Meeting
Comprendre et mettre en oeuvre le toolkit Azure pour Windows Phone 7, iOS et Android
6 mars 2012
Live Meeting
Nuget et ALM
9 mars 2012
Live Meeting
Kinect - Bien gérer la vie de son capteur
13 mars 2012
Live Meeting
Sharepoint series - Automatisation des tests
14 mars 2012
Live Meeting
TFS Health Check - vérifier la bonne santé de votre plateforme de développement
15 mars 2012
Live Meeting
Azure series - Développer pour les téléphones, les tablettes et le cloud avec Visual Studio 2010
16 mars 2012
Live Meeting
Applications METRO design - Désossage en règle d'un template METRO javascript
20 mars 2012
Live Meeting
Retour d'expérience LightSwitch, Optimisation de l'accès aux données, Intégration Silverlight
23 mars 2012
Live Meeting
OAuth - la clé de l'utilisation des réseaux sociaux dans votre application
Prochaines sessions des Dev Camps