РАСШИРЕНИЕ ВОЗМОЖНОСТЕЙ СИСТЕМ АУДИО-РАСПОЗНАВАНИЯ РЕЧИ
Осетров Виктор - CEO
Проблема
Недостатки аудио-распознавателей речи
• Подверженность звуковым помехам;
• Не определяют паузы в речи;• Необходимость постоянного
доступа к сети Интернет;• Макс. точность 90-95%
RealSpeaker повышает точность распознавания за счет:
• Определения речи реального диктора
• Подавления аудио-шумов
• Выделения микропауз в речи
Решение
Что было:
Технология
IDS камера
Что стало:
Технология
VGA камера
Дорожная картаГод 2012
Кварталы 1 2 3 4
НИОКР Доработка архитектуры
под задачи реализации
визуального расширения
на основе минимальных
требований мобильных
устройств, планшетников
и ПK
Создание системы выделения
микропауз, определения речи
реального диктора, подавления аудио-
шумов на основе параллельной
раскадровки видео-потока и аудио-
сигнала
Оптимизация используемых
алгоритмов, оценка
роботоспособности,
интеграция технологии
видеоидентификации
движения губ диктора в
существующие решения
аудио-распознавания речи
Реализация
продукта и
выход
Реализация основной функциональности
системы (создание прототипа, который
способен захватывать и отслеживать
движение губ пользователя на VGA камерах
через сервер программы)
Разработка опытного образца
Общее
организацио
нное
развитие и
план по
найму
Организация юр. Лица.
Получение статуса
резидента «Сколково»
Получение
финансирования,
доукомплектование
команды. Общая числ.
команды - 6 чел.
Получение
финансирования,
доукомплектование
команды. Общая
числ. команды - 9
чел.
Общая числ.
команды - 12
чел.
Первые продажи.
Совершенствование системы
на основе запросов
аудитории и накопления базы
данных. Общая числ.
команды - 16 чел.
Пример предполагаемой работы расширения RealSpeaker
• Интеграция со всеми адресными строками
• Google +• Google Maps• Google Переводчик• Youtube• Dragon Mobile SDK• Windows Embedded Automotive
Продукт
Технология может быть интересна для:• Google Voice Search• Dragon Naturally Speaking• Microsoft Speech Recognition, Windows
Automotive• CMU Sphinx• Siri Apple
Прямые конкуренты:• Kinect2 Microsoft• Google Face Recognition• Face/Smile Detection, Face Shutter• Open CV
Конкуренты
Показатели рынка распознавания речи*: • CAGR - 9% в год. • V рынка - 38,6 млн.$ (2010 год)• Прогноз V рынка - 58, 4 млн. $
(2015 год)
Показатели рынка мобильного распознавания голоса**:• V рынка - 32,7 млн$ (2009 год)• Прогноз V рынка - 99,6 млн. $
(2014год)
Объем рынка
_______________*по данным BCC Research
_______________**по данным Datamonitor
Пользователи Google Voice Search, Dragon Mobile, Windows Automotive и т.д.:
…которые имеют:• Смартфоны или компьютеры с VGA
камерой• Высокопроизводительный процессор• 3G/4G, широкополосный доступ к
сети ИнтернетКаждый четвертый поиск на Android производится при помощи голоса* - *Данные Google за 2010 год.
Рыночная ниша
Комментарии:В проект вложено 650 тыс. руб.• Грант программы У.М.Н.И.К. • Грант компании LG• Собственные средства
P/L 1 год, k.$
2 год, k.$
3 год,k.$
Затраты 110 305 745
Выручка 125 1565 5780
Разница по периоду
- 5 + 1260 +5035
Инвестиции
Бизнес-модель
B2B• прямые продажи лицензии или
всего проекта софтверным вендорам, стратегическим партнерам
B2C• продажа SaaS решений
собственныx приложений на сайте, а также запуск расширения на маркетах
• Осетров Виктор – автор и руководитель проекта/CEO
• Стёпин Алексей – технический руководитель проекта/CTO
• Облопов Андрей – инженер-разработчик/developer
• Сухарева Мария – маркетолог/CMO
Команда
5$
• RealSpeaker – визуальное расширение возможностей аудио-распознавателей речи;
• Продукт – лицензия/SaaS решение (приложение на маркетах или отдельное ПО):• App Store• Android Market• Chrome Web Store• RealSpeaker soft
• Потребность в инвестициях:• 110 тыс. $. – для запуска продукта на
рынок
Резюме
Спасибо за внимание!
Контакты:Тел. 8 927 87 333 21Skype: osetrov.victorE-mail: [email protected] Twitter: @RealSpeaker
Top Related