Дата публикации: 22.05.2021
Двое омичей – Сергей Баранов и Дмитрий Абрамов – с нуля создали успешный бизнес. Они разработали онлайн-платформу для перевода книг в аудио-формат. Самое интересное, что озвучка происходит при помощи искусственного интеллекта и нейронных голосов. Всего за два года омская компания Speechki смогла добиться многого: начала сотрудничать с известным издательством «Эксмо» и Storytel – одним из самых крупных сервисов аудио и электронных книг в мире. Компания начинает потихоньку осваиваться на рынке и работать уже с зарубежными книжными издательствами. О том, как друзьям из Омска удалось создать успешный бизнес и какие у них планы медиа «Трамплин» рассказал один из основателей стартапа 29-летний айтишник Сергей Баранов.
На 2-м курсе придумали свой проект, заменяющий отпечатки пальцев
Сергей Баранов
- Сергей, тебе всего лишь 29 лет, но ты уже много лет варишься в IT-бизнесе. И весьма успешно. Расскажи о себе?
- Заканчивал СибАДИ в 2015 году. Факультет «Информационные системы в управлении» по специальности «Автоматизированные системы». Там же окончил аспирантуру два года назад. Первые осознанные шаги в IT, наверное, были на втором курсе института. Мы с моим коллегой и сооснователем Speechki Дмитрием Абрамовым делали проект по распознаванию человеческих вен, их рисунка. Можно было поднести к инфракрасной камере ладонь, она получала рисунок и его мы планировали использовать вместо отпечатка пальцев, которые вообще-то можно и украсть. Потому что он у каждого человека тоже индивидуальный и никогда не повторяется. С этим проектом мы выигрывали омский конкурс УМНИК с премией в 400 тысяч рублей. Мы планировали применять нашу разработку для банковского сектора – для терминалов и банкоматов. Но в силу того, что мы были совсем молодыми, начинающими предпринимателями и пробиться в банки не смогли. В итоге проект лежит в ящике стола, скорее всего, к нему мы не вернемся. Уже в 2016 году мы открыли с Димой свою компанию КВАРК.
- Почему именно такое название?
- Это не аббревиатура, все гораздо проще. Это связано с физикой. Слово КВАРК созвучно с мельчайшей частицей кварком. Этим названием мы хотели показать, что готовы досконально погружаться в любую тему, до самых мелочей. Мы начинали заниматься поисковым продвижением сайтов, разработкой простых сайтов. Постепенно обрастали знакомствами, рекомендациями, получали новых клиентов и в Омске, и в России. Всего за три года мы вошли в ТОП-компаний в Омске по Web-разработкам по рейтингу Runet. Мы сотрудничали со многими крупными компаниями: для АЗС «Топлайн» разрабатывали систему лояльности через приложение, сотрудничали с «Евразией». Работали с довольно большими страховыми и строительными компаниями, которые не очень известны, но имеют миллиардный оборот.
Новые кадры присматривали, преподавая в аспирантуре
- Удавалось вам зарабатывать?
- Ну, все относительно, конечно. Сперва нас было двое, потом четверо. Чуть позже мы разрослись до компании из 15 человек. В пиковый год оборот компании КВАРК составил около 20 миллионов рублей. Первое время мы работали из дома онлайн. Созванивались с Димой по Skype, обсуждали текущие дела, делили обязанности. Например, я отвечаю на почту клиентам, а Дмитрий занимается технической частью. Сами разбирались в бухгалтерии. Все было очень по-домашнему. Первых сотрудников мы начали набирать через год, когда просто стало не хватать рук на техническую часть.
- Где вы находили людей? Бросали клич в интернете и собеседовали претендентов?
- Все было гораздо интереснее. В аспирантуре мы вели практические занятия. И уже там подбирали кадры. Талантливых и въедливых ребят с горящими глазами было видно сразу. Так же как и тех, кто просто пришел за галочкой и отработать практику для учебы. Конечно, мы больше времени уделяли тем, кто хочет чему-то научиться. Обычно это 1-2 человека из группы.
Команда проекта
- Как же вы пришли к своему проекту Speechki?
- Когда мы достигли определенных высоких результатов (получили базу клиентов, попали в различные рейтинги и вышли на пик), поняли: оказание услуг по разработке – не совсем наш путь. Здесь чтобы быстро расти и много зарабатывать, нужна большая компания с множеством сотрудников. Ведь чем больше у тебя людей, тем больше ты можешь взять проектов. Мы же хотели сами производить и создавать продукт, приложения. Поэтому КВАРК встал именно на этот путь. В 2018-2019 году наряду с оказанием услуг мы стали заниматься аудио. У нас к тому моменту были определенные наработки с этим форматом, мы начали проверку наших гипотез в области синтеза речи. Решили покопать в эту сторону, в сторону озвучки. Совсем скоро стали создавать аудиокниги.
Цифруется только 4% книг
- Почему именно аудиокниги, а не что-либо другое?
- Мы нашли проблему: на рынке книг ежегодно издается 2,2 миллиона уникальных произведений. Но только 4% переводится в формат аудио. И если вы попытаетесь найти свежую книгу в аудио, очень мала вероятность, что у вас это получится.
- Почем так происходит?
- 95% книг не переводится в аудио потому что это невыгодно для издательств. Это очень дорого в производстве и не окупится. При этом озвучка книги довольно сложный и трудоемкий процесс. Обычно задействуется 8-9 человек: менеджеры, которые согласовали перевод книги в аудио, редакторы, делающие аудиоподготовку текста. Мы работаем с издательствами. Перед запуском Speechki мы встретились с несколькими, чтобы понять рынок. Спрашивали их, почему они конвертируют так мало книг в аудио. В итоге спросили, было бы им интересно, если бы нами созданный продукт решил эту проблему и помог им зарабатывать дополнительно на аудиокнигах. При этом издательствам не нужно создавать дополнительный штат сотрудников. Мы увидели их интерес и стали получать первые заказы на аудиокниги.
- Первую помните?
- Конечно. Это перевод с финского на русский - Mats Fogelqvist (Матс Фогельквист) - Slutsålt (Продано). Это не самая популярная книга, ее мы делали в рамках пилота для известной платформы аудиокниг Storytel. Думаю, все о ней слышали.
- У меня тогда сразу вопрос. У вас появился инструмент по созданию востребованного продукта. Почему вы решили продавать его уже готовым площадкам, а не стали делать новую – условно, второй Storytel? Получается, на вашем продукте зарабатывали и другие.
- У нас были такие мысли. Но это совершенно другой рынок и бизнес. Нам бы пришлось создавать свою сеть по продаже аудиокниг через приложение. Для нас это было бы сложнее, плюс требовались бы колоссальные денежные вливания.
- Сколько?
- Это минимум десятки миллионов, может, даже сотни.
«Зачем нам конкурировать «ЛитРес» и Storytel – у нас свой путь»
- Мы говорили о том, почему вы не пошли по пути второго Storytel…
- Да. Сколько бы нам тогда помимо денег потребовалось дополнительно еще и людей, вообще никто не знает. Да, мы бы двигались в сторону того, чтобы стать вторым Storytel, только пытались бы стать их конкурентами. При этом нашими конкурентами были бы еще и «ЛитРес», «Эксмо», магазины. Получается, мы сразу бы залетали на очень конкурентный рынок. И зачем?
- С более слабыми стартовыми позициями.
- Да, именно. И потом у нас не было больших денег. Мы сохранили какие-то средства от предыдущих проектов. В итоге к этому моменту мы создали более 700 аудиокниг на разных языках. Дела идут неплохо, но я помню, как сложно было в самом начале. На обработку первых книг, чтобы добиться хорошего качества, требовалось просто огромное количество времени.
- В чем были проблемы?
- Первую 7-часовую книгу с помощью искусственного интеллекта мы делали, наверное, часов 120. Записать диктора, который читает текст, было бы быстрее. Были проблемы с ударениями, темпом, паузами. Программа была сырая. Сейчас точно такую же книгу мы переводим в аудио за 10-12 часов, то есть в десять раз быстрее. Это для книг на русском языке, на иностранном языке будет чуть дольше. Наша нейросеть и программа самообучаема, она запоминает на будущее правки, которые делаются вручную редакторами. На русском языке все хорошо, но на произведения на португальском, французском, испанском у нас все еще уходит на конвертацию 30-40 часов. По этой причине 95% наших книг пока на русском языке. Мы для себя знаем, как решить эту проблему. Это займет 2-3 года. Наша цель – сократить время создания 8-часовой аудиокниги до 40 минут. Работаем над обработкой и обучением нашей системы. Если все получится, мы сможем при том же штате сотрудников делать в 20 раз больше аудиокниг.
- Расскажите всю технологическую цепочку, как появляется аудиокнига от омского проекта Speechki.
- В издательстве есть свои прогнозы, какая книга будет продаваться лучше, какая более востребована. Смотрят на известность автора, анализируют поисковые запросы. Так происходит выбор произведения при его заказе нам. Мы на это вообще никак не влияем. Издательство формирует список таких книг и присылает их нам в текстовом виде. Мы берем их и делаем аудиоподготовку. Потому что в некоторых книгах есть текстовые фразы вроде «как было написано выше». Нам их приходится заменять на «как было сказано ранее». У нас ведь аудиоформат. Определенная проблема – большое количество сносок. Наша задача сделать ведь книгу понятной, пояснить какие-то термины. Поэтому и ведется аудиоподготовка. Дальше мы отправляем текстовый файл редактору на проверку. После этого файл загружаем в систему, которая озвучивает текст через синтез речи. Позже редактор отслушивает это аудио и тут же вносит правки в системе, если допустим допущено неправильное ударение. Тогда редактор выделяет нужную букву и выбирает, что ударение должно быть на нее. Это выглядит как некий google-документ, только с аудио. И так отслушивается весь текст. Когда редактор все послушал, он жмет кнопку «собрать файл» в нужном формате – mp3 или wav. Кто-то из клиентов хочет получать не единый файл, а по главам. Это зависит от того, как и какой клиент потом продает своей аудитории аудиокнигу.
«Уезжать из Омска не планируем»
- От чего зависит оплата аудиокниги вам?
- Это, конечно, зависит от длительности книги. В среднем под российский рынок на нашем языке произведение на 8-10 часов стоит где-то 9 тысяч рублей.
- Не дешево? Я думал, это стоит значительно дороже.
- Наверное. По англоязычному рынку, который и производит большую часть книг, стоимость одной аудиокниги начинается от 3 000 долларов. Много факторов на это влияют, начиная с того, что оплата труда за рубежом выше. Мы же получаем за конвертации произведения в аудио на английском языке 400 долларов (около 30 тысяч рублей).
- Исходя из этого, можно предположить, что англоязычный рынок проекту Speechki интереснее.
- Он интересен нам не из-за стоимости. Маржинальность там примерно такая же. Ведь при производстве аудиокниги на английском языке мы и затрат несем больше. Нам нужно будет найти редактора, который с детства говорит на этом языке. Он чувствует язык и должен отшлифовать книгу, чтобы все интонации и паузы выглядели естественными для носителя. Мы ведь создаем файл с помощью искусственного интеллекта. А стоимость труда за рубежом, как я говорил, значительно выше. Поэтому и затрат больше. Английский рынок интересен нам, так как банально книг на этом языке больше и самих издательств. А в России же издательский рынок сильно монополизирован – в нем буквально 3-4 компании занимают около 90%. Перспективы есть: в мире около 30 тысяч издательств, с которыми можно сотрудничать. Плюс сейчас в аудио переводится только 4% новых книг и есть 140 миллионов книг, которые за все время произвело человечество. Каждый год это количество прирастает на 2 миллиона произведений, которые тоже можно оцифровать.
- Вы перевели с 2019 года более 700 книг. А сколько максимально Speechki сможет конвертировать их в аудио, если на вас сейчас посыплются заказы? Каков предел?
- Максимум представить сложно. Мы находим редактора, который в месяц может работать с 10-15 книгами – не больше. Где мы найдем много редакторов, доступных нам. Даже при том, что нам не нужен редактор-профессионал. Мы ищем носителя своего языка, который почувствует все нужные интонации и сможет внести правки через наш сервис. Сейчас у нас около 20 доступных редакторов, которые могут делать 300 аудиокниг в месяц.
- Получается, вас сдерживает именно человеческий фактор? Не думали, как полностью автоматизировать процесс и уйти от необходимости в редакторах?
- Есть вариант, чтобы искусственный интеллект сам отслушивал конвертированный аудиофайл и показывал, допустим, в этой части текста все в порядке, а здесь ошибка. Мы идем в эту сторону, это вопрос ближайших двух-трех лет.
- Представим вашу компанию через 5 лет. Вы успешны, заказы проекта Speechki и выручка выросли в десятки раз. Рассматриваете вы вероятность своего переезда из Омска?
- Мы думали над этим вопросом. Но та же пандемия показала: относительно комфортно можно спокойно работать со всем миром и из Омска. Сейчас у нас лишь есть проблема, связанная с несовпадением часовых поясов для ведения переговоров. Все издательства готовы общаться и решать вопросы даже без личной встречи. Раньше это было бы невозможно. Чтобы покрывать все часовые пояса, нам сейчас придется работать ночью. Ведь когда в США утро, у нас уже 20-21 час. Возможно, в будущем мы откроем какое-то свое представительство ближе к этому часовому поясу. Сейчас у нас есть сотрудники в Москве, Украине, которые ближе по времени к США. Но пока об отъезде из Омска Speechki не думают.
Через интернет
Банковской картой или другими способами онлайн
Через банк
Распечатать квитанцию и оплатить в любом банке
Скачайте и распечатайте квитанцию, заполнте необходимые поля и оплатите ее в любом банке
Пожертвование осуществляется на условиях публичной оферты
распечатать квитанциюПочему нужно поддерживать «Трамплин»
Все платежи осуществляются через Альфа-банк