--- title: Edu-Parser - обработка субтитров и текстов для образовательных проектов lang: ru disqus: hackmd image: https://i.imgur.com/wZ0TzZp.png --- # Edu-Parser ![](https://i.imgur.com/wZ0TzZp.png) Этот парсер был написан для нескольких образовательных проектов и позволяет вам превращать текстовый контент в структуры данных, которые можно использовать в ваших приложениях. Он состоит из нескольких крупных разделов. * **Captions/subtitles** - превращает субтитры разных форматов (srt, vtt, audacity) в JavaScript объект вида [ { start, end, voice, text } ] * **Intext** - разбивает любой текст по заданным шаблонам (ругулярным выражениям) на помеченные кусочки вида [ {label, text} ]. Вы можете пойти дальше и каждому типу блока сопоставить парсер - извлекающий данные и реплейсер - заменяющий тексты. * **Subs-as-book** -- превращают субтитры формата VTT в подобие книги/чата мессенджера, с оглавлением, картинками и аватарками. Но для этого субтитры надо заранее подготовить (добавить туда картинки, заголовки сцен и т.д.) * **Frazy** -- формат импорта/экспорта материалов с пофразовым озвучиванием, многоязычными переводами и вспомогательными слоями (комментарии, транслитерация и т.д.) Хотя эти задачи довольно разные, все они расширяют применение текстов в образовательных целях, добавляя в них краски, звуки и интерактивность. Поэтому мы объединили все парсеры в одном месте, чтобы вы могли подобрать для себя лучшие комбинации этих инструментов.