Try   HackMD

2. Масштаб языка и учебные материалы к нему

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →
People are suffering. People are dying. Entire ecosystems are collapsing. We are in the beginning of a mass extinction, and all you can talk about is money and fairy tales of eternal economic growth. (Greta Thunberg) 
Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →
There are 6-7k languages currently spoken around the World. And 50-90% of them will have become extinct by the year 2100.

Every 14 days a language dies.

The global English language learning market value was around USD 33.5 billion in 2018 and is expected to reach around USD 54.8 billion by 2025, growing at a CAGR of 7.1%. (Open Sources)

Оглавление

Круговая диаграмма

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Столбчатая диаграмма

Колоссальный разрыв между языками лучше всего виден на этой диаграмме. Слева 1-й - английский с 1,3 млрд носителей, а справа, 200-й язык по количеству носителей, бемба, с 4 млн. носителей.

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Числа

  • В мире насчитывается около 6 тыс. языков.
  • 6 официальными языками ООН владеет почти 50% населения Земли.
  • На 30 языках говорит 2/3  населения Земли.
  • На 100 языках говорит 85% землян.
  • На 96% языков говорит 4% людей

Крупные языки

1 язык (английский) является планетарным и им владеют в той или иной мере около 2 млрд человек.

5 языков считаются международными (китайский, испанский, арабский, русский, французский). На каждом из них говорят сотни миллионов людей, десятки стран и народов, на разных континентах.

Сохраняют интерес к себе и языки бывших империй, значительно повлиявших на человеческую цивилизацию: немецкий, итальянский, турецкий, персидский, португальский, японский (у каждого из них от 60 до 200 млн носителей).

Довольно крепкую позицию занимают языки национальных государств, таких как Албания, Болгария, Хорватия, Дания, Эстония. У каждой такой страны есть свой язык, зачастую образованный от названия страны, - албанский, болгарский, хорватский, датский, эстонский.

Много носителей у языков крупных провинций густонаселенных стран. Например, на языке маратхи индийского штата Махараштра говорят 80 млн. человек. Столько же человек в мире говорят на немецком (официальный в 5 европейских странах).

Описанные выше масштабы языков гарантируют:

  • наличие актуальных учебных материалов и методик,
  • качественное и системное обучение языку с самого детства,
  • широкое применение языка в быту и общественных институтах.

Английский. Непревзойденное лидерство

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →
Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Процент англоговорящих по странам

Английский язык находится на голову выше всех остальных языков обилием обучающих материалов. Английский учат люди всех цветов кожи, народов, религий. Его знает большинство ученых и представителей сложных профессий во всём мире. Это глобальный язык общения, науки, технологий, бизнеса, морских и воздушных перевозок и т.д.

Помимо таких богатых, технологичных и влиятельных стран как США, Великобритания, Канада, Австралия, где английский является основным, все остальные развитые страны также инвестируют в изучение этого языка как в частном порядке, так и на государственном уровне.

Постоянно создаются новые обучающие материалы, из университетов выпускаются армии преподавателей, проводятся экзамены на международные сертификаты. Мировая индустрия обучения английскому языку в 2019 году оценивалась в $33 млрд и по прогнозам достигнет 55 млрд в 2025. Эта цифра сопоставима с военным бюджетом таких стран как Британия, Россия и Германия. Ни один другой язык даже близко не имеет такого оборота денег вокруг себя.

В индустрии развлечений тоже доминирует английский: самые популярные фильмы, сериалы, компьютерные игры и песни - выпускаются на английском и иногда их даже не переводят на другие языки. Самая дорогая и прибыльная компьютерная игра в мире GTA 5 не имеет перевода ни на один язык мира. Крупнейшая платформа для работы над программным кодом Github тоже не имеет перевода ни на один язык мира (её интерфейс).

Весомую роль играют и юридические меры. Законы США и Британии обязывают мультимедийные компании снабжать все видео субтитрами. Изначально это делалось как забота о слабослышащих, но в итоге пользу получают все. Для любого англоязычного фильма, если вы не расслышали слово или не поняли фразу, можно загуглить субтитры и перевести каждое отдельное слово в словаре. Иногда мне очень нравится фильм, я скачиваю титры к нему и читаю как книгу. А потом снова смотрю фильм и узнаю уже прочитанные заранее слова.

Все мы привыкли к обилию материалов для изучения английского: аудиокниг, фильмов, субтитров, словарей, мобильных приложений, подробных разборов учебников на ютубе и т.д.

И если мы начинаем изучать другой язык, то на автопилоте ожидаем наличия подобных материалов. Но скорее всего их не будет.

Новые типы учебных материалов

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Всё начинается с появления новой информационной технологии.

Например, когда появился электронный текст, многие осознали его преимущество над бумагой. Его можно бесплатно неограниченно тиражировать (копи/пастить), в нём можно искать текст набором нескольких букв, а не перелистыванием страниц. Сразу после появления это новшество внедрили в изучение английского языка. Появились электронные словари: англо-немецкий, англо-русский, англо-испанский, англо-китайский,

Технология популяризируется, оттачивается, появляются несколько распространенных форматов (stardict, xdxf). И со временем появляются и не английские словари: немецко-украинский, арабо-русский, франко-албанский, то есть распространяются на разные языковые пары. Это долгий процесс, который может занимать десятилетия.

Потом появляются базы данных, и все переносят тексты словарей в базы данных, т.к. там ещё удобнее искать нужные фрагменты. Появляются новые типы баз данных (noSQL после SQL), искусственный интеллект… Конечно пользователь уже не чувствует такой разницы как между бумажной версией и электронной, но, тем не менее, где-то за ширмой находятся новые технологии и они открывают всё новые и новые возможности.

Другой пример, появляется технология flash  - позволяющая к уже имеющимся электронным текстам добавлять анимации, звук и интерактивные элементы. Вскоре после появления их начали использовать для изучения английского всеми другими народами. И только потом они распространялись для изучения других языков.

На смену flash пришёл html5 и все плавно перешли на новый формат, и снова вы могли не заметить этого (например, как ютуб плеер перестал использовать флеш, визуально он для многих тот же), тем не менее он открыл новые возможности для использования медиа в интернете.

Появление Web Audio API, например, открыло возможности визуализировать на html странице звуковую волну. Появились онлайн редакторы субтитров, где люди могут коллективно создавать и улучшать их, выделяя фразы прямо на звуковой дорожке.

Относительно недавно стали популярными фильмы с субтитрами онлайн. Хотя субтитры зародились вместе с самим кино и Чарли Чаплином, даже раньше звука, и они были на первых ленточных проекторах, VHS, CD, DVD, но расцвет их использования в качестве учебного материала наступил в эпоху онлайн. Всё потому, что волонтеры по всему миру ищут титры и если не находят - то пишут их, следующие волонтеры подхватывают их и переводят на разные языки и публикуют, сверяют, правят, лайкают, дизлайкают, распространяют по открытым хорошо проходимым каналам. Дальше их можно мгновенно наложить на видео прямо на странице сайта. Для этого не требуется “прожигать диск” на Nero Burning Rom, предварительно вшив титры в каждый кадр в видео специальными монтажными фильтрами вроде VirtualDub как это делалось раньше.

1 шаг в сторону от английского

Почему все новшества в первую очередь касаются изучения английского? Потому что его изучают намного больше людей, чем любой другой язык, соответственно больше объем рынка и ожидаемая рентабельность. Постепенно эти новшества перенимают другие крупные языки, а  до малых языков они если и доходят, то только спустя десятилетия.

Крупные языки (пример с арабским языком)

Когда я изучал арабский язык, то столкнулся с рядом сложностей в поиске учебных материалов.

Хотя этот опыт относится к конкретной языковой паре Арабский-Русский (Ar-Ru), учитывая, что оба языка - крупные международные, с богатой историей взаимодействия (в России живет около 20 млн мусульман, и многие арабские страны были в сфере влияния СССР), я думаю, что подобная ситуация актуальна и для многих других языковых пар, особенно для не крупных и не международных.

Словарь

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

В 2008 году, когда у меня появился полноценный интернет, я оказался перед горьким фактом, что не существует электронного арабско-русского словаря. Это было большим мучением ковыряться в бумажной книге, особенно когда ты знаешь что английские слова можно переводить одним кликом мышки. Тогда не было и OCR для арабского, и если бы даже был, не было книги в хорошем качестве, чтобы отсканировать и распознать текст. Я потратил 2 года, чтобы собрать группу волонтеров и набрать этот текст из бумажной версии и сделать приложение для Windows. На данный момент из того текста сделали много мобильных приложений. Но моё предложение улучшить текстовую базу и добавить новые интерактивные функции, всегда упирается в вопрос: “А зачем? Словарь же уже есть, ты что не видел? Его же можно скачать”. И показывают мне словарь с текстом, который я набирал своими руками 12 лет назад по бумажным книгам.

Аудикниги

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

В 2012 году я не мог найти аудио версию самой популярной в исламском мире книги: “Запечатанный нектар”. На самом деле, как оказалось, она была, сокращенная 4-х часовая версия, но она не выходила нигде в поиске. Один араб прислал мне ссылку на неё, когда я в  группе в фейсбуке упрекнул арабов в отсталости, что даже такую популярную книгу невозможно найти в интернете в аудио версии. Сейчас уже появились приложения со множеством аудиокниг и на ютубе есть полная 10-часовая версия книги “Запечатанный нектар”.

Субтитры

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

В 2015 году я к своей большой радости нашёл документальный фильм Аль-Джазиры про арабский язык, 4 серии по 49 минут. Там говорили многие люди с разными акцентами и было много научных и исторических терминов. Конечно же мне нужны были субтитры, чтобы разобраться с материалом.

Я не смог их найти и попросил друга-сирийца, он учился на врача в моем родном городе, сделать титры, и он сделал. Каждая серия занимала около 16 страниц по 1800 символов. Это была большая работа.

На тот момент в Ютубе уже была функция “Позволить сообществу добавлять субтитры”, но она была отключена авторами канала для этих фильмов. Я написал в разные формы обратной связи, чтобы они включили эту возможность, и я добавил бы субтитры. Ведь они важны для миллионов людей кто учат арабский язык по всему миру. Но они не ответили и до сих пор не добавили их.

Я не знаю почему так происходит. Не думаю что для них написать субтитры - проблема с какой-либо стороны. Кажется, им достаточно того, что они сами понимают весь фильм на слух, и  не осознают что из 1.4 млрд мусульман-неарабов на земле довольно много людей интересуются арабским и им нужны субтитры к документальному фильму про арабский язык, чтобы прочитать слова, которые они не успевают или не могут расслышать…

Малые языки

В мире около 100 языков с числом носителей от 1 млн до 7 млн. Это довольно крупные народы, но если у них нет государства, то для изучения их языка вы вряд ли найдете в сети что-то кроме устаревших текстовых сайтов, плохо отсканированных учебников и шипящих аудиозаписей.

На моём родном языке, у которого почти 1 млн носителей, только в 2018 году появились аудио книги, их всего 5 и они продолжительностью не больше 2 часов (то есть всего менее 10 часов). И для этих 5-ти аудиокниг только к 2-ум я смог найти электронную текстовую версию. Чтобы получить доступ к тексту остальных надо идти в библиотеку и искать их в бумажном виде.

Такие языки трудно изучать и полноценно использовать даже самим носителям, даже при сильной мотивации, и они скатываются в узкую бытовую плоскость с минимальным примитивным запасом слов.

Решение

Универсальный интерактивный формат, позволяющий создавать языковые обучающие материалы и переводить их на разные языки должен решить эту проблему. Мы даём людям готовый функциональный шаблон, инструменты его заполнения, платформу для размещения, организации командной работы и…  получаем максимум отдачи при минимуме затрат.

Такой подход жизненно важен для малых языков, но также принесёт пользу даже изучающим английский - многие аудиокниги и подкасты для продвинутых учеников можно будет адаптировать в таком формате и сделать доступными для всех (даже новичков).

А для остальных языков наконец возникнет шанс приблизиться к английскому по наличию интерактивных обучающих материалов, стать более понятными и изучаемыми. Даже у самых маленьких языков появится такой шанс…

Использованные материалы

https://en.wikipedia.org/wiki/List_of_languages_by_number_of_native_speakers

https://en.wikipedia.org/wiki/Official_languages_of_the_United_Nations

https://www.adroitmarketresearch.com/industry-reports/english-language-learning-market

https://www.globenewswire.com/news-release/2019/07/26/1892347/0/en/English-Language-Learning-Market-to-grow-at-7-1-to-hit-54-8-billion-by-2025-Insights-on-Recent-Trends-Size-Share-Growth-Opportunities-Key-Developments-and-Future-Outlook-Adroit-Mar.html

https://en.wikipedia.org/wiki/English_language

https://en.wikipedia.org/wiki/Endangered_language