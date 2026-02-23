Мирена Пацева

Софийски университет „Св. Климент Охридски“

https://doi.org/10.53656/bel2026-1-6-MP

Резюме. Статията разглежда използването на технологичен инструмент, базиран на автоматично речево разпознаване в преподаването на български език като чужд. Проследява се учебна практика с китайски специализанти, които учат български език, и въпреки усилията си имат сериозни произносителни затруднения. Практиката има за цел да проследи самостоятелното осъзнаване на произносителни отклонения при четене на текст на Е2 чрез технология за транскрибиране на реч. Студентите съпоставят записа на своя прочит с оригиналния текст, отбелязват отклоненията и правят опит да ги обобщят и да обяснят причините за допускането им. Подчертават се ползите от технологията като обратна връзка в реално време, намаляване на зависимостта на студентите от учителя за корекции, възможността за многократни упражнения без неудобство пред групата и персонализиран подход към индивидуалните трудности. Предлага се корективна работа по няколко направления, както и задачи за осъзнаване и за автоматизиране на коректното произношение.

Ключови думи: произношение на Е2, автоматично речево разпознаване, осъзнаване на произносителни отклонения, преподаване на български език като чужд

Технологиите в ЧЕО

Използването на съвременните технологии в ЧЕО безспорно разширява възможностите и обогатява учебната среда. То позволява включването на автентични езикови материали (филми, подкасти, новини, музика), онлайн комуникация с носители на езика във видеоконферентни платформи и създаване на интерактивна учебна среда чрез образователни платформи и приложения. Адаптивни системи, които се настройват според нуждите и прогреса на учещите, повишават мотивацията чрез персонализиране на обучението. Тук се представя прилагането на технология за преобразуване на реч в писмен текст, базирана на автоматично речево разпознаване (АРР) за осъзнаването на сегментни произносителни отклонения при изучаване на българския език като чужд (БЕЧ)

Какво представлява автоматичното речево разпознаване?

Автоматичното речево разпознаване е технология, която използва изкуствен интелект и машинно обучение за преобразуване на устна реч в писмен текст. Познаваме я от ежедневието си – на нея се основават виртуални асистенти като Siri, Alexa, Google Assistant, инструменти за диктовка и транскрипция като Google Docs – Voice typing, за субтитри, превод в реално време, клиентски услуги и гласови автоматични системи като Rech. Технологията анализира звуковата реализация, идентифицира думи и ги превежда в цифров формат. Тя включва: акустична обработка – преобразуване на звука в цифрови сигнали; фонемен анализ – разделяне на речта на минимални звукови единици и сравняването им с еталонни модели; езиково моделиране – предвиждане на вероятния текст чрез статистически и контекстуални модели и алгоритми (N-грами, невронни мрежи).

Автоматичното речево разпознаване в чуждоезиковото обучение

Сред сферите на използване на АРР в чуждоезиковото обучение е автоматичното транскрибиране на учебни материали – например за преобразуване на автентични аудио материали в текст за по-лесно разбиране и преодоляване на трудностите при слушане. Чрез АРР се създават субтитри за видео материали на втория език (Е2). Технологията може да персонализира ученето, като подкрепя студенти с различни стилове на възприемане, особено тези, които имат нужда от визуален вход, съпровождащ аудио информация.

АРР има място при перцептивните учебни дейности, както и при продуктивните. Тук се фокусираме върху възможностите му за подпомагане на произношението и по-конкретно на осъзнаването на сегментни особености на Е2 и на собствените отклонения от тях. Осъзнаването на последните не е лесно, защото учещите невинаги ги възприемат – просто не ги „чуват“ поради спецификата на възприятието като активен процес. Ние активно налагаме своите устойчиви звукови модели от Е1, усвоени от най-ранна възраст, върху постъпващата информация – звуковия поток на Е2. Затова замяната на един сегмент с друг се възпроизвежда многократно въпреки корекциите на учителя. Това се наблюдава отчетливо, особено когато има съществени различия във фонологичните системи на Е1 и Е2. Например носители на японски и китайски език произнасят названието на планината Рила като Лила, като отклоненията се отразяват и в графиката. Корективните усилия са наложителни, защото в редица случаи фонетичната замяна затруднява разбирането (например при рак / лак).

Както отбелязва Флеге, необходими са нови методи за изследване и подобряване на произношението на Е2 (Flege 2019, 2021, р. 120). Чрез АРР можем да ангажираме допълнителен визуален код, който да онагледи отклоненията при произношението и да фокусира вниманието върху проблемните области. Тук проследяваме как се случва това в преподаването на БЕЧ на студенти от Китай.

Учебна практика: цел, участници, материал

Практиката има за цел да проследи самостоятелното осъзнаване на произносителни отклонения при четене на текст на Е2 чрез технологични средства. Участниците са китайски специализанти в Софийския университет. Те са общо седем души – едно момче и шест момичета на възраст около 20 години. Преди пристигането си в София всички са преминали една академична година интензивно обучение по български език – трима от тях в Пекинския университет за чужди езици (по 14 учебни часа седмично), а останалите – в Тиендзинския университет за чужди езици.

Материалът е аудио запис на прочит на кратка история – вариация на Езопова басня. Текстът предварително се използва за диктовка, при която се слуша с нормална скорост преди и след диктовката с още две повторения при писането. Новата лексика се обяснява и записва. По-късно студентите четат познатия текст пред записващо устройство, след което записът се трансформира в писмена форма от инструмент за автоматично речево разпознаване TurboScribe. Това е приложение за транскрипция на основата на Whisper, което работи с различни файлови формати: mp3, wav, mp4. За съпоставка на резултатите същият инструмент се използва и за транскрибиране на прочита на български говорители – две момчета и две момичета, които също са студенти в СУ.

На следващо занятие всеки китайски специализант получава оригиналния текст и графичния запис на своя прочит със следните задачи:

да се съпоставят двата текста; да се отбележат отклоненията в собствения прочит; да се обобщят отклоненията и да се направи опит за тълкуване защо се получават те.

Резултати

Автоматичната транскрипция на собствения прочит в редица случаи предизвиква стъписване и въпрос „Наистина ли говоря така?“. В някои от прочитите отклоненията са обозрими. Те се илюстрират с транскрипция на записа на една от отличните китайските говорителки (КГ1-П). В други случаи обаче цели пасажи от текста са напълно неразбираеми (КГ2-Х). За съпоставка се прилага и транскрипцията на записа на българска говорителка (БГ), като отклоненията са отбелязани с bold:

БГ Северния вятър и Слънцето се препираха кое по-силен, когато един пътник, завит в топла дреха, мина покрай тях. Те решиха, че този, който пръв накара пътника да си свали дрехата, ще се щита по-силен от другия. Тогава Северния вятър започна да духа с всичка сила, но колкото по-силно вятъра духаше, толкова по-плътно пътникът овиваше дрехът около себе си. Най-после Северния вятър прекъсна осилията си. Тогава слънцето започна да грее силно и пътникът веднага свали дрехът си. И така Северния вятър беше принуден да признае, че слънцето е по-силно от него. КГ1-П Северният вятър и сленцето се препилаха, кой е по-силен. Когато един бътник завид в добра треха, ми на по гледях, да решиха, че този, който пръв накара бътника да си свари трехата, ще се съчита по-силен от другия. Тогава северният вятър забочна да туха със всичка сила, но когато по-силно вятърът тухаше, тогава по-прътно бътникът увиваше трехата около себе си. Най-болзе северният вятър прекъсна усилията си, тогава сленцето забочна така силно и бътникът веднага свали трехата си. И така, северният вятър беше влинутен да влизнае, че сленцето е по-силно от него. КГ2-Х Се веле някакво, бяда и сленцайто си, бе би лаха, кой е по-силен. Когато един подник зави твърдо в добра дреха. Мина покрай дя, дирешиха, че този който брав, нагала бодника да си свали дрехата, ще се счида по силен от другия. ..(неразпознат пасаж). Тукава севернията беде късна уси вятъ си. Другава слън цято започвата къде сионо и бодникът, веднага свали для хатаси и тъга. Съвелението вие дълъг беше при нутън. Та близна е чай, сленцето е по-силно от него.

Естествено, броят на отклонения е значително по-малък при българската говорителка. Те са само 9. Две от тях са елизии: кой е се произнася слято, като глайдът се изпуска – *кое. Финалната гласна на членната морфема в дрехата не се реализира и единицата е записана като *дрехът. Не се реализира пълният член при Северния(т) вятър. Необичайното консонантно съчетание –сч– се записва като щ в *щита (вместо счита). Фиксирана е и замяна на [у] с [о] при *овиваше, *осилията (вместо увиваше, усилията) Отклоненията не затрудняват разбирането на текста.

При първата китайската говорителка (КГ1-П) отклоненията са 32 на брой. Част от тях са обобщени от самата студентка по следния начин: замяна на д↔т, б↔п, р↔л. Илюстрираме ги с конкретни примери:

р↔л препи л аха (препираха), вл ину т ен (принуден), вл изнае (признае),

аха (препираха), ину ен (принуден), изнае (признае), б↔п за б очна (започна), б олзе (после), б ътник (пътник)

очна (започна), олзе (после), ътник (пътник) д↔т завид (завит), влинутен (принуден), треха (дреха), туха (духа)

Освен набелязаните групи отклонения се среща замяна на гласната [ъ] с [ е] в *сленцето (слънцето). Наблюдава се също метатеза -*болзе (после) и епентеза на гласна в консонантни комплекси: *съчита (счита). Възприемането на четения текст се затруднява още повече от прозодични отклонения. В транскрипцията се регистрират паузи в думи като ми на (мина) и по-рядко сливания като *така (да грее). Те са отбелязани от самата студентка като неразбираеми единици заедно с *влинутен (вместо принуден), които чувствително затрудняват възприемането на смисъла на текста. Към тях добавяме и заменени единици като *добра (вместо топла), *свари (вместо свали).

Прочитът на КГ1-П е на един от най-отчетливите в групата на китайските специализанти. В редица други случаи е още по-трудно и на места невъзможно да се разбере смисълът, като инструментът погрешно избира други думи или въобще не дава транскрипция за някои пасажи. Те се илюстрират с прочита на КГ2-Х – студентка, която се справя много добре с българската граматика и с редица умения като четене с разбиране и писане, но има затруднения с произношението. В таблица 1 са сумирани общите сегментни отклонения[i], свързани със замяна на р/л, звучни и беззвучни съгласни, както и други случаи на замяна (в→б), елизия, метатеза и епентеза.

Таблица 1. Общи сегментни отклонения на групата китайски специализанти. Подчертаните единици се повтарят. Някои думи се произнасят с повече от едно отклонение – нагала (накара)

Отклонения Примери Замяна на р↔л р →л плебила ха, препилаха (препираха), лишиха (решиха) плъкъсна (прекъсна) нагала /на каля/ накала (накара), близна (признае), вие дъл (вятър), лееха (дреха) влинутен (принуден), влизнае (признае) л →р добра (топла), сирен (силен), свари (свали) Елизия на л, р р: бядъ, (вятър), бе би лаха (препираха), да те каста (прекъсна), така деее (да грее) л: сънцето ( слънцето); сионо (силно); попътно (по-плътно) Замяна на звучни и беззвучни съгласни б↔п, бе би лаха, пребираха (препираха), добра (топла), блинутен, при нутън (принуден); близай, близна (признае); бълсилен (по-силно), брав (пръв); б одника (пътника); най-болзе (най-после), бътника, бътникът (пътника), забочна, забочната (започна, започна да) г↔к наглада, нагала (накара); гое (кой е) тукава (тогава), къде, кре (грее), оголо (около) д↔т, завид, завидва (завит, завит в), влинутен (принуден), д обра (топла), по гладиях (покрай тях) блинутен (принуден) счида (счита); другава (тогава) подник (пътник); дирешиха (те решиха), дя (тях) т уха, т ухаше (духа, духаше), т реха , т рехата треха да (дреха, дрехата), започната (започна да), з↔с зевенят (северният), болзе (после) Замяна на ъ под ударение ъ→о ъ→е бодник , подник (пъ̀тник) сленцайто, сленцето (слънцето) Замяна на в→б в→б бядъ, биятъл, бяда (вятър), беднага (веднага) Елизия зевенят (северният), гри, кре (грее) Метатези първ (пръв); най-болзе (най-после) Епентеза съвелението вие дълъ (северният вятър)

Причини за сегментните отклонения

Причините за сегментните отклонения се търсят преди всичко в особеностите на първия език на обучаемите. Китайският мандарин (КМ) е език от сино-тибетското езиково семейство, говорен като първи в Китай, Сингапур, Тайван и др. Фонетичната му система се отличава от българската както по звуков състав, така и по прозодични особености и по структура. Сричките в КМ са 413 на брой, които могат да се произнесат с четири тонални вариации (Song, 2021; Shishkova, 2023). Сричката може да се състои от максимум четири звука, например zhuang [tʂuaŋ]. Инициалите са ограничен брой (21). Към тях се отнасят и две полугласни – билабиалната w и палаталната y. Позволява се наличие на инициал и от една до три гласни след него, като само една от тях е носеща тона. Терминалите са n [n] или ng [ŋ]. (Shishkova, 2023, pp. 74 – 75). За разлика от българския език, инициалът на китайската сричка се състои само от една съгласна. За КМ е смислоразличителна опозицията на непридихателни и придихателни съгласни ([p] и [pʰ], [t] и [tʰ], [k] и [kʰ]), но няма опозиция на звучни и беззвучни съгласни, характерна за българския и за други индоевропейски езици. (Gogova, 1994, p. 16). В стандартния КМ липсва алвеоларно вибрантно [р], както и лабиодентална звучна [в] (Gogova, 1994, p. 20). Българските съгласни звукове [ж, ч, ш] имат само приблизително съответствие в КМ – те са ретрофлексни звукове и се произнасят с извиване на върха на езика назад, но отклоненията в артикулацията им рядко са причина за затруднено разбиране. Средната гласна [ъ] е ретрофлексна в китайския език (Gogova, 1992, p. 28) и се произнася в неударена позиция или в края на сричка. Вероятно затова китайските студенти в СУ я заменят предимно под ударение (*сленце). Набелязаните отличия, които са подробно представени от Снежина Гогова (Gogova, 1992; Gogova, 1994), очертават основните проблемни области за корективна работа в преподаването на БЕЧ.

Какво да се прави след осъзнаването на произносителните отклонения?

Предлага се корективна работа по следните направления.

Минимални двойки за различаване на р/л. Минимални двойки за различаване на звучни и беззвучни съгласни. Примери за средната гласна [ъ] под ударение в различни класове думи. Задачи за осъзнаване на семантичните и артикулаторните разлики и за автоматизиране.

Минимални двойки за различаване на р/л

град/глад

рак/лак

ред/лед

ров/лов

пир/пил

жар/жал

тир/тил

дар/дал

враг [врак]/влак

гора/гола

пран/план

сред/след

вари/вали

свари/свали

риза/лиза

гара/кара

кора/кола

ръка/лъка

бира/била

среда/следа

руда/луда

пари/пали

гора/гола

река/лека

роза/лоза

заря/заля

Примерни задачи за осъзнаване на семантичните разлики и за автоматизиране

Попълнете с гара – кара, БИЛА – бира, вари – вали.

Отивам в ………. за ……….. Тя ………. супа, докато ………. дъжд Влакът тръгва от Централна ………. . Машинистът ………. влака.

В задача за слушане студентите са разделени на две групи – едните записват всички единици с р, другите – с л. Съпоставят се резултатите.

Минимални двойки за различаване на звучни и беззвучни съгласни

б – п: боб/поп, бял/пял, битка/питка, баба/папа, блед/плет

в – ф: ваза/фаза, вар/фар, враг/фрак, вал/фал

г – к: гора/кора, гара/кара, глас/клас, гид/кит, гол/кол, гола/кола, гледка/клетка

д – т: дом/том, дам/там, дъга/тъга, ден/тен, дъб/тъп

ж – ш: жест/шест, жабка/шапка, жар/шар, жал/шал, жило/шило,

з – с: зова̀/со̀ва, зърна̀/сърна̀, зѐстра/сестра̀

дж -ч джаз/час, джин/чин, джудо/чудо, джанта/чанта

Примери за гласната ъ под ударение в различни класове думи, които могат да се използват за автоматизиране на произнасяне на средната гласна [ъ] под ударение:

Съществителни имена:

Едносрични: мъж, зъб, път, пъп, дъжд, вълк, кръг, грък, сърп, кръв.

Многосрични: бъдеще, четвъртък, ъгъл, щъркел, къща, тъща, гърло, слънце.

Прилагателни имена : дълъг, къс, кръгъл, къдрав, мъдър, тъмен, тънък, стръмен.

Числителни имена : пръв, първи, четвърти.

Местоимения: какъв, какъвто.

Глаголи: бъда, вържа, дърпам, късам, лъжа, обърна, обръщам, пържа, търся.

Наречия: вън, навън, вътре, бързо, дълго, тъмно, тъкмо.

Сред тях също могат да се набележат думи, различаващи се само по наличието или не на гласната [ъ] като път/пот/пет/пат/пит; пъп/поп; пътен/потен; пътник/потник.

Примерни задачи

Задачи с тактилни елементи: при четене на минимални двойки се докосва гърлото, за да се усети вибрацията при звучните съгласни. Студентите сами съставят списъци с думи с корелативни двойки звучни и беззвучни съгласни. В задача за слушане студентите откриват „грешния“ елемент в редицата:

А. вечер, ваза, фар, вълк;

Б. филм, факт, филия, винаги.

Игра на телефон: първият в редицата получава дума със звучна или безвучна съгласна и я прошепва на следващия. Последният я казва и пише. Дали е вярна?

Заключение

Може да заключим, че съвременните технологични инструменти имат място в чуждоезиковото обучение. Чрез автоматичното речево разпознаване се диагностицират произносителни отклонения, които дотогава невинаги се осъзнават ясно както от студентите, така и от преподавателите. Последните също имат нужда от ориентир за различните фонологични системи на езиците на студентите. Автоматичното речево разпознаване успешно служи за такъв ориентир, както и за основа на корективната работа. Инструментът дава обратна връзка в реално време, намалява зависимостта от учителя за корекции и позволява многократни индивидуални упражнения без неудобство пред групата. Той позволява на студентите сами да си дадат сметка за това доколко речта им е разбираема и какъв процент от нея се разпознава правилно. Наред с това, технологията служи за прилагане на персонализиран подход и фокусиране върху индивидуалните трудности.

Automatic Speech Recognition to Assist in Awareness of Segmental Pronunciation Deviations in Learning Bulgarian as a Foreign Language

Abstract. The article examines the use of a technological tool based on automatic speech recognition in teaching Bulgarian as a foreign language. A teaching practice with Chinese students who are learning Bulgarian and, despite their efforts, have serious pronunciation difficulties. The practice aims to present the awareness of pronunciation deviations when reading a text in E2 using speech transcription technology. Students compare the recording of their own reading with the original text, note the deviations and try to summarize them and explain the reasons for their occurrence. The benefits of the technology are emphasized, such as real-time feedback, reducing students’ dependence on the teacher’s corrections, the possibility of repeated exercises without embarrassment in front of the group, and a personalized approach to individual difficulties. Corrective work in several areas is offered, as well as tasks for awareness and automatisaton of correct pronunciation.

Keywords: E2 pronunciation; automatic speech recognition; awareness of pronunciation deviations; teaching Bulgarian as a foreign language

