第1章绪论
计算机辅助语言学习是目前语音技术的研究热点之一,它将改变现有的语言学习环境以及传统的教学模式,极大地提高语言学习效率。本章介绍课题相关的研究背景和意义,综述相关的国内外研究现状,阐述计算机辅助语言学习的概念并给出本文的主要研究内容和结构安排。
1.1.研究背景与意义
随着社会的发展,各国之间的联系日益密切,国际交流日趋频繁,越来越多的人希望学习和掌握其它的非母语语言。语言学习成为目前教育领域的一大热点。
全世界“汉语热”也在不断升温,使得学习汉语的人越来越多,全球的八十多个国家里,共有两千多所大学开设了汉语课程,学习汉语的人数已接近四千万,并且还在呈上升趋势[1]。我国将汉语的国际推广提高到了国家发展战略的高度,在世界各地相继都开设了孔了学院和孔子课堂,国内高校也纷纷开设了对外汉语课程,与国外高校间的交流日益增多,汉语国际推广得到了蓬勃发展,而与之相对的是专业教师资源的缺乏,对外汉语教学的质量和效率还远远满足不了这一形势的需要。另一方面,现实生活中不同地区的人的汉语发音往往也会带有明显的区域性特征的口音,这使得人们在交流时可能会在语言的理解上产生某种程度的障碍,不利于汉语的推广。
语言教学是为了培养学生的听、说、读、写技能和社会交际能力,学习语言最主要的目的就是要交际,最直接的交际就是对话,就是口语表达,而口语能力培养的一个重要方面就是语音发音的学习。因此,语音教学是语言教学中的基础。传统的师生教学方式是语言学习的重要方式,语音的学习往往采用教师讲解发音方法和发音演示,学生跟读的训练方法。但语音练习是一个长期工程,若仅仅利用有限的授课时间远远满足不了学生的学习需求,需要适当延长语音训练时间,将学、练延伸到课堂外,因而自学就成了语言学习的一种有效途径,它具有不受时问地点限制、灵活方便等特点,是对传统教学方式的补充。
随着计算机技术的迅速发展,多媒体技术、因特网的普及,信息技术日益改变着人们的工作方式、生活方式和学习方式。教学模式也逐渐发生了改变,现代教学充分运用了信息技术,将计算机网络、教学软件和传统的课堂教学有机地结合在一起。计算机辅助语言学习(Computer Assisted Language Learning,CALL)也应运而生,它是一种基于计算机的加速学习方式,它的出现改变了现有的语言学习环境和教学模式,是现代语言教学的有力辅助工具,使语音学习者能够更好的自主学习,极大地提高了语言学习效率。CALL的研究始于上世纪50年代的美国,但对汉语的研究很少,还是一个新的研究领域。与西方语言相比,汉语有其自身特点,给汉语的CALL研究带来新的问题与挑战:
1)汉语方言众多,对于非母语学习者的发音也带有各自的地域特色,因此基于汉语特点的更准确的切分将对后续的识别产生较大影响。
2)汉语是一种带音调的语言,音调信息在汉语语音识别中具有非常重要的意义,因此对于汉语语音音调的识别将是本文的重要内容。
3)汉语是单音节语言,每个音节由声韵母组合而成,如果不考虑声调,总共冇408种音节,若考虑声调,则共有1300多种音节。这造成汉语语音识别困难。
4)汉语语言复杂,进一步增加了汉语语音识别的困难。同时,对于不同地域学习者的发音特色,难以找到客观的发音水平评测方法。
1.2.计算机辅助语言学习
1.2.1.研究历史和现状
计算机辅助语言学习CALL这一缩写词最早出现于20世纪80年代[2],1982年在英国开始广泛使用,第一期的CALLBOARD通讯就将CALL这一词用作了它的标题。美国最初使用的是CALI[3] (Computer Assisted Language Instruction,计算机辅助语言教学),这一缩写词最早在CALICO (它是历史最悠久的专业协会,主要致力于促进计算机辅助语言教学)中出现,它更多体现的是以教师为中心的方式。20世纪90年代初,还曾使用过技术支持的语言学习(Technology Enhanced Language Learning, TELL) [4]这一术语。而语言学习系统的发展和应用与教育学、心理学理论的发展和应用密不可分,目前的语言教学依据建构主义理论更倾向于以学生为中心的教学方式,依据人本主义心理学更重视学习的自主性,重点在于学习,因此常用CALL这一术语,它包括了高度的交互性以及对听、说、读、写能力的支持[5]。
CALL可简洁定义为“在语言教学与学习中应用计算机所从事的研究与学习” [6]。这一定义高度概括了计算机辅助语言学习是采用信息技术手段,应用于语言教学与学习领域,进行研究与学习的方法。
CALL的发展与计算机技术密不可分,特别是人工智能、语音识别(SpeechRecognition, SR)、自然语言理解(Natural Language Understanding, NLU)、多媒体和网络技术等领域的快速发展,极大地推动了计算机辅助语言学习系统的广泛应用。CALL应用于教学可以辅助教师加快语言学习过程,帮助学生巩固课堂知识,以学生为中心,利用信息技术对语言学习活动进行选择、使用、评价,引导学生对知识的主动探索、发现,对所学知识意义的主动建构,注重人的个别差异,促进自我发展从而加速学习[7]。它具有两个重要特征:交互性学习和个性化学习。CALL技术可以对学习者的发音进行打分、分级,从而辅助学习者进行发音训练,并纠正其发音错误。CALL系统的研究始于二十世纪五十年代的美国,应用于语言教学兴起于二十世纪六十年代,其发展大致经历了三个阶段:行为模式、交际模式以及综合模式[8]。
行为模式CALL的设想产生于二十世纪五十年代,应用于六七十年代,它以行为主义学习模式为基础,特点是采用练习式教学法反复进行语言操练,在该模式下,计算机被视为不知疲倦的机械导师,对学生的语言学习作出评估,允许学生按自己的接受程度进行学习。行为模式CALL最初设计应用于大型计算机,后逐渐转向个人计算机,起初计算机在语言学习中的应用仅限于大学校园中进行的相关研究。世界上第一代的CALL系统主要用于俄语的学习[9],它诞生于美国斯坦福大学(Leland Stanford JuniorUniversity)、达特茅斯学院(Dartmouth College)和英国埃塞克斯大学(University ofEssex)。之后,其他语言的学习也被陆续地加入。1959年美国伊利诺伊大学香槟分校(University of Illinois at Urbana-Champaign, UIUC)与其商业伙伴 ControlData 公司共同研发了用于自动教学的可编程逻辑/学习系统(Programmed Logic/Learning forAutomated Teaching Operation, PLATO) [10],这是世界上第一个大规模的计算机辅助语言学习系统,也是最著名的行为模式CALL系统,它的出现促进了计算机在外语学习中的应用。PLATO系统集成了当时最优秀的CALL系统的优点,具有庞大的教学程序库,并且为了方便外语教学,还提供了为用户设计的可编程语言。PLATO系统利用语法翻译的方法,既可用于俄语教学,又可进行俄文文献的翻译。之后的PLATO系统在几所大学中又提供了包括英语在内的多种语言学习[11 ]。
交际模式CALL出现于二十世纪七十年代末至八十年代初,该模式的计算机支持的语言学习活动更关注各种语言的运用,而非语言的分析,采用隐性的语法教学方式,允许并鼓励学生输出具有原创性和灵活性的语言。而个人计算机的出现,也使得语言学习软件的发展更为繁荣。MIT 于 1983 年开发的 ALLP (Athena Language Learning Project)是第二代CALL系统的代表,它提供了多媒体学习环境,并且研究了计算机在教育领域的应用。
第2章 汉语语音信号................... 43-72
2.1. 预处........................... 43-48
2.1.1. 采样与..................... 43-44
2.1.2. 预加.................... 44-45
2.1.3. 加窗..................... 45-48
2.2. 特征参数........................ 48-53
2.3. 声学模型 53-63
2.3.1. 建模单元的................... 53-55
2.3.2. 模型状态.................... 55-62
2.3.3. 声学模型................. 62-63
2.4. 基于隐马尔可夫模型的.................... 63-68
2.5. 汉语语音信号分....................... 68-71
2.6. 本章................................. 71-72
第3章 汉语声调............................. 72-91
3.1. 基音............................... 73-84
3.1.1. 基音周期的时域...................... 75-77
3.1.2. 基频特征............................. 77-84
3.2. 汉语声调................................ 84-87
3.3. 汉语声调识别的实验及...................... 87-90
3.4. 本章............................ 90-91
第4章 汉语语.......................... 91-114
总结
本文对汉语计算机辅助学习系统进行了研究,针对汉语的发音特点,对汉语学习系统中的发音质量的客观评价方法进行了研究并提出了具体的方案。本文具体的研究内容如下:
为了能得到较为客观的发音质量评价结果,本文使用基于隐马尔可夫模型的强制对齐方法对语音进行了初步的分割。对输入语音首先进行了采样、量化、加汉明窗的预处理,之后抽取了 39维的梅尔倒频谱参数特征,建立了三音子的声学模型,经强制对齐后获得音节时间边界,初步对语音进行切分。
考虑到声调信息在汉语语音中的重要作用,在声调识别部分,本文训练了基于强制对齐的声调模型用于后续的发音质量评价。基音周期的抽取,我们采用了归一化的幅度差平方和函数以及Viterbi的后处理算法,抽取的特征为4维的含五种声调的特征。之后使用HTK工具将分割好的训练语料进行了模型训练,得到4维的基于强制对齐的声调模型。而后,本文又采用手工检查分割的方法,将训练数据进行切分并抽取基频特征进行训练,得到4维手工分割的声调模型。最后经过实验比较了三种不同的声调模型,比较后发现基于强制对齐的声调模型的识别率接近于手工分割的声调模型的识别率。
参考文献
1. 高丽萍.汉语国际推广背景下的语音教学研究m.当代教育理论与实践,2012.4(5); 93-94.
2. G. Davies and D. Steele. Micros in Modern Languages [J]. Educational Computing,1982. 3(8):30-31.
3. P. Hubbard. Unit 1: Introduction to Computer-Assisted Language Learning. [OL].in P.Hubbard (ed.) An Invitation to CALL, Foundations of Computer-Assisted LanguageLearning, LINGUISTICS DEPARTMENT - STANFORD UNIVERSITY, 2012 Jan.19,Available from:
4. M.D. Bush and R.M. Terry. Technology-enhanced Language Learning [M]. NationalTextbook Company, 1997.
5. M. Levy and P. Hubbard. Why Call CALL "CALL"? [J]. Computer Assisted LanguageLearning, 2005. 18(3); 143-149.
6. M. Levy. Computer-Assisted Language Learning: Context and Conceptualization [M].Oxford University Press, 1997.
7. C.A. Chapelle. The Spread of Computer-assisted Language Learning [J]. LanguageTeaching, 2010.43(1): 66-74.
8. G Davies, R. Walker, H, Rendall, et al. Introduction to Computer Assisted LanguageLearning (CALL). Module 1.4 [OL].in G. Davies (ed.) Information andCommunications Technology for Language Teachers (ICT4LT), Slough, ThamesValley University 2012, Available from:
9. K. Ahmad, G. Corbett, M. Rogers, et al. Computers, language learning and languageteaching [M]. Cambridge University Press Cambridge, 1985.
10. R. Hart. Language Study and the PLATO System [J]. Studies in Language Learning,1981. 3(1): 1-24.