Transcript PPTs

基于语料库的第二语言习得研究
在我国的进展
Current Developments of CorpusBased SLA Research in China
对外经济贸易大学
王立非
提纲:
◆ 为何开展二语语料库研究?
◆ 二语语料库的现状如何?
◆ 二语语料库研究有何发现?
◆ 存在问题与建议是什么?
什么是二语语料库研究?
二语语料库(学习者语料库,中介语语料库)研究
运用二语习得理论和语料库语言学的方法,对
二语习得观察和对比分析,以发现二语学习的
规律、特点、重点和难点,并提供解释和解决
办法。
二语语料库研究视角
始于1980年代后期,动因有二个(Granger,2002)
SLA研究的跨学科发展
Corpus Linguistics和IT技术的发展
二语语料库研究视角
二语语料库研究的发展受20世纪末语言学和应用
语言学中的三个重要转向的影响。
从关注语言规则到关注语言使用的概率,标志
着从理性主义到实证主义的转向。
从描写英语到描写国际语的转向。
从教学法研究转向学习者研究。
4 areas (Ellis 1994)
基于语料库的二语研究(王立非2007)

不同水平的学习者比较

不同母语背景的学习者比较

学习者口语与笔语比较

学习者与本族语对比

学习者的母语与二语对比
国外主要二语语料库
名称
建设国
母语背景
容量
(万词)
ICLE
比利时Louvain大学
多种母语
200
JEFLL
日本Meikai大学
日语
50
匈牙利Pecs大学
匈牙利语
40
美国Montclair州立大学
多种母语
5
PELCRA
波兰Lodz大学
波兰语
50
USE
瑞典Uppsala大学
瑞典语
100
英国朗文出版公司
多种母语
1000
英国剑桥大学出版社
多种母语
>20000
比利时Louvain大学
多种母语
100
日本Meikai大学等
日语
100
JPU
MELD
LLC
CLC
LINSEI
SSTC
语料类型
书面语
研究性
书面语
商业性
口 语
研究性
我国主要二语语料库
名称
类型
建设单位
母语背景
容量
(万词)
CLEC
书面语
广东外语外贸大学等
汉语
100
COLSEC
口语
上海交通大学等
汉语
40
SWECCL1
书面/口语
南京大学等
汉语
200
SWECCL2
书面/口语
北京外国语大学
汉语
<200
PACCEL
口笔语平行
北京外国语大学
汉语
210
EEWD
书面语
清华大学
汉语
>80
HKUST
书面语
香港科技大学
广东话
>2500
TSLC
书面语
香港大学
广东话
300
MSEE
书面语/口语
华南师范大学
汉语
87.6
SLA语料库主流研究工具
• WORDSMITH(口笔语)
• RANGE(词汇)
• PRAAT(语音)
• DMDX(阅读)
• PARACONC(翻译)
• ELAN(多模态)
WordSmith:
(http://www.lexically.net/wordsmith/version4/index.htm)
词汇研究工具Range
http://www.vuw.ac.nz/lals/staff/
语音语调研究工具PRAAT:
http://www.praat.org
听力,阅读研究工具:DMDX
编制刺激呈现程序、运行并记录反应。实验时,
DMDX在计算机上呈现视觉或听觉的实验刺激材料,
收集受试者对实验刺激的反应(包括语音及按键反
应;并记录反应的种类及时间)。
http://www.u.arizona.edu/~kforster/dmdx/dmdx.htm;
翻译研究工具: PARACONC:
多模态研究工具ELAN:

所谓多模态分析,不仅分析说话人的语言,还分析语
音语调、面部表情、唇形、肩部和手的动作等。

处理音频、视频数据
2007-09年国家社科基金/教育部社科立项:
中国高校外语专业多语种语料库建设与研究
基于留学生语料库的语篇偏误分析
中国日语学习者语料库建设与研究
中国学生英语树库建设与研究
对双语语料库介入下学生译者翻译能力的计算
机辅助实验研究
“短语理论”与语料库的“教学加工”
基于语料库的我国大学生英语句法特点研究
近3年基于语料库的二语习得研究热点





二语词/语块研究
二语句法研究
二语语音研究
二语口头话语研究
二语书面语篇研究
二语词/语块研究(2006-09年)
•基于语料库的大学生英语议论文中的语块使用模式研究(王立非等2006)
•中国大学生英语口语中的互动话语词块研究(许家金等2007)
•中国学生英语口语的短语学特征(卫乃兴 2007)
•我国学生英语演讲中的语块特点:基于语料库的考察(王立非等2009)
•基于语料库的中国学生英语演讲话语立场构块的研究(王立非等2009)
二语句法研究(2007-09年)
•中国英语学习者动名词搭配行为的发展特点研究(王海华等 2009)
•中国学习者英语语料库中动名搭配错误研究(张文忠等2009)
•基于学习者英语语料的类联接研究概念、方法及例析(许家金2009)
•中国大学生英语笔语中的情态序列研究(梁茂成等2008)
•基于学习者英语语料的类联接研究概念、方法及例析(许家金,熊文新
2009)
•大学生英语议论文中高频动词使用的语料库研究(王立非等2007)
•大学生英语写作中分裂句的特征:基于语料库的考察(王立非等2008)
•大学生英语写作中的名物化现象研究(王立非等2008)
•中国英语学习者中介语中的立场副词研究(赵晓临2009)
•关系化对象与关系从句的位置:基于真实语料和类型分析(唐正大2009)
二语语音研究(2006-09年)
•高级英语学习者口语音段错误分析:一项基于语料库的研究(程
春梅,何安平2008)
•英语专业学生朗读中话语标记语的韵律模式:一项基于语料库的
纵深研究(袁咏2008)
•英语专业学生朗读中介词突显的研究(孙欣平2008)
•中国学生朗读口语中的英语调型特点研究(陈桦2006)
•中国学生英语朗读中的调群切分模式(陈桦2006)
二语书面/口头话语研究(2007-09年)
•基于语料库的大学生英语口语自我修正研究(陈立平,濮建忠
2007)
•学习者口语语料自动词性赋码的信度研究(王莉,梁茂成2007)
•基于语料库的工科学生英语写作用词特点透视(刘向红等2009)
•错误分析与自主协作修改:基于在线语料库的大学英语写作研究
(张立新2009)
二语词/语块研究发现
研究问题
a) 中国学生英语即席演讲中的语块使用存在何种特点?
b) 与英国演讲者相比,英语演讲选手的语块使用存在何
种差异?
c) 不同年级的演讲选手在语块使用上是否存在差异?
d) 演讲选手的语块使用是否存在错误?典型错误有几类
?出错的原因是什么?
No.
2-word clusters
CLEPS%
1
I think
0.73
2
Thank you
0.68
3
Very much
0.23
4
It is
0.22
5
A lot
0.20
6
Kind of
0.16
7
Have to
0.15
8
That is
0.15
9
You know
0.15
10
I believe
0.12
11
I want
0.15
12
There are
0.09
13
Of course
0.08
14
In China
0.08
15
Each other
0.07
16
For example
0.07
17
I mean
0.06
18
Very good
0.05
19
Olympic Games
0.05
20
Not only
0.05
No.
4-word clusters
CLEPS%
1
Thank you very much
0.21
2
I’d like to
0.06
3
I don’t think so
0.04
4
The most important thing
0.03
5
And I think that
0.02
6
A lot of people
0.02
7
At the same time
0.02
8
I want to say
0.02
9
I do believe that
0.01
10
I don’t know
0.01
演讲语块的总体特征
语块分类
标准频数 占总语块
原始频数 (万分率) 百分比
标准化
TTR
多元词
369
29
8%
63.0
习俗语
708
55
17%
14.6
短语架构
1021
79
25%
49.3
句子构造框架 2059
159
50%
28.2
总计
322
100%
34.2
4157
CLEPS和BNC的语块使用情况对比
中外演讲语料中的语块对比
语块类型
多元词
参数
演讲选手
英国人
卡方值
万分率
TTR
29
63.01
55
14.60
79
49.34
159
28.23
272
41.19
40
57.62
10
80.79
96
56.11
126
21.45
322
34.18
1.75
0.24
31.15**
45.93**
1.65
0.43
3.82
0.93
4.21*
0.65
习俗语
万分率
TTR
短语架构
万分率
TTR
句子构造框架
万分率
TTR
总计
万分率
TTR
* =p≤0.05, ** =p≤0.01
语际错误:
But, everything (every coin) has two sides. The
most important part is, we, the young citizens of
China, know how to choose.
语内错误
语内错误主要由学习者对目的语语法的不完全习得
造成,其中,最为典型的一个错误就是过度概括
。
(1) So my point is, first of all, awareness, and second
of all, law, and third of all, social moral system.(
将first of all语块的规则过度概括)
冗余错误:
From my point of view, I think, the young people
learn to be more independent is very necessary and
very useful nowadays.
混用错误
I think that’s a really interesting and easy for me to
answer question. Well, ah…like I said, my father
carried our first computer home in 1995.(just as I
said)
研究发现一:
(1)中国英语演讲选手使用4类语块的频数
存在差异。呈现出从句子构造框架→短
语架构→习俗语→多元词不断递减的总
体特点,偏爱使用句子构造框架语块和
短语架构语块,而较少使用习俗语和多
元词,但多元词语块的丰富度最大,最
高频的语块为I think 和Thank you。
研究发现二:
中国演讲选手的语块使用与英国演讲者相
比存在显著差异,语块总体丰富度未见显
著差异。多元词和短语架构二类语块少于
英国演讲者,而习俗语块明显多于英国人,
表现出过多使用习俗语块的倾向。
研究发现三:
大学生与中学生无显著差异,但大学生
的语块丰富度高于中学生,中学生的习
俗语块使用频数超过大学生,但丰富度
却较低。
学生语块典型错误包括母语迁移错误、
习得错误、冗余错误、混用错误。
研究问题:
中国学生在即兴英语演讲中构建话语
立场有何特点?在认知、态度和风格三
类话语立场的表达方面有何特点?
与英语本族语演讲者相比,中国学生
的立场构块是否存在差异?
中国学生英语演讲的立场构块总体特征(万分率)
分类
词汇构块
句法构块
总计
构块
认知
态度
风格
总计
动词构块
392
264
---
656
副词构块
733
12
5
750
形容词构块
50
837
30
917
名词构块
35
30
---
65
情态动词
1204
457
---
1661
状语构块
143
---
15
158
补语构块
1409
53
---
1462
强调构块
38
---
---
38
4004
1653
50
5707
中外英语演讲话语立场构块对比
分类
话语立场构块
词汇构块 动词构块
名词构块
形容词构块
副词构块
句法构块 情态动词
状语构块
补语构块
强调构块
总计
** p≤0.01
万分率
CLEPS BNC
63.7
105.7
6.8
5.6
90.8
68.7
75.3
95.6
卡方值
10.41**
0.11
3.06**
2.41**
170.6
14.7
150.1
3.9
121.1
12.5
132.2
2.4
8.40**
0.18
1.13**
0.3
575.9
543.8
0.92
研究发现:
立场词汇构块和立场句法构块在中国学生的即
兴演讲中大量存在,更多使用的是句法手段。
表达认知立场主要依靠句法构块;表达态度立
场主要依靠词汇构块;表达风格立场只采用句
法构块。
演讲中认知立场和态度立场二类构块占较大比
例,风格立场构块极少。按照频数从高到低的
顺序,中国学生依次使用情态动词、从句、形
容词、副词、动词、立场状语、名词和修辞疑
问句。
研究发现:
中国学生与本族语者在即兴演讲中使用的
立场构块不存在显著差异。就立场构块而
言,过多使用和过少使用并存。具体来说
,中国学生过多使用立场从句、形容词和
情态动词,而立场动词和副词使用较少,
与本族语者相比,在名词、介词短语构块
和修辞疑问句的使用上未见显著差异。
二语句法研究举例
研究问题
(1) 中国学生在英语写作中使用分裂句具有
何种特点?
a.英语作文中分裂句使用的总体特点是什么?
b.二类分裂句在引导词和强调成分上与本族
语者相比,存在何种差异?
(2) 不同年级的中国学生在英语写作中使用
分裂句显示出何种特点? 原因何在?
研究问题
二语语音研究举例
研究问题
中国英语学习者能否准确地将调型与句
型结合起来, 并通过合适的二级调型表
达相应的语气与态度。
中国学生朗读口语中的英语调型特点研究(陈 2006)
研究问题
学习者英语朗读过程中调群切分的边
界特点、调群与句法结构的吻合度、
调群切分的语法作用分别是什么?
国内基于语料库的二语习得研究论文
50
Journal Articles
Dissertations
40
30
20
10
0
2000
2001
2002
2003
2004
2005
期刊研究选题
期刊文章
语音
词汇
语法
语篇
其他
学位论文研究选题:
学位论文
语音
词汇
语法
语篇
其他
二语译语研究仍
然是空白
问题与思考
各自为阵重复建设现象严重
语料库语种单一
研究领域局限性大
语料库容量需要扩大
语料赋码单一
语料库技术和方法需要普及
语料库与其它研究方法结合
一点建议:







《外语教学与研究》《外语界》《外语电化教
学》《外语与外语教学》《中国外语》
CALL(Computer Assisted Language Learning)
Journal of Corpus Linguistics
Educational Technology
Multimedia and Hypermedia
English for Specific Purposes
TESOL
网络资源















Language Learning and Technology (http://llt.msu.edu/default.html)
The Internet TESL Journal (http://iteslj.org/)
TESL-EJ (http://www-writing.berkeley.edu/TESL-EJ)
Journal of Interactive Media in Education (http://wwwjime.open.ac.uk)
Teaching English with Technology (http://iatefl.org.pl/call/callnl.htm)
Journal of Language and Linguistics (http://www.jllonline.net/)
Britannica Online (http://www.britannica.com/)
MS Encarta (http://encarta.msn.com/)
Library of Congress (http://www.loc.gov/)
Asia TEFL (http://www.asiatefl.org/)
中国大学外语教学科研网( http://www.tefl.org.cn/index.jsp)
中国学术期刊全文数据库
外国学术期刊全文数据库(Elsevier Online/Kluwer Online/)
教育技术通讯( http:// www.etc.edu.cn/index.htm)
中国远程教育( http:// www.open.edu.cn/ycjy/)
[email protected]