绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 15
  (已选择0条) 清除 结果分析
找到 281 条结果
[博士论文] 高晓雷
心理学;发展与教育心理学 天津师范大学 2017(学位年度)
摘要:藏语特点非常独特:它自身是拼音文字,但它同时又属于汉藏语系,与汉语存在相似之处。因此,藏语兼具拼音文字和表意文字的特征。然而,对于这一独特语言的认知研究还很少,也就是说,藏语学习和使用的核心,即藏语存在于其中的大脑认知结构还不清楚。因此,本研究将从阅读的角度开展藏语认知的研究。
  阅读知觉广度是阅读研究中最为基本的问题,也是一个具有重大实际意义的问题,作为读者单次注视所能获取文本信息的最大范围,它能反映阅读的效率和策略。阅读知觉广度受很多因素的影响,诸如不同的语言书写系统、读者的年龄、阅读材料的难度、阅读能力、工作记忆容量等都会影响阅读知觉广度。
  眼动仪是研究阅读过程的重要工具,移动窗口范式是研究知觉广度的重要技术。这一技术通过变换窗口的大小来精确控制读者每次注视能从多大范围内获取信息,当所设定窗口的大小与读者阅读的知觉广度一致时,各项眼动指标与正常阅读条件之间将不存在差异;反之,窗口条件与正常阅读之间存在差异,并影响读者的正常阅读活动。
  藏语兼具拼音文字和表意文字的特征。那么,它的阅读知觉广度是更接近于拼音文字,还是更接近于表意文字,不能根据已有研究做出简单直接的推论,有待探讨。此外,藏语阅读知觉广度受哪些因素的影响,是否具有独特性,也有待探讨。
  因此,本研究将以藏语为阅读材料,以眼动仪为记录工具,使用移动窗口范式,采用对称窗口的设定方法,通过设定不同大小的可视窗口,来探讨藏语阅读知觉广度的发展特征及其影响因素,进而揭示藏语阅读内在的认知机制。
  本研究由三个部分共8个实验组成。
  研究一,移动窗口范式下可视窗口的设定。主要目的是尝试使用眼动技术,将移动窗口范式应用于藏语阅读知觉广度的研究,并尝试性探测藏语阅读知觉广度的可能范围。包括一个实验。
  实验1,为了初步探测藏语阅读知觉广度的大小,以眼动仪为工具,使用移动窗口范式,以35名藏族大学生为被试,让被试阅读小学五年级水平藏语材料,采用单因素7水平被试内设计,设置了7种不同大小的可视窗口(L2R2、L4R4、L6R6、L8R8、L10R10、L12R12和整行)。结果发现:L2R2-L12R12在所有指标的观测值上均存在显著差异;L4R4-L12R12在总注视次数、总注视时间和向右眼跳幅度三个指标的观测值上存在显著差异;L6R6-L12R12在向右眼跳幅度指标的观测值上存在显著差异;L8R8-L12R12在所有指标的观测值上均不存在显著差异,达到了基准水平。依此推断,藏语阅读知觉广度的右侧范围大约为注视点右侧4~8个字符的空间。
  研究二,藏语阅读知觉广度的发展。本研究控制材料熟悉性的影响,让不同年龄被试阅读与其年龄水平相当材料,考察藏语阅读知觉广度的发展特征。包括四个实验。
  实验2,以眼动仪为工具,使用移动窗口范式,以34名小学三年级藏族学生为被试,让被试阅读小学三年级水平藏语材料,采用单因素7水平被试内设计,设置7种不同大小的可视窗口(L2R2、L4R4、L6R6、L8R8、L10R10、L12R12和整行),以此考察小学三年级藏族学生的藏语阅读知觉广度。结果发现:L2R2-L12R12在所有指标的观测值上均存在显著差异;L4R4-L12R12在向右眼跳幅度指标的观测值上均存在显著差异;L6R6-L12R12在向右眼跳幅度指标的观测值上均存在显著差异;L8R8-L12R12在所有指标的观测值上均不存在显著差异,达到了基准水平。依此推断,小学三年级学生藏语阅读知觉广度的右侧范围是注视点右侧4~8个字符的空间;
  实验3,以眼动仪为工具,使用移动窗口范式,以28名小学五年级藏族学生为被试,让被试阅读小学五年级水平藏语材料,采用单因素7水平被试内设计,设置7种不同大小的可视窗口(L2R2、L4R4、L6R6、L8R8、L10R10、L12R12和整行),以此考察小学五年级藏族学生的藏语阅读知觉广度。结果发现:L2R2-L12R12在所有指标的观测值上均存在显著差异;L4R4-L12R12在向右眼跳幅度指标的观测值上均存在显著差异;L6R6-L12R12在所有指标的观测值上均不存在显著差异,达到了基准水平。依此推断,小学五年级学生藏语阅读知觉广度的右侧范围是注视点右侧4~6个字符的空间;
  实验4,以眼动仪为工具,使用移动窗口范式,以35名初中一年级藏族学生为被试,让被试阅读初中一年级水平藏语材料,采用单因素7水平被试内设计,设置7种不同大小的可视窗口(L2R2、L4R4、L6R6、L8R8、L10R10、L12R12和整行),以此考察初中一年级藏族学生的藏语阅读知觉广度。结果发现:L2R2-L12R12在所有指标的观测值上均存在显著差异;L4R4-L12R12在向右眼跳幅度指标的观测值上均存在显著差异;L6R6-L12R12在所有指标的观测值上均不存在显著差异,达到了基准水平。依此推断,初中一年级学生藏语阅读知觉广度的右侧范围是注视点右侧4~6个字符的空间;
  实验5,以眼动仪为工具,使用移动窗口范式,以28名藏族大学生为被试,让被试阅读大学生水平藏语材料,采用单因素7水平被试内设计,设置7种不同大小的可视窗口(L2R2、L4R4、L6R6、L8R8、L10R10、L12R12和整行),以此考察藏族大学生藏语阅读知觉广度的大小。结果发现:L2R2-L12R12在所有指标的观测值上均存在显著差异;L4R4-L12R12在向右眼跳幅度指标的观测值上均存在显著差异;L6R6-L12R12在向右眼跳幅度指标的观测值上均存在显著差异;L8R8-L12R12在所有指标的观测值上均不存在显著差异,达到了基准水平。依此推断,藏族大学生藏语阅读知觉广度的右侧范围是注视点右侧4~8个字符的空间。
  研究三,藏语阅读知觉广度的影响因素。主要是对阅读材料的难度、阅读能力、工作记忆容量等因素对藏语阅读知觉广度的影响进行探讨。包括三个实验。
  实验6,为了考察材料难度对藏语阅读知觉广度的影响,以眼动仪为工具,使用移动窗口范式,以24名藏族大学生为被试,采用2(材料难度:难、易)×5(窗口:L2R2、L4R4、L6R6、L8R8、整行)两因素混合实验设计,依据同质被试的评定结果,将阅读材料分为难、易两组,比较不同窗口条件下被试阅读难、易藏语句子的眼动差异。结果发现:被试阅读难、易句子的知觉广度的右侧范围均约为注视点右侧4~6个字符的空间。但在被试的阅读过程中,难句子的平均注视时间比易句子更长,难句子的总注视时间比易句子更长,难句子的阅读速度比易句子更慢;
  实验7,为了考察阅读能力对藏语阅读知觉广度的影响,以眼动仪为工具,使用移动窗口范式,以藏族大学生为被试,依据藏语高考成绩及藏语等级考试级别将被试分为阅读能力高、低两组,每组20人,采用2(阅读能力:高、低)×5(窗口:L2R2、L4R4、L6R6、L8R8、整行)两因素混合实验设计,让两组被试阅读相同的藏语句子,比较不同窗口条件下两组被试藏语阅读的眼动差异。结果发现:注视点右侧4~6个字符的空间是高、低阅读能力被试共同的知觉广度。但在阅读过程中,与低阅读能力被试相比,高阅读能力被试的总注视次数更少,总注视时间更短,阅读速度更快,向右眼跳幅度更大;
  实验8,为了考察工作记忆容量对藏语阅读知觉广度的影响,以眼动仪为工具,使用移动窗口范式,以藏族大学生为被试,采用阅读广度测试将被试分为工作记忆高、低两组,每组20人,采用2(工作记忆容量:大、小)×5(窗口:L2R2、L4R4、L6R6、L8R8、整行)两因素混合实验设计,让两组被试阅读相同的藏语句子,比较不同窗口条件下两组被试藏语阅读的眼动差异。结果发现:高、低工作记忆容量被试藏语阅读知觉广度的右侧范围均约为注视点右侧4~6个字符的空间。但与低工作记忆容量被试相比,高工作记忆容量被试的总注视次数更少,阅读速度更快,向右眼跳幅度更大。
  在只关注右侧范围的情况下,本研究条件下可以得出如下结论:
  (1)藏语阅读知觉广度存在语言加工的特异性,表现出与其他类型语言不同的知觉广度范围,藏语阅读知觉广度的右侧范围大约为注视点右侧4~8个字符的空间;
  (2)藏语阅读知觉广度表现出随年龄增长而变化的特征,随着年龄的增长,知觉广度整体呈“U”型发展趋势;
  (3)在藏语阅读过程中,被试阅读难、易藏语材料的知觉广度范围相似,但与易材料的阅读相比,阅读难材料的效率更低;高、低阅读能力被试的知觉广度范围类似,但与低阅读能力读者相比,高阅读能力读者的阅读效率更高;高、低工作记忆容量被试的知觉广度范围不存在差异,但与低工作记忆容量被试相比,高工作记忆容量被试的阅读效率更高。
[博士论文] 杨将领
中国少数民族语言文学 上海师范大学 2017(学位年度)
摘要:使动语法范畴是藏缅语族语言一个古老、普遍的语法范畴。由于语言历史的分化和演变,各藏缅语使动范畴的面貌呈现出了不平衡的特点:有的语言形态(前缀、屈折变化)还占有绝对优势,有的语言形态已经完全消失,有的语言则兼用形态和分析手段。本文以国内20多种藏缅语作为代表,以使动语法意义的三个类别作为线索,探讨了藏缅语使动语法范畴以及不同语法形式、语法手段的历史演变规律。
  本研究分为六个部分:第一章导言主要介绍了本文的选题意义、前人研究、语料来源及其研究方法。第二章对使动范畴的概念进行界定。第三章根据现掌握材料,选取几种语言,对比、考察原始藏缅语使动前缀*s-对词根的影响在各种藏缅语里的具体不同表现形式。第四章讨论各种语言的分析形式的发生机制以及它们之间的关系。第五章主要通过列举几种具有代表性的藏缅语,考察形态和分析手段在表达使动意义类别方面的关系,或者说是形态和分析形式在表达使动意义类别方面的倾向性。第六章结语归纳了藏缅语的使动语法范畴经过长期的历史演变、发展,形成了语法手段各异,语法形式多样化的一种范畴。
[硕士论文] 赵梦蝶
中国少数民族语言文学 上海师范大学 2017(学位年度)
摘要:Greenberg(1963)提出的语序共性理论开创了当代语言类型学,也标志着语言学界开始关注语序类型学。语序类型学的基本理念是,在大量的语序特征中存在着一种对应性或联系。因此,如果已知一种语言的某个参项的语序特征。基于统计数据上的判断,就可以推测出这种语言的其他语序特征。由此看来在进行语序类型学研究时,首先要选择某个参项作为出发点。目前在类型学研究中,关系从句是语序类型学的重要参项之一。关系从句作为语言类型学研究极为重要的参项,在语言类型特征和语法研究中有重要的地位。本文因材料有限,主要针对藏緬语动词性关系从句进行研究分析,动词性关系从句即关系小句中的谓语为动词,动词性关系从句在藏緬语中语料最多,且最具典型性。所以本文选取动词性关系从句,针对关系从句的语序类型、关系化标记及关系化策略来进行具体的研究分析。
  本研究分为三个部分:第一部分主要对藏緬语族关系从句的语序类型进行了具体的描写分析以及对比,列举出三大语序类型。并对语言内部的语法参项做了详细的描写,得出结论:关系从句前置为优势语序。通过对藏緬语各个语支的关系从句语料的描写,五个语支中大多数语言都是关系从句前置,直观显现了此结论。藏緬语作为SOV型语言,是以关系从句前置为主,同时存在后置型关系从句和内嵌型关系从句的类型,关系从句前置的语序类型验证了类型学家所说的“大部分的藏緬语关系从句都是前置式”的结论。第二部分以藏緬语的语支为单位,分别分析了关系化标记和关系化策略。关于关系化标记,论文把指示成分的标记单独拿出来,因指示成分不具有全面性。分析指示成分时,笔者借助唐正大对汉语关系从句分析时,所采取的将指示成分、核心名词和关系从句三者的语序进行分析的方法,从而验证藏緬语是不是也像汉语那样,指示成分的位置靠前是为了 NP的尽早确认。事实发现,三者的优势语序为{指-关-核},这样的结论也验证了唐正大提出的观点。本文对各个语支的各种语言的关系化标记也做了详尽描述,发现有零标记、单词汇型标记和多词汇型标记等类型。关系从句关系化主语或宾语时,发现藏緬语提取宾语容易,这不符合 Comrie所提出的名词短语可及性等级序列的顺序,在此我们认同刘丹青对其解释:提取宾语时操作相对简单,所以较为容易。关系化主语或宾语以后,采取留空的关系化策略,这与 Comrie结论一致。第三部分通过对汉语关系从句的简单描写,通过分析语序类型,关系化标记,关系化手段及关系化策略等问题。通过汉藏关系从句对比,发现汉藏关系从句的优势语序类型都为前置型关系从句,这种一致性是否可以从汉藏同源的角度来解释有待验证。汉藏关系从句的指示成分都可以由单个指示词或者指示词与量词组合构成,优势语序都为{指-关_核}两者的关系化手段都是提取宾语比主语容易,在不考虑关系化更多成分前提下,刘丹青对汉语的此现象有过解释,笔者认为同样适用于藏緬语。在关系化策略上,都采用的是最经济的留空手段。
[硕士论文] 拉毛措
藏语信息处理工程 青海民族大学 2016(学位年度)
摘要:本文校对是文本编辑中确保文本与原文一致的重要手段。藏语虚词在藏语中占有特殊地位,其词具有结构复杂、含义广泛、使用频繁等特点,因而藏文文本中藏文虚词的校对较为复杂,藏文虚词的校对是藏文词、字、句校对和信息检索、双语互译、自动分类等的基础,有着极其广泛的实际应用价值。因此本文对藏文文本中出现的藏文虚词自动校对进行研究。
  藏文虚词自动校对存在很多的问题,但分析、归纳所有的问题后,认为问题主要分两类:藏文虚词的识别和检测虚词添接的正确性。因藏文虚词中很多虚词具有歧义性,因而虚词的识别是一项极其困难之事。
  根据藏语虚词的语法,将虚词分为藏文“自由虚词”和“不自由虚词”,本文根据传统的藏文虚词语法,对藏文虚词的语法规律进行了形式化描述,建立了虚词知识库,特别是建设了含有2109个词条的藏文歧义虚词知识库,按照不同的藏文虚词设计了相应的藏文虚词识别算法及其虚词添接校对算法。最后,综合各类校对算法,提出了基于规则和正则表达式的藏文虚词自动校对算法。用C#语言开发和实现了虚词识别和基于规则和正则表达的藏文虚词自动校对算法的系统。
  根据实验结果表明,对8种不同的藏文文本进行实验和分析发现,普通文本、藏文诗歌文本中藏文虚词自动校对的准确率达到97%以上,为准确地生成藏文字、词和进行句法分析、八格识别和机器翻译和语义理解等的研究奠定了一定的基础。
[硕士论文] 才让拉毛
藏语信息处理工程 青海民族大学 2016(学位年度)
摘要:本文以“藏文情感词的识别与统计研究—以中小学藏文教材为例”为论文题目,以藏文小学、初中藏语文教材为语料,利用计算机统计藏文情感词汇的用词状况,分析其用词信息及在真实文本中分布规律的程度信息。英汉文方面,有很多学者在研究和探讨关于情感词的识别和分布研究,但是对于藏语文情感词研究的课题和论文较少。故本文针对藏语文中小学教材中的情感词作为研究的对象,重点阐述的是情感词的分布规律及自动识别统计及牵涉到的语料库。以小学和初中的为例,先分析了中小学藏文教材的用词量度;再梳理数据;最后用概率的方法统计和识别情感词并设计切分算法最终让识别统计的算法得以实现。通过藏语言信息处理技术解决中小学藏语文教材中的情感词汇的统计问题,是扩大藏语言信息处理技术的研究领域,也能够提高藏语言信息处理水平。
[硕士论文] 冷毛措
藏语信息处理工程 青海民族大学 2016(学位年度)
摘要:随着人类科学技术的发展,信息处理研究取得了前所未有的成就,尤其是藏文信息处理技术取得了令人激动的研究成果。然而,藏语词性研究是藏语信息处理中的一个重要研究内容,于是引起很多学者的关注而取得了相应的研究成果,但藏语文教材中的词性分类及分布状况之研究相对而言比较欠缺。为此,本论文将通过小学藏语文教材中的词性作为研究对象,采用藏文信息处理技术对其词性的分布进行统计与分析。由此,总结和概括小学藏语文教材中词性分布状况及藏语自然语言处理理论与技术的应用,其研究数据不仅对小学藏语文教材中的词性分布和教材编纂具有一定的推动作用,而且还对藏语信息处理研究扩展到应用领域也具有一定的推动作用。
  本文以小学藏语文教材为语料,利用计算机对目前藏语文教材藏语词性的分布规律中藏语词的频次、数量等信息做出统计,从而分析藏语词的安排是否合理,即是否符合各个年龄段藏族学生所接受的状况。
[硕士论文] 俄果措
藏语信息处理工程 青海民族大学 2016(学位年度)
摘要:藏语动词的研究是藏文信息处理的基础性研究,而对藏语动词在不同的式与时态下的黏着性及屈折性变化进行分析和研究,又是藏语动词研究的基础。截止目前,藏语在自然语言处理方面几乎还处于萌芽状态,尤其是语言学方面的研究还未能用计算机代替手工来进行材料的搜集、整理和加工。藏语有着自己独特的语言特征和理论体系,特别是藏语的动词方面有着不同与其他语言的特性和自己独特的规律。但这些基于传统的理论的研究方法,目前还未见到比较全面的研究体系。
  藏语动词形态的自动识别有助于补充和完善藏语动词研究的语法理论。在以往的藏语动词研究中,主要是从动词的语法信息库、及物和不及物、自主和非自主等角度研究动词的语法特征,而从动词的形态变化范畴角度的研究成果还很少。藏语动词的形态识别有助于藏语文的教学和藏语语法的深入研究。这一研究对于计算机处理自然语言的研究有参考价值。藏文信息处理从字到词、词到短语、短语到句子、句子到语段,这是一种将要进行的研究范式,目前在这一领域也取得了一些较为重要的研究成果。但客观地讲这项技术仍然不够成熟,一些技术难关和关键性问题暂时还没有找到有效的解决方案,例如藏语动词形态识别是一个阻碍和制约藏文信息处理发展的瓶颈问题。而藏语自然语言处理的基础研究恰好就能弥补其不足之处,互为补足关系。
  本文对藏语动词形态识别算法做了深入的研究。首先搜集了大量的藏语动词形态词典,对藏语动词进行了分词和词性标注,依据藏语传统语法理论,运用现代语言学和参考现代汉语语法,对藏语动词形态做了定义,对藏语动词形态做好详细的分类和归纳,研究了各类动词形态的变化和规则,建设藏语动词形态的规则库,同时还提出了藏语动词形态识别算法。
[硕士论文] 陈烈多杰
藏语信息处理工程 青海民族大学 2016(学位年度)
摘要:随着互联网的快速发展和推广,计算机广泛应用到社会的各个领域。信息的数字化极大丰富了人们生活,越来越多的用户乐于在网络平台上分享信息,交流观点和情感,因此情感倾向分析也逐渐成为自然语言处理领域中一个新的热点。通过对这些信息展开情感分析,可以网络营销、品牌宣传、产品评价、政府机关舆情监控等有效的维护和管理互联网的信息安全。当前藏文情感倾向分析的研究也可以分为基于词语情感倾向的分析、基于句子情感倾向的分析、基于篇章情感倾向的分析、基于大量信息的整体倾向的四个研究层面。藏文情感分析研究还处于起步阶段。本文情感倾向的分析主要是识别藏文文本中词语的感情色彩,既褒义词(正面)、贬义词(负面)、中性词。根据藏文文本的自身特点,在已有藏文词典词汇资源加以总结和整理基础上,补充了一些网络语言中新出现的情感词,并手工标注词性及情感极性和情感强度值,以此构成了初始情感词典。初始情感词典共有八千多词汇。介绍了分值计算方法和加权计算方法、基于极性累加的文本情感倾向计算方法,并采用了极性累加算法,实现了一个基于词语在藏文文本情感倾向分析系统,通过实验数据选用来自科技、体育、娱乐等领域的文本进行分析,实验验证了该方法的可行性。实验结果显示该系统在藏文倾向性分析评测语料上可以达到67%的准确率,取得了较好的效果,对于词语在藏文文本中情感倾向分析进行了研究。
[硕士论文] 归桑拉姆
教育学原理 西藏大学 2015(学位年度)
摘要:词汇识别或词汇通达是认知心理学的一门研究热点,词汇通达作为阅读的基础,在阅读过程中起着十分重要的作用。词汇通达的一个基本过程就是从心理词典中提取读者所遇到词汇的意义。本研究采用启动命名任务,通过设置不同的 SOA来探究藏语词汇通达过程中的语音中介效应,实验一是SOA为300ms,实验二SOA为800ms。
  研究结果:
  (1)当SOA为300ms,在被试分析中,语音中介组的启动效应不显著;然而在语义启动组存在显著的启动效应。在相关分析中,语音中介组中,相关条件下低频、高频启动词对应的目标词反应时与其词频之间均不存在显著的相关;无关条件下低频启动词对应的目标词反应时与其词频之间存在中等程度的负相关,而高频启动词对应的目标词反应时与其词频之间不存在显著的相关。在语义启动组中不论是相关条件还是无关条件下,低频启动词对应目标词反应时与其词频之间存在显著的负相关,高频启动词对应的目标词反应时与其词频之间均不存在显著的相关。
  (2)当SOA为800ms时,被试析结果发现,语音中介组和语义启动组均未出现显著的启动效应。在相关分析中,语音中介组中,相关条件下低频启动词对应的目标词反应时与其词频之间均不存在显著的相关,高频启动词对应的目标词反应时与其词频之间均存在显著的负相关;无关条件下低频、高频启动词对应的目标词反应时与其词频之间均存在显著的负相关。在语义启动组中不论是相关条件还是无关条件下,高频启动词对应目标词反应时与其词频之间存在显著的负相关。相关条件下低频启动词对应的目标词反应时与其词频之间存在显著的负相关,无关条件下低频启动词对应的目标词反应时与其词频之间有负相关,但是不显著。
  该研究结果说明在本实验的 SOA条件下,藏语词汇通达过程中语音中介效应是非常微弱的。
[硕士论文] 张勉
中国少数民族语言文学 上海师范大学 2015(学位年度)
摘要:玉树方言属于康方言下的方言片,相对于卫藏方言、安多方言,以及康方言的其他方言点如德格话,它保存了少量的复辅音声母,产生了声调和复元音。
  复辅音脱落是藏语发展的一个趋势。但在藏语各个方言中,这一现象的发展并不平衡。安多方言里还保存较多能反应古藏语语音面貌的复辅音,康方言和卫藏方言里几已消失殆尽。而玉树方言正处于这一发展历程之间。
  本文从共时研究角度对玉树地区藏语方言的音系特征进行了初步描写,并从中整理出古藏文的复辅音在现代玉树方言中的形式。结合历史语言学的方法,对古藏文的复辅音进行分类,并分析整理其历史演变途径。
  本文认为,古藏文的复辅音声母在玉树地区藏语各方言中的演变路径大致相同,除由古藏文hC、mC类复辅音演变而来的鼻冠音声母在各方言中的脱落程度不一致外,其余演变结果的不同之处一般为发音部位略有前移或后移,以及浊音是否有清化。
  就藏语三大方言来看,玉树地区藏语方言保留了鼻冠音声母,区别于以德格话为例的典型康方言。与卫藏方言相比,古藏文中以浊辅音为基本辅音的复辅音声母,在玉树方言中单化后浊音特征保存相对完好。
  另外,玉树地区部分音变类型较之藏语其他方言,如安多方言,演变类型更为复杂。音变类型的复杂性主要体现在Cl-类和bj-类复辅音中。
  总的来说,在复辅音的单化程度上,玉树方言处于安多方言与典型的康方言、卫藏方言之间;在复辅音的演化类型上,大部分演化类型较为单一,但是个别类型的复辅音较为多样。
[博士论文] 康才畯
中国少数民族语言文学 上海师范大学 2014(学位年度)
摘要:藏语信息处理技术经过二十多年的发展,无论是在藏文信息处理研究及其相关标准制定方面,还是在藏语信息处理应用开发方面,都取得了不少成绩。藏语信息处理技术也逐步迈入到语言信息处理层面。虽然藏语信息处理研究在技术上紧跟着英汉语等之后,但作为信息处理研究基础的语料资源相对贫乏。公开的藏语语料库都是未标注的生语料库,其应用价值非常有限。由于对藏语的本体研究不够深入,许多对藏语信息处理有价值的属性未能挖掘和描述出来,因而限制了藏语信息处理技术的发展和应用范围。针对以上问题,本文采用了多种统计模型和方法来进行藏语分词和词性标注研究,并取得了以下几个方面的主要成果:
  一、提出了基于词位的藏语分词方法,在国内外较早地将藏语黏写形式的特征融合到藏语分词研究当中。
  我们采用了基于词位的统计方法来处理藏语分词问题,将藏语分词转化为序列标注问题,实现了一个藏语分词系统。该系统采用条件随机场模型,针对藏语黏写形式的语法特征,将汉语分词中常用的四词位标签集改进为更适合藏语特点的六词位标签集,并使用100万余经人工反复校对的语料对模型进行训练。经实验测试,在大规模真实语料的测试中,系统的开放测试F值达到了91%,分词性能基本上令人满意。在进一步的研究中,我们经分析发现分词精度主要受到了藏语黏写形式识别结果的限制。考虑到黏写形式的复杂多样,我们在总结前人的研究成果的基础上,加入了基于规则的后处理环节,最终的测试结果F值达到了95%以上,已能满足藏语语料库建设的实际需求。
  二、在藏语分词研究的基础上,根据藏族人名特征探讨了藏语人名识别方法。
  通过研究藏语人名的特点,我们总结了藏语人名识别的多种策略并最终选择了基于统计的方法来实现藏语人名的识别。我们基于条件随机场模型,通过使用名字边界、前后缀、上下文等特征,给出了藏文人名识别的一种方法。最终实验系统在开放测试中取得的F值达到了91.26%。虽然未能进一步发掘名字与普通词语同形这一极易导致歧义现象的特征,导致系统识别性能未能达到十分理想的效果,但可以通过对特征标签集进行调整,同时优化特征模板集,进一步提高识别效果。
  三、综合使用了多种统计模型实现了藏语词性标注研究,在国内外首次采用最大熵结合条件随机场模型实现了藏语的词性标注方法。
  通过对藏语词性的研究,在满足基本的词法分析的需求下,我们将藏语词类标记集精简到统计模型切实可用的规模,然后选择最大熵模型构建了一个藏语词性标注系统,并采用小规模的语料进行训练。实验结果显示,在小规模语料训练下,基于最大熵的词性标注系统达到了87.76%的准确率,已基本接近词法分析可用的要求。
  在最大熵模型的基础上,我们提出了基于条件随机场的修正模型。该模型在最大熵模型的输出结果上进行训练,从而可以将最大熵模型中次优结果和再次优结果中的正确标注挑选出来,提高词性标注的准确率。实验证明,采用同样规模的训练语料和测试语料,最大熵结合条件随机场的词性标注模型达到了89.12%的准确率,已接近同类汉语词性标注系统的水平。
  四、实现了一种基于条件随机场的藏语分词标注一体化模型,将分词和词性标注整合到一个统一的系统中,为藏语词法分析提供了新的解决途径。
  我们充分利用了分词与词性标注间更深层次的依赖关系,在一体化模型中利用词性信息来处于分词过程中遇到的歧义问题。在较小的训练语料规模下,藏语分词标注一体化模型在开放测试中分词结果的F值达到了89.0%,这表明一体化模型将词位信息和所属词的词性信息很好的结合起来,能更有效的提高分词精度,其分词效果已基本可以满足语料库对自动分词的需求。一体化模型的词性标注准确率也达到了85.35%,虽然还稍稍落后于独立的词性标注模型,但通过扩大模型的训练语料规模,词性标注性能应该可以取得一定程度的提升。
[硕士论文] 孙琦
英语语言文学 山东大学 2014(学位年度)
摘要:自从1972年Lakoff首次提出“模糊限制语”(hedging/hedges)这一概念以来,学者对模糊限制语进行了大量研究,研究范围从语义学领域拓展到语用学、语篇分析领域,语料涉及新闻评论、学术论文、庭审语篇等,但是涉及到访谈节目的比较少。
  在访谈节目中,通过使用模糊限制语,采访者和受访者得以表明立场并与持不同立场的人进行协商,从而达到交际目的。由此可见,在访谈节目中,模糊限制语在对命题意义进行协商方面起着重要作用,其所表达的人际意义不容忽视。
  鉴于此,本论文以30篇美国国家公共广播电台关于国家安全局监控项目改革的访谈节目的转写文本作为语料,以评价理论作为理论框架,对英语访谈节目中模糊限制语的语言形式及人际意义进行了较为系统的研究。具体来说,本研究试图解答四个问题:(1)语料中模糊限制语的具体语言形式有哪些?(2)在所选访谈节目中,不同类型的模糊限制语的出现频率如何?(3)模糊限制语在介入(engagement)和极差(graduation)系统中的分布如何?(4)在所选访谈节目中,模糊限制语有怎样的人际意义?
  本文的研究采用了定量和定性的研究方法。首先,参考Hyland(1996,1998)以及Prince,FraderandBosk(1982)对模糊限制语的定义和分类,识别语料中的模糊限制语并将其分类;之后,通过使用AntConc3.2.1软件,对各类模糊限制语的数量予以统计,在统计的基础上计算出各类模糊限制语占语料中所有模糊限制语的比例;接下来,根据介入(engagement)和极差(graduation)中各个子系统的特征,将语料中的模糊限制语归入各个子系统;最后,使用定性的方法,结合具体语境,从多声对话角度分析模糊限制语所表达的人际意义。
  本论文研究结论如下:
  第一,语料中模糊限制语的语言形式可以分为词汇形式(lexicalform)和句法形式(syntacticform)。词汇形式的模糊限制语包括变动型模糊限制语(approximators)及认知情态(epistemicmodality);句法形式的模糊限制语包括让步(concessions)、条件从句(conditionals)、直接引语(directquotations)和修辞疑问句(rhetoricalquestions)。
  第二,在含有24300词的语料中共有1438个模糊限制语,模糊限制语的比例达到5.92%。其中,认知情态(epistemicmodality)使用最为频繁,占语料中所有模糊限制语的68.85%;变动型模糊限制语(approximators)次之,占15.65%;直接引语(directquotations)使用最少,占0.21%。
  第三,模糊限制语是介入的一个重要语言手段。研究结果表明,说话者通过使用模糊限制语这种介入资源,达到了调节对话空间开放或封闭程度的目的。在所有属于介入的模糊限制语中,作为接纳(entertain)资源的模糊限制语所占比例最大,其次是作为否认(disclaim)资源的模糊限制语。通过使用作为接纳(entertain)资源的模糊限制语,说话者倾向于为对话中可能存在的其他观点留出余地,从而与持不同观点的听众建立一致关系。相比之下,通过使用作为否认(disclaim)资源的模糊限制语,说话者则对不同观点提出挑战,以增强自身观点的说服力。
  最后,属于极差系统的模糊限制语主要包括变动型模糊限制语(approximators)和可能性、经常性的情态表达(modalizedexpressionsofprobabilityandusuality)。研究结果表明,属于弱势(downscaling)的模糊限制语数量超过强势(upscaling)模糊限制语数量,这表明说话者倾向于减少对该命题的个人承诺,给对话中可供选择的其他观点留出空间。
  本研究为总结访谈节目中模糊限制语的语言形式提供了初步的框架,也为运用评价理论全面分析访谈节目中模糊限制语的人际意义进行了尝试性探索;此外,本研究有助于英语学习者更好地理解访谈节目中说话者的观点,帮助英语学习者在交际中恰当地使用模糊限制语。
[硕士论文] 项毛措
中国少数民族语言文学 青海民族大学 2014(学位年度)
摘要:本文对Word 2007中对藏文排序进行了研究。随着信息化时代的发展,我国在信息处理方面取得了很大的成果,历史悠久的藏语言和藏文字也在信息和网络的舞台上展现着她独特的魅力。但藏文信息处理相对英文和汉字信息处理起步比较晚。由于藏文本身具有一定的复杂性,所以藏文的排序一直是藏文信息处理中有待解决的首要问题。Word2007中藏文排序研究在藏文大量的编目中能起到提升效率作用,也能为各种电子词典、辞典排序等方面奠定了基础。藏文字母的排序是按照字母的编码大小进行排列的,还需要考虑文字本身所具备的独有特征,藏文排序可以借鉴和吸收英文和汉字的相关技术,同时,还要符合藏文文法规律,所以藏文排序不能照搬现成的英文和汉字的排序算法,而要从藏文自身的特点出发,以藏文文法理论为指导,藏文组字结构为基础,研究并开发适合藏文排序的算法。
[硕士论文] 公保才让
中国少数民族语言文学 青海民族大学 2014(学位年度)
摘要:在科技飞速发展的今天,人机交互方式呈现多样化。随之语音合成技术应运而生。语音合成技术是将计算机产生的或从外部输入的文字、符号、数字等信息转换成自然的语音信号后输出,其广泛地应用于社会各个领域。它正在改变着传统的文字获取信息的方式。
  本文首先回顾了语音合成的发展历史,探讨藏语语音合成的研究意义,介绍了目前通用的几种语音合成方法。其次立足于藏语语法以及历代藏语语音研究成果为基础,详细介绍了藏语语音情况,探讨了藏语韵律问题。最后选取了藏语安多方言中的声韵母为合成基元,录制了语音合成基元的语料库,并通过拉丁转写,实现了藏语文本到语音之间转换,再通过基音同步叠加方法进行藏语语音合成,合成效果良好。为日后的藏语语音合成的进一步研究工作奠定了基础。
[硕士论文] 德吉
中国少数民族语言文学 青海民族大学 2014(学位年度)
摘要:随着社会的发展和科学技术的不断提高、信息处理技术日新月异,人们对语音智能的要求越来越高,促使了语音识别技术的进一步发展和完善。藏语作为藏民族的母语,现在使用范围很广。由于藏民族生活习惯、生存环境等原因,对藏民族来说非常重要,它维系着藏民族一切日常活动和风俗习惯、教育、医疗和服务等。研究藏语语音标注和识别对藏族在文化、经济、教育、服务业等领域内解决语言不通的障碍,为藏语和民族的发展更好的服务。在信息化的当今社会,必须要进一步发展以藏语为基础的信息技术、尤其需要促进藏语语音识别技术的发展。虽然有关藏语语音学知识自藏文创制时期就有,但从语言学角度去研究的理论基础和书籍、资料较少;而且关于藏语语音标注与语音识别的研究,发展的较晚、研究人员也较少,尚处于初级阶段。
  本文首先在已有的基础上研究了适合藏语语音学和音系学特点的语音语料库设计方法。其次,通过所设计的藏语语音语料库结合藏语本身的声学特征,提出了藏语语音自动标注过程。最后,在藏语语音自动标注的基础上研究了基于特征识别的藏语语音识别原理。对藏语语音标注与识别技术的进一步发展有一定的作用。
[硕士论文] 谢三智
中国少数民族语言文学 青海民族大学 2014(学位年度)
摘要:语言是一种音义结合的语音符号体系,是人类的交际工具和思想交流工具,在形形色色的社会环境中存在着千姿百态的语言形式,语音学是语言的入门基础,研究语言要从语音入手。人们实现交流是需要相互发信息的,而语音就是人们发出声音的信息载体,语音是语言的声音,语音是语言传达的物质信息,语意的传达是由一串串的词语串联而成的,而词语就是一串串语音的有序组合体。同语言环境下,听到对方的语音就能明白他所表达的语意。语音的准确使用会产生明快的效果,也会使言语具有较强的感染力,人们初学一种语言时首先要掌握该语言的语音系统,如果语音掌握熟练了就是没有太多的词汇量,也能达到一定的交流目的,在我国各地方之间方言差别很大,特别是我国是个个多民族国家,各民族之间语言差别大,所以语音在我国这个多民族国家显得特别的突出和重要。
  本文以《藏语与汉语语音学的对比研究》为题,系统学习了语音医学理论,就藏语和汉语在语音学的各个方面做了对比研究,搜集整理了汉语语音学中的声母、韵母等相关语音学的资料;对藏语和汉语语音资料进行了人工标注,将藏语语音数据文本进行了数据筛选、语音录制,最后进行了语音标注。在标注后的数据中,将藏语与汉语语音进行了对比,在藏语语音中也采用声母、韵母进行描述区分,总结并列出了藏语的声母、韵母表。对藏语发音部位、音韵结构进行了分析并作了相关阐述和比较研究。
[硕士论文] 当增卓玛
中国少数民族语言文学 青海民族大学 2014(学位年度)
摘要:随着计算机技术的不断发展,人类逐步已迈向信息化的社会,利用计算机进行信息处理已成为现时代的主旋律。如今,藏学研究在国内外势头炽盛,新的科研成果不断涌现。藏文文法研究也取得了突破性进展,尽管如此,藏文信息处理的研究技术目前依然滞后于实际需求。其中主要原因是我们为计算机储备的自然语言的语法知识不够丰富。语法知识在自然语言处理系统中是必不可少的,其规则及规则库的规模影响着自然语言处理系统的运行情况,因此语法识别中语法的规则及其规则库的规模是很重要的。目前,在藏文信息处理的领域中,在藏文虚词进行了初步研究,产生了较好的效果,但是在藏文格的识别还未研究。因此,藏文格的识别是目前藏文信息处理领域里缺少的环节,要想把藏文信息处理推向一个新的高度,藏文格的识别是当前急需研究的基础性工程之一。
  本文重点阐述了藏文八格自动识别及牵涉到的语料库和规则库、人工分词及词性标注;针对3500词条的藏文语料库进行了研究并构建了包含536条藏文语法八格规则库,该规则库符合传统的藏文八格规则(本体词、属格、作格、为格、业格、于格、从格和呼格)。设计了藏文八格自动识别算法,实现了藏文八格自动识别系统。通过对藏文语料库进行实验和分析,自动识别正确率达到了100%。
[硕士论文] 完么才让
中国少数民族语言文学 青海民族大学 2014(学位年度)
摘要:本文对基于规则的藏语句法分析进行了研究。句法分析是自然语言处理过程中一项基础性的工作,从二十世纪四十年代末到现在,国内外学者们设计了很多自然语言处理的形式模型,这些模型有基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于词汇主义的形式模型、N元语法、数据平滑和隐马尔可夫模型等,它们都对自然语言处理中的句法分析研究做出了积极的贡献。文中所提基于规则的句法分析方法主要是指chomsky的上下文无关文法,也是基于短语结构的语法。分词、词性标注以及句法结构的树形图表示,都属于句法分析的研究范畴。在描述分词部分时,对分词歧义类型及消歧方法做了详细的分析。除了利用传统的最大概率匹配法分词外,还提出了一种利用转移概率消解分词歧义的方法,文中称这种方法为词性转移概率消歧法,它在消解分词歧义上比最大概率匹配法更优越。自动词性标注是在藏语HMM模型基础上,用Viterbi算法进行的,还对藏语中的典型词性歧义及其消解方法做了分析。在句法结构的自动表示上,首先把藏语句型分成六个大类,并以此为依据,构建了一个规模为480余个句法树的树库,然后利用词性串匹配法,以树形图表示出藏语句子的句法结构。考虑到文中所用句法分析方法不能像线图算法、LR算法和Earley算法那样表示歧义句的句法结构。因此,对藏语中的常见歧义句做了分类,归纳出歧义句中存在的一些规律,利用概率上下文无关语法对句子歧义做了处理,使本文的句法分析系统具备解决简单歧义问题的能力。文中设计的句法分析器,能按照词性串匹配算法把树库中的所有句型对应的句法结构以树形图的形式直观地表达出来,但因为只有词性串匹配成功才能提取对应的用广义表表示的句法树,所以句法分析器的性能与词性串匹配算法没有太大的关系,而更多地依赖于足够高准确率的词性标注系统,因此,自动词性标注模块设计的好坏,会直接影响整个句法分析器的效果。
[硕士论文] 张夏夏
语言学及应用语言学 中央民族大学 2013(学位年度)
摘要:焦点是语句中根据具体语境需要强调突显的成分,它除了用语法手段标记外,还可以通过韵律变化来实现。本文通过严格控制的语音实验研究了韵律焦点的产生和感知问题,比较了藏缅语族中的藏语拉萨话和羌语,同时还比较了藏族人和羌族人所说的汉语普通话中的韵律焦点,最后还进一步考察了羌族人说的四川话。产生实验选用两到三个目标句,通过语境设置不同的焦点条件,请发音人自然说出目标句,然后进行系统的声学参数分析和统计检验。感知实验要求听音人对焦点位置做出判断,以此来考察焦点的韵律编码方式对感知是否有意义。本研究发现两种语言中焦点的韵律实现方式存在显著不同,特别是藏语拉萨话中焦点有音高升高和焦点后音高骤降(post-focus compression,PFC)的特征,而羌语中则没有该特征;且PFC的有无直接影响焦点的感知。主要结论如下:
   一、藏语拉萨话以及藏族人所说的汉语普通话中,焦点的实现方式是一致的,具体表现为:焦点词音高上升、音强增加、时长延长;焦点后音高、音强整体下降,即存在“焦点后音高骤降(PFC)”;焦点前音高、音强、时长基本保持不变,且焦点后时长也保持不变。
   二、藏语拉萨话及藏族人所说的汉语普通话中,四种焦点条件感知正确率较高,平均为81.1%和75.3%。
   三、羌语以及羌族人所说的四川话中,焦点词音高上升、音强增加、时长延长;以中性焦点为基线,句首、句中、句末焦点条件下,音高、音强均从句首开始整体上升,没有“焦点后音高骤降”;焦点前后时长保持不变。羌族人所说的汉语普通话中,焦点词音高上升、音强增加、时长延长,大于非焦点条件,但没有“焦点后音高骤降”,焦点前音高保持不变;以中性焦点条件为基线,句首、句中、句末焦点条件下,音强均从句首开始整体升高;焦点词前后时长基本不变。
   四、羌语、以及羌族人所说的四川话、普通话中,焦点的感知均比较差,平均正确率分别为28.1%、26.8%、28.1%。
   本研究还将藏语、羌语中焦点实现方式与其他语言进行了对比分析。论文最后的讨论部分综合了历史、基因、考古、民族学等领域对人类迁移的研究成果,讨论了“焦点后音高骤降”可能的来源问题。
  
[硕士论文] 头旦才让
计算机应用技术 青海师范大学 2013(学位年度)
摘要:句法分析是整个自然语言处理过程中很重要的一个环节,在句法分析领域,人们一般采用树库作为获得句法知识和评价句法分析器性能的资源。藏语依存树库构建技术可以为基于统计的藏语自动句法分析器提供必要的训练数据和统一的测评平台,而且能为藏语句法学研究者提供真实的文本标注素材,便于语言学家从中总结语言规律,也是进一步进行句子内部的词语义项和语义关系标注的基础。
  藏语依存树库的构建不但是藏文信息处理领域的一项很重要的研究工作,也是自然语言处理研究中的关键技术之一,通过构建藏语依存树库可以为藏文信息处理、藏语语言研究和藏语语料库语言学等研究领域提供重要的语言数据资源和研究平台,对推动藏文信息处理研究具有重要的意义。
  本文通过收集整理1000句藏语分词标注语料,进行了藏语依存树库构建技术和方法的研究;介绍了依存语法的基本概念、依存关系解析、藏语句法分析引入依存语法的目的等;制定了藏语依存句法标注规范和标记,大类为5种,小类为36种;通过依存树库构建方法的研究,设计实现了藏语依存句法标注工具;对藏语依存句法树进行了较为详尽的分析;以藏语依存句法标注规范作为依存关系的标注依据,利用藏语依存句法标注工具作为辅助软件建立了规模为1000句、词语总数为11951个、平均句长为12个词的藏语依存树库;并对建立的藏语依存树库进行了词类分布统计。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部