当前位置:   article > 正文

哈工大2022年秋自然语言处理期末考试_自然语言处理期末考试试题

自然语言处理期末考试试题

哈尔滨工业大学本部2022秋自然语言处理课程期末考试

相关博客

(116条消息) 哈工大自然语言处理_哈工大自然语言处理期末考试_kekoxl的博客-CSDN博客

(116条消息) 哈工大19年自然语言处理_叫我池池的博客-CSDN博客

题型
  • 选择题
  • 填空题
  • 判断题
  • 简答题
  • 计算题
  • 送分题(bushi)

PS:4.5学分和5学分是同一张考卷,但是有两道题不一样;

考试内容参考
  • 客观题多涉及基本概念,包括语言学基本概念、机器学习基础知识、深度学习基础知识等。比如:
语言和言语是一般和个别关系?
篇章是否是语义的最大分析单位?
语言的基本关系(组合关系和聚合关系)
文字可以是任意符号?
生物是动物的__?(词之间的义位关系)
  • 1
  • 2
  • 3
  • 4
  • 5
RNN相比CNN优点是可以更好地支持并行计算?
一个词的词向量维度定义为100,请问取三个词的卷积核大小为?
  • 1
  • 2
IBM算法相比传统机器翻译方法最大的贡献是提出了噪声信道模型?
  • 1
机器学习把自然语言问题视作排序问题?
序列标注是生成模型还是判别模型?
以下哪一种机器学习方法不适用于自然语言问题?
Glove词向量相比word2vec向量更好地利用了共现概率?
词向量训练的常见特征类型
  • 1
  • 2
  • 3
  • 4
  • 5
  • 主观题(注意排序不分先后)
1.HMM算法计算概率,按过程写出维特比向量(三个词的简单模型)
2.基于字符串匹配的分词方法
(1)给出句子,利用FMM和BMM给出分词结果
(2)分词歧义的类型
3.实体评价&最大熵
(1)最大熵的特征区间为前一个词、当前词和后一个词,写出最大熵的特征向量(参考实验二的特征向量)
(2)特征区间为前一个词的实体特征,给出基于最大熵的实体提取训练方案与测试方案
(3)(4.5学分)给出基于RNN的实体提取过程(图文结合)
(3)(5学分)好像是基于Transformer和什么来着...(记不太清了)
4.实体链接实现的一般步骤(信息抽取part2)
5.句法分析
(1)给出形如(S (NP 我) (VP (P 是) (NP 傻逼)))的句子,给出语法分析树(原题最右边的括号有五个,挺复杂的);
(2)给出文法规则(注意终结符的规则...)
(3)PCFG与CFG的区别(我觉得可能要答上它的三个性质)
6.评价标准
我们这次考的是词向量的评价标准:斯皮尔曼等级相关系数和类比推理
7.自然语言和语料库
(1)基于给出的材料得到自然语言在计算层面的性质/特点(送分题,ymy老师担心送不到分,甚至亲自来提醒。不过属鼠还是写偏了...)
(2)根据材料,写出基于语料库研究自然语言的不足
8.机器学习基础知识
(4.5学分)什么时候要采取k折交叉验证法?
(5学分)好像是BERT来着...
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22

备注:

1.主观题应该是相对完整的,还可以参考其他同学的博客对比;

2.此次考试没有考察伪代码,但ymy老师说下一次考试可以考虑添加。

复习建议
  • scj老师部分ppt多为英文且包含大量图片,建议对于不懂的模型都上网查一下(特别是神经网络部分)
  • CL1-CL2、CLx1-CLx2设计的语言学知识和评价方法也会进行考察,复习时不要遗漏
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/367579
推荐阅读
相关标签
  

闽ICP备14008679号