当前位置:   article > 正文

机器翻译_翻译软件的原理

翻译软件的原理

题目描述

小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。

这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。

对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译。

假设内存中有 M 个单元,每单元能存放一个单词和译义。

每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过 M−1,软件会将新单词存入一个未使用的内存单元;若内存中已存入 M 个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。

假设一篇英语文章的长度为 N 个单词。

给定这篇待译文章,翻译软件需要去外存查找多少次词典?

假设在翻译开始前,内存中没有任何单词。

输入格式

输入文件共 2 行,每行中两个数之间用一个空格隔开。 

第一行为两个正整数 M 和 N,代表内存容量和文章的长度。 

第二行为 N 个非负整数,按照文章的顺序,每个数(大小不超过 1000)代表一个英文单词。

文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。

输出格式

输出文件共 1 行,包含一个整数,为软件需要查词典的次数。

数据范围

0<M≤100,
0<N≤1000

输入样例

  1. 3 7
  2. 1 2 1 5 4 4 1

输出样例

5

C++代码1(按顺序遍历队列的方法)

  1. #include<iostream>
  2. using namespace std;
  3. #define M 10000
  4. #define N 1000000
  5. //创建队列(表示内存空间)
  6. int Queue[M] = {0};
  7. int front = -1; //队列头
  8. int rear = -1; //队列尾
  9. int m,n,count_of_text=1;
  10. int dictionary_count = 0;
  11. int main()
  12. {
  13. int text; //保存每次读入的单词
  14. cin>>m>>n;
  15. if(m<0&&m>M || n<0&&n>N)
  16. {
  17. cout<<"OVERFLOW"<<endl;
  18. exit(0);
  19. }
  20. while(count_of_text<=n)
  21. {
  22. bool flag = 0;
  23. cin>>text;
  24. if(rear == front) //队列为空
  25. {
  26. Queue[++rear] = text; //入队
  27. dictionary_count++;
  28. }
  29. else if(rear-front < m) //队列不满
  30. {
  31. for(int i=front+1; i<=rear; i++) //查找当前内存中是否已经存在该文本
  32. {
  33. if(Queue[i] == text)
  34. {
  35. flag = 1;
  36. break;
  37. }
  38. }
  39. if(!flag) //若当前内存中不存在该文本
  40. {
  41. Queue[++rear] = text; //入队
  42. dictionary_count++;
  43. }
  44. }
  45. else //队列满
  46. {
  47. for(int i=front+1; i<=rear; i++) //查找当前内存中是否已经存在该文本
  48. {
  49. if(Queue[i] == text)
  50. {
  51. flag = 1;
  52. break;
  53. }
  54. }
  55. if(!flag) //若当前内存中不存在该文本
  56. {
  57. Queue[++front] = 0; //先将队首出队
  58. Queue[++rear] = text; //再入队
  59. dictionary_count++;
  60. }
  61. }
  62. count_of_text++;
  63. }
  64. cout<<dictionary_count<<endl;
  65. return 0;
  66. }

C++代码2

bool数组存储每个单词是否已经在队列中,这样就可以用 O(1) 的时间判断每个单词是否已在缓存中了。(空间换时间的思想)

C++的STL中的queue真好用,嘻嘻。

  1. #include <iostream>
  2. #include <queue>
  3. using namespace std;
  4. const int N = 1010;
  5. int m, n;
  6. bool st[N] = {0}; //空间换时间的思想
  7. int main()
  8. {
  9. cin >> m >> n;
  10. queue<int> q;
  11. int res = 0;
  12. for (int i = 0; i < n; i ++ )
  13. {
  14. int x;
  15. cin >> x;
  16. if (!st[x])
  17. {
  18. if (q.size() == m)
  19. {
  20. int t = q.front();
  21. st[t] = false;
  22. q.pop();
  23. }
  24. q.push(x);
  25. st[x] = true;
  26. res ++ ;
  27. }
  28. }
  29. cout << res << endl;
  30. return 0;
  31. }

 

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号