当前位置:   article > 正文

【技巧】数据生成器&对拍_csp 对拍

csp 对拍

目录

前言

关于对拍的引言

一、数据生成器

模板

如何构造数据

其他特殊类型数据的生成

二、对拍

模板

三、两个必需程序

四、开始对拍

五、例题

(一)题目

(二)分析

(三)代码实现

待测代码cheat.cpp——暴搜代码

正确代码bf.cpp——官方标程(考场上就是只有自己写暴力什么的了qwq)

数据生成器makedata.cpp

对拍器duipai.cpp

总结


前言

以前一直不会生成数据和对拍...这次花了一整晚终于大概懂了+练了一道例题

希望比赛时能助我一臂之力吧

参考博客&推荐:

https://blog.csdn.net/C20190102/article/details/60138907

https://blog.csdn.net/C20190102/article/details/82944384#_141

https://blog.csdn.net/CQBZLYTina/article/details/84852495

关于对拍的引言

考试时或比赛时,总会遇到一些题,我们不得不骗个分or打个暴力

但是打着打着可能会突然灵光乍现——想到了更优的做法or一个优化

可是我们有时不好手动造数据测试或者证明来保证它的正确性,甚至考虑错了的话,得分还不如直接打暴力高,这该怎么办呢,一个技巧孕育而生——对拍

简而言之,对拍就是将你对正确性没有把握的程序和有把握的程序进行比较

怎么比较?很简单的想法:输入相同数据,用一个程序比较它们的输出,若一模一样,则你优化后的程序就是正确的

这就是对拍的大致原理了

这个进行比较工作的程序就是“对拍器”

怎么非手动生成输入数据?那么就需要“数据生成器”

综上,进行对拍需要四个程序——你的需检测正确性的程序,答案正确的程序,一个数据生成器,和一个对拍器

一、数据生成器

【概览】生成数据,需要使用随机数生成函数rand( )

其实rand(  )生成的是伪随机数序列,
一般采用一次同余方程来生成随机数

例如:
X(0)=seed;
X(n+1) = (A * X(n) + C) % M;
显然,如何随机数种子seed相同,则产生的随机数序列也相同
如果在数据生成器中这样初始化随机数种子 : srand(time(NULL))
在调用数据生成器的时间间隔非常小的情况下,生成的将会是相同的数据,导致对拍效率降低

形象来说,它就相当于一个脑子和一双手,脑子构造出数据后,手再把数据输出出来,以供你的程序读入并运行

一般写作“makedata#.cpp”

"#"处填1、2、3...表示不同的数据范围or类型(一般一道题里会有部分分,针对不同的部分分可写不同的数据生成器)

写数据生成器,你需要做以下两件事:

1.背住模板

2.写出能构造相应数据的代码

3.按题目格式输出

模板

  1. #include<cstdio>
  2. #include<ctime>//必写
  3. #include<cstdlib>//必写
  4. int main()
  5. {
  6. srand(time(NULL));//必写
  7. /*以下是你的构造方法*/
  8. }

如何构造数据

【概览】解决方法很简单,定义一个局部变量,把它的地址(操作系统在为本程序分配运行内存时,
会随机分配一段空间,保证不与之前的程序完全重合)与当前的机器时间作异或运算,将
得到一个不重复的seed,这样就可以连续调用数据生成器,产生不重复的数据了

  1. #include<bits/stdc++.h>
  2. int main()
  3. {
  4. int a;
  5. int *aa = &a;
  6. freopen("data1.txt", "w", stdout);
  7. srand(time(NULL) ^ (unsigned long long)aa);
  8. for(int i = 1; i <= 10; i++)
  9. printf("%d ", rand() % 10);
  10. puts("");
  11. }

例:构造两个n以内的非负整数(n=100000)

  1. #include<cstdio>
  2. #include<ctime>//必写
  3. #include<cstdlib>//必写
  4. int main()
  5. {
  6. srand(time(NULL));//必写
  7. int n=100000;
  8. printf("%d %d\n",rand()%n,rand()%n);
  9. }

若 2~n 呢?%( n-1 )+2即可

1.余数最小为0,0+2=2,符合>=2的要求

2.仍然%n的话,有可能余数为n-1,再+2就是n+1,不符合生成<=n的要求了,%( n-1 )余数最大为n-2,所以%( n-1 )刚好符合<=n的要求

  1. #include<cstdio>
  2. #include<ctime>//必写
  3. #include<cstdlib>//必写
  4. int main()
  5. {
  6. srand(time(NULL));//必写
  7. int n=100000;
  8. printf("%d %d\n",rand()%(n-1)+2,rand()%(n-1)+2);
  9. }

其他特殊类型数据的生成

生成随机排列:先生成1~n,再random_shuffle()
生成集合:用set
生成无根树:随机生成一条树边,并查集检验连通性,合法的加入,不合法的忽略
                        如果要限制每个结点的度,可加上deg[ ]数组,统计各点的度
生成无向图:邻接矩阵存图,随机生成边,加在图上,做至少n*(n-1)/2次
生成DAG:先生成无向图,再DFS,输出编号小的结点指向编号大的结点的边

  1. for(int i = 1; i <= n; i++)
  2. {
  3. sort(G[i].begin(), G[i].end());
  4. for(int j = 0; j < G[i].size(); j++)
  5. {
  6. int k = G[i][j];
  7. if(k > i)
  8. printf("%d %d\n", i, k);
  9. }
  10. }

二、对拍

【概览】在windows操作中对拍需要写批处理程序。

一个简单的对拍批处理程序如下:

  1. echo off
  2. :loop
  3. makedata.exe >data.in
  4. bf.exe <data.in>data.out
  5. std.exe <data.in>data.txt
  6. fc data.out data.txt
  7. IF ERRORLEVEL 1 GOTO stop
  8. IF ERRORLEVEL 0 GOTO loop
  9. :stop
  10. pause

对拍就是帮你比对两个程序的输出结果是否相同

一般写作“dp.cpp”or“duipai.cpp”

模板

限制对拍次数的版本:

  1. #include<iostream>
  2. #include<windows.h>
  3. using namespace std;
  4. int main()
  5. {
  6. /*有对拍次数的版本*/
  7. int t=这里是检查(对拍)次数;
  8. while(--t)
  9. {
  10. system("数据生成器名称.exe > 数据生成器名称.txt");
  11. system("程序1名称.exe < 数据生成器名称.txt > 程序1名称.txt");
  12. system("程序2名称.exe < 数据生成器名称.txt > 程序2名称.txt");
  13. if(system("fc 程序2名称.txt 程序1名称.txt"))
  14. break;
  15. }
  16. if(t==0)
  17. cout<<"no error"<<endl;
  18. else
  19. cout<<"error"<<endl;
  20. return 0;
  21. }

直到有错才停止的版本:

  1. #include<iostream>
  2. #include<windows.h>
  3. using namespace std;
  4. int main()
  5. {
  6. /*直到错了才停止的版本*/
  7. while(1)
  8. {
  9. system("数据生成器名称.exe > 数据生成器名称.txt");
  10. system("程序1名称.exe < 数据生成器名称.txt > 程序1名称.txt");
  11. system("程序2名称.exe < 数据生成器名称.txt > 程序2名称.txt");
  12. if(system("fc 程序2名称.txt 程序1名称.txt"))
  13. break;
  14. }
  15. return 0;
  16. }

三、两个必需程序

一个你待检测的程序,一个保证了正确性的程序(一般是暴力)


四、开始对拍

将所有东西放进一个文件夹(主要是需要exe),运行对拍程序即可

运行结果样板图:

如果对拍显示有问题,就直接打开data.txt,里面有数据,1.txt和2.txt中分别是你程序1的答案和程序2的答案

如果你的对拍程序一出错就关闭了,就在return 0前加一个getchar(),让程序停一下,头文件:cstdio


五、例题

(一)题目

原题:http://codeforces.com/problemset/problem/932/F

NOIP/CSP-S考试 骗分对拍生成数据训练

JUMP TO LEAF

给定一棵树,有n个节点(从1到n编号),以节点1为根。每个节点

都有两个与之关联的权值。 第i个节点的权值为ai和bi。
你可以从一个节点跳到其子树中的任何节点。
从节点x跳到节点y的成本是ax和by的乘积。 由一个或多个跳跃形成

的路径的总成本是单个跳跃成本的总和。 对于每个节点,计算从该

节点到达任意一个叶结点的最小总成本。
请注意,根不是叶结点,不能从节点跳到自身。

Input
第1行:1个正整数n,表示树的结点数
第2行:n个空格分开的整数,表示ai
第3行:n个空格分开的整数,表示bi
接下来n-1行:每行两个整数ui, vi,表示树上的一条边

Output
第1行:n个空格分开的整数,表示每个结点跳到任意的叶结点的最

小总代价

Sample input 1
3
2 10 -1
7 -7 5
2 3
2 1

Sample output 1
10 50 0

sample 1 detail
节点3已经是叶子,因此成本为0。对于节点2,跳转到节点3的成本

为a2×b3 = 50;对于节点1,直接跳转到节点3的成本为a1×b3 = 10。

Sample input 2
4
5 -10 5 7
-8 -80 -3 -10
2 1
2 4
1 3

Sample output 2
-300 100 0 0

数据规模
对于 30% 的数据,n ≤ 5*10^3。
对于另外 20% 的数据,Bi = 1。
对于另外 20% 的数据,树是一条链,且除 1 号点外,i 号点的父亲

是 i-1。
对于 100% 的数据,2 ≤ n ≤ 10^5,|Ai|,|Bi|≤ 10^5。

练习要求:
1. 按要求生成指定特征的数据,共10组,数据生成器统一命名为

makedata#.cpp(#表示1,2,3,4),对于极限规模的数据,要保证树的深度

不小于n/10。
用你的暴力程序尽量跑出正确答案。对于极限数据,有可能跑不出

答案,可以放弃。
数据名称为:
leaf#.in
leaf#.out

2. 写一个能得到50~70分的骗分程序,程序名称为cheat.cpp

3. 写一个正解或者暴力程序,进行对拍。如果你写的是正解,程序

名称为std.cpp。如果你写的是暴力,程序名称为bf.cpp

4. 写一个对拍的批处理程序, 文件名为dp.bat,对你的std.cpp 与

bf.cpp或cheat.cpp进行对拍

5. 最后,按照你的CSP考号,建立文件夹,把上述的生成的数据放

在data子文件夹中。其余的放在考号文件夹中。
提交给我。


附录:
随机生成一棵树的代码

(二)分析

这道题用来训练对拍,于是就愉快暴搜吧=。=...

(以为自己可以暴力+特殊数据=50~70分
后来发现特殊数据是那么的难搞=。=  
所以出现了一个骗分代码与暴力代码没啥区别的尴尬场面... )


1.第一遍DFS搜出各点的父亲

这样搜索的时候就直接知道该点的儿子是谁了

2.第二遍dfs搜出【该点到叶节点的最小距离】和更新【该节点的儿子往上变成该节点同辈】

Ps.搜到叶节点后直接返回“0”

解析:

求“最小距离”可以用递归的思想,即在其儿子中找出 “ 儿子到叶节点距离+儿子与自己的距离 ” 的最小值

再加上“记忆化”的技巧:

  1. if(dis[u]!=INF)
  2. dis[u]=min(dis[u],dis[i]+a[u]*b[i]);
  3. else
  4. dis[u]=min(dis[u],dfs(i,u)+a[u]*b[i]);

接下来有个难题——怎么知道当前点u的所有子孙?

全部存下来似乎不太现实,空间又大、又花时间...

所以可以——实时更新!也就是一边搜索距离、一边更新各点子孙:

我们在搜索到点u的时候,将点u的所有儿子的祖先设为u的父亲

  1. for(int i=head[u];i;i=nxt[i])
  2. if(E[i].v!=father)
  3. {
  4. dfs(E[i].v,u);
  5. old[E[i].v]=father;
  6. //类似并查集,把u的儿子往上变成father的儿子(与u同级)
  7. //这样一边算出dis[]一边实时更新儿子数
  8. }

然后更新距离时,就从点u的儿子(fa[ v ]=u)和孙子(old[ v ]=u)中选取

这样做的意义在于:做到了类似“01搜索”,也就是“该点选或不选”

例如下图:

已搜到点5,父亲为2,儿子分别为6,3,8,继续向下搜,回溯回来时将儿子上移一层:old[ 6,3,8 ] = 2,然后更新答案

已回溯到点2,父亲为1,儿子为5,将儿子上移一层:old[ 5 ] = 1,

然后更新答案:dis[ 2 ]=min( dis[ 2 ] , dis[ 5,6,3,8 ] + a[ 2 ] * b[ 5,6,3,8 ] )

已回溯到点4,父亲为1,儿子为7,将儿子上移一层:old[ 7 ] = 1,

然后更新答案:dis[ 4 ]=min( dis[ 4 ] , dis[ 7 ] + a[ 4 ] * b[ 7 ] )

已回溯到点1,父亲为0,儿子为2,4,将儿子上移一层:old[ 2,4 ] = 0,

然后更新答案:dis[ 1 ]=min( dis[ 1 ] , dis[ 2,4,5,7 ] + a[ 1 ] * b[ 2,4,5,7 ] )

结束搜索,输出答案

应该讲解清楚了吧...连打个暴搜都不容易...累shi ...=。=

(三)代码实现

待测代码cheat.cpp——暴搜代码

(这道题我只会暴力...所以就拿暴力来对拍了...本来因该是用有优化或者做法更优的代码)

  1. /*以为自己可以暴力+特殊数据=50~70分
  2. 后来发现特殊数据是那么的难搞=。=
  3. 所以出现了一个骗分代码与暴力代码没啥区别的尴尬场面... */
  4. #include<cstdio>
  5. #include<cmath>
  6. #include<cstring>
  7. #include<iostream>
  8. #include<algorithm>
  9. using namespace std;
  10. const int MAXN=1e5,MAXM=4e5,INF=0x3f3f3f3f;
  11. int head[MAXN+5],nxt[MAXM+5],fa[MAXN+5],old[MAXN+5];
  12. int a[MAXN+5],b[MAXN+5],dis[MAXN+5];
  13. int n,ecnt;
  14. struct Edge
  15. {
  16. int u,v;
  17. Edge(int _u=0,int _v=0){u=_u,v=_v;}
  18. Edge(Edge &e){u=e.u,v=e.v;}
  19. }E[MAXM+5];
  20. void Addedge(int u,int v)
  21. {
  22. E[++ecnt]=Edge(u,v);
  23. nxt[ecnt]=head[u];
  24. head[u]=ecnt;
  25. }
  26. void DFS(int u,int father)
  27. {
  28. bool flag=false;
  29. old[u]=fa[u]=father;
  30. for(int i=head[u];i;i=nxt[i])
  31. {
  32. int v=E[i].v;
  33. if(v!=father)
  34. flag=true,DFS(v,u);
  35. }
  36. if(!flag)
  37. dis[u]=0;
  38. }
  39. int dfs(int u,int father)
  40. {
  41. if(!dis[u])//是叶节点,dis[u]=0
  42. return dis[u];
  43. for(int i=head[u];i;i=nxt[i])
  44. if(E[i].v!=father)
  45. {
  46. dfs(E[i].v,u);
  47. old[E[i].v]=father;
  48. //类似并查集,把u的儿子往上变成father的儿子(与u同级)
  49. //这样一边算出dis[]一边实时更新儿子数
  50. }
  51. for(int i=1;i<=n;i++)
  52. if(old[i]==u||fa[i]==u)//在u的子树内
  53. {
  54. if(dis[u]!=INF)
  55. dis[u]=min(dis[u],dis[i]+a[u]*b[i]);
  56. else
  57. dis[u]=min(dis[u],dfs(i,u)+a[u]*b[i]);
  58. }
  59. return dis[u];
  60. }
  61. int main()
  62. {
  63. memset(dis,0x3f,sizeof(dis));
  64. scanf("%d",&n);
  65. for(int i=1;i<=n;i++)
  66. scanf("%d",&a[i]);
  67. for(int i=1;i<=n;i++)
  68. scanf("%d",&b[i]);
  69. for(int i=1;i<=n;i++)
  70. fa[i]=i;
  71. for(int i=1;i<=n-1;i++)
  72. {
  73. int u,v;
  74. scanf("%d%d",&u,&v);
  75. Addedge(u,v);
  76. Addedge(v,u);
  77. }
  78. DFS(1,0);
  79. for(int i=1;i<=n;i++)
  80. if(i==n)
  81. printf("%d\n",dfs(i,fa[i]));
  82. else
  83. printf("%d ",dfs(i,fa[i]));
  84. return 0;
  85. }

正确代码bf.cpp——官方标程(考场上就是只有自己写暴力什么的了qwq)

  1. #include "bits/stdc++.h"
  2. #define ll long long
  3. #define pb push_back
  4. #define mp make_pair
  5. #define pii pair<int,int>
  6. #define vi vector<int>
  7. #define all(a) (a).begin(),(a).end()
  8. #define F first
  9. #define S second
  10. #define sz(x) (int)x.size()
  11. #define hell 1000000007
  12. #define endl '\n'
  13. #define rep(i,a,b) for(int i=a;i<b;i++)
  14. using namespace std;
  15. bool Q;
  16. struct Line {
  17. mutable ll k, m, p;
  18. bool operator<(const Line& o) const {
  19. return Q ? p < o.p : k < o.k;
  20. }
  21. };
  22. struct LineContainer : multiset<Line> {
  23. const ll inf = LLONG_MAX;
  24. ll div(ll a, ll b){
  25. return a / b - ((a ^ b) < 0 && a % b);
  26. }
  27. bool isect(iterator x, iterator y) {
  28. if (y == end()) { x->p = inf; return false; }
  29. if (x->k == y->k) x->p = x->m > y->m ? inf : -inf;
  30. else x->p = div(y->m - x->m, x->k - y->k);
  31. return x->p >= y->p;
  32. }
  33. void add(ll k, ll m) {
  34. auto z = insert({k, m, 0}), y = z++, x = y;
  35. while (isect(y, z)) z = erase(z);
  36. if (x != begin() && isect(--x, y)) isect(x, y = erase(y));
  37. while ((y = x) != begin() && (--x)->p >= y->p)
  38. isect(x, erase(y));
  39. }
  40. ll query(ll x) {
  41. assert(!empty());
  42. Q = 1; auto l = *lower_bound({0,0,x}); Q = 0;
  43. return l.k * x + l.m;
  44. }
  45. };
  46. vector<int> x,y;
  47. vector<vi> adj;
  48. vector<ll> ans;
  49. vector<int> subsize;
  50. void dfs1(int u,int v){
  51. subsize[u]=1;
  52. for(auto i:adj[u]){
  53. if(i==v)continue;
  54. dfs1(i,u);
  55. subsize[u]+=subsize[i];
  56. }
  57. }
  58. void dfs2(int v, int p,LineContainer& cur){
  59. int mx=-1,bigChild=-1;
  60. bool leaf=1;
  61. for(auto u:adj[v]){
  62. if(u!=p and subsize[u]>mx){
  63. mx=subsize[u];
  64. bigChild=u;
  65. leaf=0;
  66. }
  67. }
  68. if(bigChild!=-1){
  69. dfs2(bigChild,v,cur);
  70. }
  71. for(auto u:adj[v]){
  72. if(u!=p and u!=bigChild){
  73. LineContainer temp;
  74. dfs2(u,v,temp);
  75. for(auto i:temp){
  76. cur.add(i.k,i.m);
  77. }
  78. }
  79. }
  80. if(!leaf)ans[v]=-cur.query(x[v]);
  81. else ans[v]=0;
  82. cur.add(-y[v],-ans[v]);
  83. }
  84. void solve(){
  85. int n;
  86. cin>>n;
  87. x.resize(n+1);
  88. y.resize(n+1);
  89. ans.resize(n+1);
  90. subsize.resize(n+1);
  91. adj.resize(n+1);
  92. rep(i,1,n+1)cin>>x[i];
  93. rep(i,1,n+1)cin>>y[i];
  94. rep(i,1,n){
  95. int u,v;
  96. cin>>u>>v;
  97. adj[u].pb(v);
  98. adj[v].pb(u);
  99. }
  100. dfs1(1,0);
  101. LineContainer lc;
  102. dfs2(1,0,lc);
  103. rep(i,1,n+1)cout<<ans[i]<<" ";
  104. }
  105. int main(){
  106. ios_base::sync_with_stdio(false);
  107. cin.tie(0);
  108. cout.tie(0);
  109. int t=1;
  110. // cin>>t;
  111. while(t--){
  112. solve();
  113. }
  114. return 0;
  115. }

数据生成器makedata.cpp

这里我只拍了部分分,若有多个部分分,可写多个对应的数据生成器,如:makedata1.cpp,makedata2.cpp... ...

  1. //参考博客:https://blog.csdn.net/sslz_fsy/article/details/83064905
  2. //30%:n<=5000
  3. #include<cstdio>
  4. #include<ctime>
  5. #include<cstdlib>
  6. const int MAXN=5000;
  7. int n,m,cnt,fa[MAXN+5];
  8. int find(int x)//并查集版本
  9. {
  10. return x==fa[x]?x:fa[x]=find(fa[x]);
  11. }
  12. int main()
  13. {
  14. srand(time(NULL));
  15. n=rand()%MAXN+2;//2<=n<=100000
  16. printf("%d\n",n);
  17. for(int i=1;i<=n;i++)
  18. printf("%d ",rand()%MAXN-rand()%MAXN);//题目要求有负数
  19. printf("\n");
  20. for(int i=1;i<=n;i++)
  21. printf("%d ",rand()%MAXN-rand()%MAXN);
  22. printf("\n");
  23. for(int i=1;i<=n;i++)
  24. fa[i]=i;
  25. while(cnt<n-1)
  26. {
  27. int x=rand()%n+1,y=rand()%n+1;//生成两个点
  28. int X=find(x),Y=find(y);
  29. if(X!=Y)//如果不是同一个祖先就连边
  30. {
  31. fa[X]=Y,cnt++;
  32. printf("%d %d\n",x,y);
  33. }
  34. }
  35. return 0;
  36. }

对拍器duipai.cpp

  1. #include<iostream>
  2. #include<windows.h>
  3. using namespace std;
  4. int main()
  5. {
  6. //有对拍次数的版本:
  7. int t=1000;
  8. while(--t)
  9. {
  10. system("makedata.exe > makedata.txt");
  11. system("bf.exe < makedata.txt > bf.txt");
  12. system("cheat.exe < makedata.txt > cheat.txt");
  13. if(system("fc cheat.txt bf.txt"))
  14. break;
  15. }
  16. if(t==0)
  17. cout<<"no error"<<endl;
  18. else
  19. cout<<"error"<<endl;
  20. return 0;
  21. }
  22. /*
  23. 直到错了才停止的版本:
  24. while(1)
  25. {
  26. system("数据生成器名称.exe > 数据生成器名称.txt");
  27. system("程序1名称.exe < 数据生成器名称.txt > 程序1名称.txt");
  28. system("程序2名称.exe < 数据生成器名称.txt > 程序2名称.txt");
  29. if(system("fc 程序2名称.txt 程序1名称.txt"))
  30. break;
  31. }
  32. */

把他们放一起然后运行就可以开始 愉快地  对拍了~

总结

花了近一天终于讲解清楚了...QAQ...

对拍是个好东西,特别是防止你考试时思路的遗漏疏忽导致失分(我当年B题六七十分,就是因为有个小情况没考虑到orz)

考试时合理运用可助你飞升哦2333

但是平时要多做对拍相关的练习,熟悉自己的做题节奏、合理分配做题+对拍时间(一不小心就会发现时间在狂奔而去...)

CSP2019加油!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/72594
推荐阅读
相关标签
  

闽ICP备14008679号