赞
踩
查看历史记录的命令
history | grep kafka
以下是RNG S8 8强赛失败后,官微发表道歉微博下一级评论
数据说明:
rng_comment.txt
文件中的数据
字段 | 字段含义 |
---|---|
index | 数据id |
child_comment | 回复数量 |
comment_time | 评论时间 |
content | 评论内容 |
da_v | 微博个人认证 |
like_status | 赞 |
pic | 图片评论url |
user_id | 微博用户id |
user_name | 微博用户名 |
vip_rank | 微博会员等级 |
stamp | 时间戳 |
1.1、在kafak中创建rng_comment
主题,设置2
个分区2
个副本
1.2、数据预处理,把空行
过滤掉
1.3、请把给出的文件写入到kafka
中,根据数据id
进行分区,id为奇数
的发送到一个分区中,偶数
的发送到另一个分区
1.5、使用Spark Streaming对接kafka之后进行计算
rng_comment
[root@node01 /]# mysql -uroot -p123456
mysql>create databases rng_comment;
//切换
mysql>use rng_comment;
//查看表
mysql>show tables;
rng_comment
创建vip_rank
表,字段为数据的所有字段
create table vip_rank(
Indexx varchar(255) NOT NULL,
child_comment varchar(255) NOT NULL,
comment_time varchar(255) NOT NULL,
content varchar(255) NOT NULL,
da_v varchar(255) NOT NULL,
like_status varchar(255) NOT NULL,
pic varchar(255) NOT NULL,
user_id varchar(255) NOT NULL,
user_name varchar(255) NOT NULL,
vip_rank varchar(255) NOT NULL,
stamp varchar(255) NOT NULL,
PRIMARY KEY (‘indexx’)
)ENGINE=InnoDB AUTO_TNCREMENT=26 DEFAULT CHARSET=udf8;
rng_comment
创建like_status
表,字段为数据的所有字段
rng_comment
创建count_conmment
表,字段为 时间,条数数据如下
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。