搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Gausst松鼠会
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【总结】RuntimeError: CUDA out of memory 问题解决_为什么将stride值设置为1后的运行代码时显示cuda out of memory
2
城市信息学其三-智能地理可实现个性化和可持续的未来城市交通
3
flutter --version卡死解决办法_flutter --version 卡柱
4
基础算法-奇异值分解SVD_特征值 奇异值分解 计算稳定
5
filter() 过滤函数_filter过滤键值对
6
k8s 1.28版本二进制安装_centos 7 kubernetes 1.28
7
NodeJS(二):npm包管理工具、yarn、npx、pnpm工具等_npx pnpm@ install
8
UNIAPP day_01(8.30) uin-app概述_uniapp的概要设计
9
微信小程序接入广告_小程序接广告
10
Echarts-java后端封装option--(一)柱状图/折线图 测试用例_折线图表测试用例
当前位置:
article
> 正文
大数据采集方法
作者:Gausst松鼠会 | 2024-03-14 09:44:51
赞
踩
大数据采集方法
大数据采集
是指从传感器和智能设备、企业在线系统、企业离线系统、社交网络和互联网平台等获取数据的过程。
数据
数据包括RFID数据、传感器数据、用户行为数据、社交网络交互数据及移动互联网数据等各种类型的结构化、半结构化及非结构化的海量数据。
大数据的分类
业务数据:消费者数据、客户关系数据、库存数据、账目数据等。
行业数据:车流量数据、能耗数据、PM2.5数据等。
内容数据:应用日志、电子文档、机器数据、语音数据、社交媒体数据等。
线上行为数据:页面数据、交互数据、表单数据、会话数据、反馈数据等。
线下行为数据:车辆位置和轨迹、用户位置和轨迹、动物位置和轨迹等。
数据源的分类
企业系统:客户关系管理系统、企业资源计划系统、库存系统、销售系统等。
机器系统:智能仪表、工业设备传感器、智能设备、视频监控系统等。
互联网系统:电商那系统、服务行业业务系统、政府监管系统等。
社交系统:微信、QQ、微博、博客、新闻网站、朋友圈等。
采集方法和采集工具
大数据的采集
是指利用多个数据库或存储系统来接收发自客户端(Web、App或者传感器形式等)的数据。
在大数据时代,Redis、MongoDb和HBase等NoSQL数据库常用于数据的采集。
大数据的采集过程的主要特点和挑战是并发数高。
大数据采集时使用了大数据的处理模式即,MapReduce分布式并行处理模式或基于内存的流式处理模式。
大数据的采集方法
1)数据库采集
Redis、MongoDB和HBase等NoSQL数据库常用于数据的采集。企业通过在采集端部署大量数据库,并在这些数据库之间进行负载均衡和分片,来完成大数据采集工作。
2)系统日志采集
系统日志采集主要是手机公司业务平台日常产生的大量日志数据,供离线和在线的大数据分析系统使用。高可用性、高可靠性、可扩展性是日志收集系统所具有的基本特征。系统日志采集工具均采用分布式架构,能够满足每秒数百MB的日志数据采集和传输需求。
3)网络数据采集
网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息的过程。
4)感知设备数据采集
感知设备数据采集是指通过传感器、摄像头和其他智能终端自动采集信号、图片或录像来获取数据。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/233039?site
推荐阅读
article
基于
QT
+
树莓
派
实现
智能家居
系统_
树莓
派
qt
...
本文介绍的是
qt
开发的基础用法,包括tcp连接,udp连接,串口以及定时器开发。其次包含
树莓
派
wiringpi库的串口,...
赞
踩
article
数据结构
括号
表示法
创建
二叉树
_给出一棵
二叉树
的
括号
表示法
,
本题要求实现2个函数
,
根据给出
的
括号
表示法
...
数据结构
括号
表示法
创建
二叉树
。_给出一棵
二叉树
的
括号
表示法
,
本题要求实现2个函数
,
根据给出
的
括号
表示法
创建该二给出一棵二...
赞
踩
article
09-基于
Nginx
发布
静态
资源
...
使用
Nginx
发布
静态
资源
找一些
静态
资源
, 上传拿到服务器, 我就直接拿老师的了上传完成配置nginx.conf进入ng...
赞
踩
article
STM32F103C8T6
与
ESP8266
构建
通信
(二)
_
stm32f103c8t6
esp8266
...
STM32F103C8T6
最小核心板与
ESP8266
通信
,向Onenet发送数据
_
stm32f103c8t6
esp82...
赞
踩
article
大
数据
之路
读书笔记
-05实时技术_
大
数据
的
及时性是指
数据
的
价值有
时效性
,
越来越
多
的
场景
对
数据
处理
速度...
在
大
数据
系统中,离线批处理技术可以满足非常多
的
数据
使用
场景
需求,但在 DT 时代, 每天面对
的
信息是瞬息万变
的
,
越来越
多...
赞
踩
article
二叉
树
练习(
一
):从
字符串
构建
二叉
树
和
使用
字符串
输出
二叉
树
_现以
字符串
表示
一
二叉
树
,
请设计
一
算法根据...
前言如标题所言,本次要实现是
使用
类似 “A(B(C)
,
D(
,
E))” 这样的
字符串
构建、
输出
二叉
树
的代码,其实这种
表示
方...
赞
踩
article
什么
是
消息
队列
及
消息
队列
原理
和
应用
场景
详解_
消息
队列
和
api
有
什么
区别...
“
消息
队列
”是在
消息
的传输过程中保存
消息
的容器。“
消息
”是在两台计算机间传送的数据单位。
消息
可以非常简单,例如只包含文本...
赞
踩
article
AndroidStudio
文档
自动
提示
&
代码
提示
补全
_ai
studio
如何
代码
补全
...
从eclipse转到AS下,发现很多功能“没了”,其实是设置的问题, 例如我习惯于在鼠标移动到某个类、方法、字段上面时自...
赞
踩
article
如何使用
DevEco
Studio
创建
Native
C++
应用...
ArkTS/JS与C/
C++
混合开发是OpenHarmony系统中的一套原生模块扩展开发框架,它基于Node.js N...
赞
踩
article
Linux
操作
--
vim
与
gcc
编译器_
vim
和
gcc
...
vim
的基本操作,了解
gcc
编译器_
vim
和
gcc
vim
和
gcc
目录 1
vim
1.1 vi...
赞
踩
article
Springboot整合
Mybatis
增删查改、
连接
MYSQL
数据库
及配置
druid
连接
池
_
项目
搭建...
为了帮助初学者学习(毕竟当初也是这么过来,在网上就想找一篇傻瓜式教程,一步步地照着去学习),我们从零开始一步一步整合My...
赞
踩
article
Unity
插件
免费分享
—
—
需要自取
—
—
更新于2022.9.7_
unity
odin
下载...
1、顶点动画制作专用
插件
VertExmotionPro1.9.7_
unity
odin
下载
unity
odin
下载 ...
赞
踩
article
Nginx
Ingress
实现
灰度
发布
从理论到实战_
nginx
灰度
发布
...
Ingress
作为K8S集群中一种独立的组件,我们需要通过创建它来控制外部访问流量的策略,并通过
Ingress
Cont...
赞
踩
article
融优
课堂
数据
科学
导论
习题答案_
融优
学堂
数据
科学
导论
答案...
融优
课堂
数据
科学
导论
习题答案_
融优
学堂
数据
科学
导论
答案
融优
学堂
数据
科学
导论
答案 ...
赞
踩
article
多
宽带联网(一)
OpenWrt
中使用
Macvlan
实现单线
多
拨
上网
_
openwrt
多
拨...
在
OpenWrt
上安装
Macvlan
软件,在启动脚本中添加
Macvlan
虚拟网卡创建和启用代码,使得每次开机均自动创建虚...
赞
踩
article
常用的
android
studio
快捷键
_
manwah
怎么操作...
常用的1.Ctrl+E,可以显示最近编辑的文件列表2.Shift+Click可以关闭文件3.Ctrl+[或]可以跳到大括...
赞
踩
article
安装
mysql
(失败过程记录……最终结果还是失败)_
multiple
packages
(libgc...
准备安装
mysql
数据库,发现不能直接安装。root@EC2022v:/etc# opkg install
mysql
U...
赞
踩
article
leetcode
-
单调
栈/
单调
队列
_
leetcode
单调
队列
...
接雨水https://blog.csdn.net/meng_xin_true/article/details/10813...
赞
踩
article
Putty
串口
打开无反应_
putty
串口
open
没反应...
第一次使用
putty
的
串口
,可能理所当然认为在Serial那里设置好参数,然后点击Open就行了。但是显然不是,Putt...
赞
踩
article
STM32
定时
与
计数器
总结 第一部分_
stm32
计数器
...
STM32
定时
器与
计数器
_
stm32
计数器
stm32
计数器
...
赞
踩
相关标签
智能家居
c语言
qt
数据结构
c++
算法
nginx
服务器
运维
linux
apache
stm32
物联网
大数据
二叉树
消息队列
Android
javascript
开发语言
OpenHarmony
vim
mybatis
springboot
mysql
druid