搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
AllinToyou
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
在微信公众平台 设置小程序域名白名单_小程序设置域名白名单
2
Linux下修改gcc和g++的版本_linux重置gcc软链接
3
Android.bp文件编写(1)_android.bp stubs_defaults {
4
DevEco Studio下载/安装配置教程(超详细图文教程)
5
unity游戏运行环境_【Machine-Learning】Unity ml-agents环境搭建
6
鸿蒙系统怎么看抖音国际版,鸿蒙系统tiktok闪退_华为手机安装tiktok闪退
7
mysql中的提交(commit)与回滚(rollback)_mysql commit
8
Python爬虫:教你如何使用Python解析HAR请求文件(附源码)_har文件
9
前端vue自定义table 表格 表格组件 Excel组件_vue excel表格组件
10
Photoshop 笔记_要创建文字选区需要选择 工具
当前位置:
article
> 正文
数据采集的基本方法?_数据采集 csdn
作者:AllinToyou | 2024-03-14 09:57:43
赞
踩
数据采集 csdn
数据采集
方式按照线上采集,线下采集两大类进行分类,下面对于每种采集方式及相关技术进行简单的介绍。
线上采集
1)开放数据
开放数据指的是互联网中面向所有人公开的数据,其中包括面向特定行业公开的数据,各级政府公开的数据以及网页中相关的内容数据。
获取开放类数据,我们可以使用爬虫技术,这里简单介绍一下爬虫技术。
爬虫技术是一种可以使开发人员自动化,系统化收集互联网上相关数据的技术,爬虫不是内容的生产者,而是内容的搬运者。关于爬虫技术的各类学习资料在网上可以说是“汗 牛充 栋”,在这里就不展开说了,但是这里关于爬虫要讲的就是爬虫的安全问题,一定要遵守相关法律,切记不要触碰红线。
a. 个人信息,商业 秘 密与国 家秘 密是数据爬取的红线。
b. 遵守职业道德,控制爬虫访问频次,不要干扰被爬方的正常业务活动。
c. 遵守robots协议,做到什么能爬,什么不能爬。
2)第三方平台数据
比如说开发者想获取相关各类金融数据,除了可以利用爬虫技术外,我们可以通过某第三方平台提供的API接口来调取相关数据。
曾接到过这样一个任务,获取某市所有的禁止机动车左转,禁止机动车右转,禁止机动车掉头的路段,在没有条件获取准确的数据时,我们可以通过高德或百度的地图开放平台的API接口,分别在路口处设置起讫点,通过对比机动车与步行的路径规划距离来分析该路口是否禁左,禁右,禁掉头。对应的功能有相应的服务文档讲解如何使用,大家有兴趣可以打开网址进行尝试。
3)物理数据
物理数据指的是用户在物理世界产生的数据,例如用户使用手机时手机的各类传感器(指纹传感器:记录用户指纹用于解锁手机或支付等行为,陀螺仪:通过角动量守恒原理记录角速度用于手机导航等行为)
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/AllinToyou/article/detail/233103
推荐阅读
article
SSM
SpringBoot
vue
智能公寓
管理
系统_智慧公寓
管理
平台
csdn
...
登录 注册 个人中心 设施信息
管理
租赁信息
管理
客户信息
管理
账务
管理
房源信息
管理
SSM
(Spring + Sprin...
赞
踩
article
VSCode
中
使用
LaTex
的配置_在
vccode
中
使用
latex
csdn
...
目录1.下载安装
VSCode
2.下载安装Tex Live3. 安装
LaTex
Workshop扩展程序4. 修改配置文件...
赞
踩
article
【学习心得笔记】
Python100
天-第一部分
Day01
-
Day15
_
python
学习100天 cs...
本文是个人对于项目的学习的一些心得和笔记,简单记录,如有不妥之处,欢迎批评指正。_
python
学习100天
csdn
py...
赞
踩
article
开发环境配置整理大全——
Visual
Studio
2022安装篇_
visual
studio
20...
Visual
Studio
是微软的集成开发环境(IDE),以Windows为主的平台开发的一套功能全面而强大的IDE,支...
赞
踩
article
做
自己
的
系统
分析师
_
系统
分析师
csdn
...
这几天我在看软考的《
系统
分析师
教程》,六百多页的书看了两百多页,现在感觉心里很复杂。再加上前几天和以前几个要好同事聚...
赞
踩
article
前端
qrcode
生成
二维码
详解_
qrcode
csdn
...
详细介绍了前端如何用
qrcode
生成
二维码
,及使用
qrcode
的优点、缺点_
qrcode
csdn
qrcode
csdn
...
赞
踩
article
AI
训练
与推理
芯片
_
训练
容量
csdn
...
AI
训练
与推理
芯片
训练
芯片
1.1.云燧T20基于邃思2.0
芯片
打造的面向数据中心的第二代人工智能
训练
加速卡,具有模型覆盖...
赞
踩
article
AI推理
计算
框架中的
内存
优化
_
ai
系统
模型
内存
csdn
...
内存
管理是AI
计算
中非常重要的一部分。我们希望
模型
计算
时占用
内存
尽可能小,这样我们训练或推理时就可以用更大的batch ...
赞
踩
article
Spring
事务
实现
原理_
spring
事务的
实现
原理?
csdn
...
先从配置文件开始入手,找到处理annotation-driven标签的类TxNamespaceHandler。TxNam...
赞
踩
article
【
学习
笔记】
ESP32
-
CAM
初体验_
esp32
cam
csdn
...
在
ESP32
上移植过Modbus模块,能使用
ESP32
提供的编译工具编译、查错、烧录,但对编译工具链的原理并不了解。会使...
赞
踩
article
5月
CSDN
创作者之夜:
获奖
名单公布_
csdn
特别奖
实力
新星
获得...
本期
获奖
名单从多个角度进行评选,有新人奖、
实力
新星
奖、月度贡献奖、月度文章精选奖等等,具体的奖项以及评选规则可参考下表:...
赞
踩
article
【参
赛
流程】
CSDN
& 龙蜥
社区
「人人都
可以
参与
开源
」
学习
赛
...
学习
赛
报名:2024年4月22日截止。参
赛
:请务必阅读下文「竞
赛
步骤」小节,了解任务与要求。评审:按照下文的步骤完成后,...
赞
踩
article
北斗
校时
系统
(
GPS
授时设备)几种
时间
同步
方法_
北斗
时间
同步
csdn
...
北斗
校时
系统
(
GPS
授时设备)几种
时间
同步
方法
北斗
校时
系统
(
GPS
授时设备)几种
时间
同步
方法分布式
系统
由Tanenbau...
赞
踩
article
UWB
芯片
DW300
之
CRC
模式
介绍及代码实现_
uwb
单片机
csdn
...
详细介绍
DW300
0芯片的SPI中带
CRC
模式
的操作方式与源代码实现_
uwb
单片机
csdn
uwb
单片机
csdn
...
赞
踩
article
10分钟搞定
win11
安卓
子系统
_
win11
android
csdn
...
与虚拟机或第三方安卓模拟器相比,微软官方的Windows 11安卓
子系统
在性能和与系统的集成上更为优越!非常实用,可以让...
赞
踩
article
网络
人工智能
研究
方向有哪些?_
网络
智能化 十大
研究
方向 数据集盘点
site
:
blog
.
csdn
.n...
网络
人工智能
(Network Artificial Intelligence,NAI)指将
人工智能
技术应用在
网络
中,使用...
赞
踩
article
中文短
文本
分类实例六-
DCNN
(A
Convolutional
Neural
Network
for...
一.概述
DCNN
(A
Convolutional
Neural
Network
for
Modelling
Sente...
赞
踩
article
鸿蒙
原生应用,全面启动,
开发
者需要抓住风口
的
浪尖_
鸿蒙
开发
csdn
...
无论是企业
的
绝对支持,还是政府
的
大力推进,HarmonyOS
的
发展,可以说势如破竹,三分天下,也就是时间
的
问题。_
鸿蒙
开...
赞
踩
article
计算机
视觉
及
OpenCV
入门简介_opencv
csdn
计算机
视觉
...
计算机
视觉
及
OpenCV
入门简介这是一篇实验室培训过后写的感悟,附带授课大佬及实验室GitHub地址:大佬:https:...
赞
踩
article
vue
3.0 +
el
ement
Plus实现穿梭框(
el
-
transfer
)_
vue
+
el
emen...
vue
3.0 +
el
ement
UI实现穿梭框(
el
-
transfer
)_
vue
+
el
ement
多个穿梭框
csdn
v...
赞
踩
相关标签
spring boot
SSM
vue
latex
VSCode
编辑器
python
visual studio
ide
性能优化
开发语言
python开发
excel
工作
框架
任务
活动
文档
数据库
前端
前端二维码
qrcode
QRCode生成二维码
js生成二维码
qrcode安装及使用