赞
踩
数据的概念
数据指的是事实或经过观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。
数据的类型
数据模型
数据模型的三种类型:概念模型、逻辑模型和物理模型。
对应软工中的:概要设计、逻辑设计、物理设计。
数据科学
定义:数据科学是关于数据的科学,是探索和发现数据中价值的理论、方法和技术,是对从数据中提取知识的研究。
数据预处理的步骤
数据审计、数据清洗、数据集成、数据变换、数据脱敏、数据归约、数据标注。
数据科学家
定义:能使用科学的方法,运用数据挖掘工具对复杂的、大量的数字、符号、文字、网址、音频、视频等信息进行数字化重现与认识,并从中寻找新的数据洞察的工程师或专家。
无
数据预处理
任务:使残缺的数据变的完整,并将错误的数据纠正、多余的数据去除,进而将所需的数据挑选出来,为数据挖掘内核算法提供干净、准确、更有针对性的数据,并提高知识发现的准确度。
数据清洗的工作
数据仓库
数据仓库系统由数据仓库、ETL工具、元数据、访问工具、数据集市和数据仓库管理系统组成。
Hadoop 两大核心部分
Python;无
无
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。