赞
踩
来自https://blog.csdn.net/qq_16379491山东大学软件学院2022-2023数据科学导论期末试题
一、
大数据的定义和4个特点。
数据规范化的目标,并列举三个方法。
列举处理缺失数据的三个方法。
二、计算图表A,B的关系连接:INNER JOIN (内连接)和 LEFT OUTER JOIN(左向外连接)
表格和这道往年题基本是一样的:2021-2022山东大学软件学院数据科学导论期末考试回忆版_南河的南的博客-CSDN博客_山东财经大学数据科学导论期末考试
1、SELECT * FROM Table A INNER JOIN Table B ON A.sid=B.sid 画出结果表格
2、SELECT A.name, B.address FROM Table A LEFT OUTER JOIN Table B ON A.sid=B.sid 画出结果表格
三、SQL语言的类型有哪几种?创建名为student的表,包含学号(sid),姓名(name),年龄(age)。
四、关系型数据库和非关系型数据库的区别。
五、
什么是数据的集中趋势?列举三个指标。
什么是数据的离散程度?列举两个指标。
什么是数据的形状特点?列举三个指标。
最大后验估计之于极大似然估计的区别。
假设检验和参数估计的区别?说明假设检验的主要步骤。
六、说明独热表示的原理,并使用独热方式表示下面三个文档:
Doc 1: I am a boy, boy.
Doc 2: You are a girl, girl.
Doc 3: We are different, different.
七、给出日常生活中的图结构,并举出一些数据可视化的工具的例子。
二、
三、
CREATE TABLE student (
sid INT,
name VARCHAR(100),
age INT
);
四、
五、
六、
七、
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。