赞
踩
1、大数据所面临的的安全问题:
①速度方面的问题:传统的关系型数据库管理系统一般都采用集中式的存储和处理,没有采用分布式架构,这种配置在面对不断增长的数据量和动态数据使用场景时在速度响应方面捉襟见肘,面对大数据量的导入导出、统计分析、检索查询方面,由于依赖于集中式的数据存储和索引,性能随着数据量的增长而急速下降;
②种类及架构问题:随着物联网、互联网以及通信网络的飞速发展,数据的格式及种类在不断变化和发展,比如在智能交通领域,所涉及的数据包含文本、日志、图片、视频、矢量地图等来自不同数据采集监控源的、不同种类的数据,这些数据的格式通常都不固定,采用结构化的存储模式很难应对不断变化的需求,需要采用新型的分布式文件系统及分布式NoSQL数据库架构;
③体量及灵活性问题:数据量越来越大的时候,集中式的文件系统或单数据库操作成为致命的性能瓶颈,可以采用线性扩展的架构和方式,把数据压力分散到很多台机器上,这样就可以根据数据量和并发量来动态增加和减少文件或数据库服务器。在计算领域中资源分配、任务分配实际上是一个任务调度问题,主要任务是根据当前集群中各个结点上的资源占用情况和各个用户作业服务质量要求,在资源和作业及任务间做出最优匹配;
④成本问题:集中式的数据存储和处理对硬件选型时,基本采用的方式都是配置高的服务器和访问速度快、保障性高的磁盘阵列,保证数据处理性能。新型分布式存储架构、分布式数据库由于大多采用去中心化、海量并行处理MPP架构,在数据处理上不存在集中处理和汇总瓶颈,同时具备线性扩展能力,能够有效应对大数据存储和处理问题,在软件架构上也都实现了一些自管理、自恢复的机制,以面对大规模结点容易出现的偶发故障,保障系统整体的健壮性;
⑤价值挖掘问题:传统的数据挖掘一般数据量较小,算法相对复杂,收敛速度慢,大数据的数据量巨大,在对数据的存储、清洗、ETL方面都需要能够应对大数据量的需求和挑战,很大程度上需要采用分布式并行处理方式,并且需要结合大批量的离线计算和实时计算;
⑥存储安全问题:关系型数据库管理系统经过几十年的发展已经形成了一套完善的存储、访问、安全和备份控制体系,但是由于大数据对传统RDMS的冲击,集中式的数据存储和处理也在转向分布式并行处理,然而这些新兴系统,在用户管理、数据访问权限、备份机制、安全控制等各方面还需要进一步完善;
⑦互联互通与数据共享问题:信息化建设过程中,普遍存在条块分割和信息孤岛现象,不同行业之间的系统和数据几乎没有交集,同一行业通常也是按照行政领域划分,跨区域的信息交互和协同比较困难,为实现跨行业数据整合,需要制定统一数据标准、交换接口、共享协议,这样不同行业、不同部门、不同格式的数据才能基于一个统一的基础进行访问和共享。
2、基于大数据威胁的发现技术的特点:
3、基于大数据的认证技术:收集用户行为和设备行为数据,并对这些数据进行分析,获得用户行为和设备行为的特征,为用户勾画一个行为特征的轮廓,进而通过鉴别操作者行为及设备行为来确定身份。攻击者很难模拟用户行为特征来通过认证,因此更加安全;用户行为和设备行为特征数据的采集、存储和分析都由认证系统完成,可以减轻用户负担;也可以更好地支持各系统认证机制的统一,可以在整个网络空间采用相同的行为特征进行身份认证。
4、基于大数据的数据真实性分析:能够提高垃圾信息的鉴别能力,一方面,引入大数据分析可以获得最高的识别准确率;另一方面,在进行大数据分析时,通过机器学习技术可以发现更多具有新特征的垃圾信息,所面临的一些困难主要是虚假信息的定义和分析模型的构建等。
5、大数据安全的防护策略:
学习感受:当前世界发展潮流下,尤其是在数据、算法加持下的人工智能时代,大数据与个人生活息息相关,每个人都好像被具化为一个网络镜像,没有人能逃离数据的监视。或许有人说“那些不上网,不参与任何网络活动的人就不会有隐私泄露的问题”,其实,这部分人士的信息已经又以另一种形式存于网上,即底层社会组织关系网,比如:有的老人不会上网,子女或许会定期网上购物、预约医疗、购买保险等等。或有心、或无心的各种数据搜集行为让每一个人都在网络上无处遁形,被时代裹挟着前进,享受着数据带来的优势和便利,又无法摆脱深陷的快餐文化,希望以后构建的群体镜像能够更多地服务于社会,不要再打着个人的幌子“偷走”属于本该自己掌控的时间和金钱。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。