赞
踩
摘要:基于数据复用与低碳计算的指导原则,重新定义了算据的概念,通过预处理、预训练、脱敏、加密等技术将数据转化为算据,建立完善的算据标准体系,实现算据的规范统一管理及应用。针对算据的特点和应用价值,提出了FAIRDNS原则,为算据边界划分、分类梳理和存储管理提供了参考依据及方案建议,并对算据标准化、算据资源库和算据应用生态建设等方面作出思考。
关键词:算据;低碳计算;标准化
0 引言
随着经济的高速发展,算力的需求和供给均大幅增长,数据中心是电力消耗的大户。据国网能源研究院预测,到2030年我国数据中心用电量将突破4 000亿千瓦时,占全社会用电量的比重将升至3.7%。随着碳达峰、碳排放目标的提出,“绿色计算”“低碳计算”[1]被频繁引用,如何实现“低碳计算”成为各项研究中炙手可热的话题。
算力、算法与数据被称为人工智能的三大要素,但并非所有数据都能直接和算法无缝结合产生价值。要满足算法的输入要求,数据需要经过筛选、清洗、加工、转换、标注等一系列流程,才能用于模型的训练。据不完全统计,企业中的算法工程师们80%的时间都在从事数据处理的工作,同时数据处理也需要大量的计算资源,但大部分团队对数据处理的需求基本相同,数据处理的人力和算力均造成了大量的重复工作和资源浪费,带来了不必要的能源消耗。不仅人工智能,大数据分析、科学计算等技术也需要对原始数据做大量前处理操作,很多工作是重复进行的。同时,数据存储格式混乱,各类数据未统一管理,孤岛林立,也造成了大量的冗余存储。
在近几年的生产实践中,不少企业通过数据中台
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。