赞
踩
MongoDB九大优化方式:
第一:单次批量查询比循环逐条查询更快;
循环查询是开发者最常犯的错误写法。循环嵌套查询写代码快,逻辑简单,最耗时。在小批量数据处理时间一般远小于数据库查询时间。所以尽量避免增加查询次数,能把多次查询合并成单次批量查询尽量查询。解决办法:先预处理把查询字段合并成一个数组,然后数组中的同类项,接着用批量查询(包括管道操作),转成map,最后用map的get方法查找数据。
let list = await VRRecord.find({ type: '航拍', status: { $in: ['', null, 'FINISH'] } }, '-_id -estate_id -views_num').sort({ create_time: -1 }).lean().exec(); // let time1 = new Date().getTime(); // logger.debug('time1-time0:', time1-time0, 'list.length:', list.length); // 使用map和concat来遍历list,并提取每个元素的estates数组 let newList = [].concat(...list.map(item => { // 确保estates是一个数组 return Array.isArray(item.estates) ? item.estates : []; })); // 使用Set来去除重复的 newList = Array.from(new Set(newList)); // logger.debug('newList:', newList); let subUserMap = new Map(); if(newList.length > 0){ let realEstateList = await EstateModel.find({ id: { $in: newList } },'-_id id real_estate_name').lean().exec(); subUserMap = new Map(realEstateList.map(item => [item.id, item])); } // logger.debug('subUserMap:', subUserMap); let newList2 = [].concat(...list.map(item => { // 确保lands是一个数组 return Array.isArray(item.lands) ? item.lands : []; })); // 使用Set来去除重复的 newList2 = Array.from(new Set(newList2)); // logger.debug('newList:', newList); let subUserMap2 = new Map(); if(newList2.length > 0){ let matchLands = await LandModel.find({ id: { $in: newList2 } },'-_id id name').lean().exec(); subUserMap2 = new Map(matchLands.map(item => [item.id, item])); } let nameMap = {}; for (let i=0; i<list.length; i++) { list[i].hasMarker = false; if (list[i].markers) { for (let key in list[i].markers) { if (list[i].markers[key].length) { list[i].hasMarker = true; break; } } } delete list[i].markers; let matchEstates = []; if (list[i].estates) { for (let k=0; k<list[i].estates.length; k++) { let id = list[i].estates[k]; if (!nameMap[id]) { let realEstate = subUserMap.get(id); // await EstateModel.findOne({ // id: id // },'-_id id real_estate_name').lean().exec(); nameMap[id] = realEstate; } if (nameMap[id]) { matchEstates.push(nameMap[id]); } } } list[i].real_estate_name = matchEstates.map(x => x.real_estate_name).join(','); list[i].matchEstates = matchEstates; if (list[i].lands) { let newLands = []; list[i].lands.forEach(land =>{ if(land){ let item = subUserMap2.get(land); if(item){ newLands.push(item); } } }); // let matchLands = await LandModel.find({ // id: {$in: list[i].lands} // }, 'id name -_id'); list[i].matchLands = newLands;//matchLands; } }
这种修改可以把原来嵌套查询达到12秒的处理时间降低到0.3秒
第二:尽量避免嵌入不断增加的数据;
MongoDB存储数据的机制决定了对数组不断追加数据是很低效的。在正常使用中数组和对象大小应该相对固定。
第三:预填充数据;
比如统计每个小时的访问量,先建一个24个0的数组。
第四:尽可能预先分配空间;
知道文档开始比较小,后面会变为确定的大小的,可以先存个确定大小的填充字段,再删除(
u
n
s
e
t
)
这个字段。如果存储文档时便为其分配将来所需的空间,之后便不再需要移动它。第五:文档要自给自足;
M
o
n
g
o
D
B
只存取数据,不做计算。计算尽量在客户端(包括调用
M
o
n
g
o
D
B
的后台服务器)完成。第六:避免使用
unset)这个字段。如果存储文档时便为其分配将来所需的空间,之后便不再需要移动它。 第五:文档要自给自足; MongoDB只存取数据,不做计算。计算尽量在客户端(包括调用MongoDB的后台服务器)完成。 第六:避免使用
unset)这个字段。如果存储文档时便为其分配将来所需的空间,之后便不再需要移动它。第五:文档要自给自足;MongoDB只存取数据,不做计算。计算尽量在客户端(包括调用MongoDB的后台服务器)完成。第六:避免使用where;
第七:编写代码处理数据完整性问题;
在后台执行一些检查和保护数据的脚本,能解除很多后顾之忧,避免出现脏数据。
第八:使用正确的类型;
数据类型影响数据的查询方式、数据存放顺序、占用多少空间。数字,日期,字符串。
第九:用简单唯一的id替换掉_id。
节省空间,注意这个唯一id要是唯一的。原来_id具有递增不重复的作用,代替它的id也有具有该功能来避免出现脏数据。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。