赞
踩
搜索工具是 C 站的核心产品,也是广大计算机学习读者的最爱。基于 CSDN 的程序设计与基于 Baidu 的程序设计并肩,成为计算机学习者的最爱。
本文对几种常用的计算机行业相关搜索工具进行对比分析。
本次对比分析只针对各网站的 PC 端网页版。
专业性网站:
CSDN(https://www.csdn.net/)
博客园(https://www.cnblogs.com/)
掘金(https://juejin.cn/)
极客邦(https://www.infoq.cn/)
开源中国(https://www.oschina.net/)
跨行业平台:
知乎(https://www.zhihu.com/)
简书(https://www.jianshu.com/)
只有 CSDN、知乎 的搜索按键为橙色/蓝色独立按键,非常显著,不容易误操作,点赞!
只有 CSDN、知乎 的搜索栏设有下拉列表,提供关键词引导提示功能,点赞!
CSDN 的标题栏(含搜索栏)的高度比知乎、掘金、极客邦的标题栏高度略小,视觉感受有些拥挤。
虽然首页的版面设计不是本次对比的内容,但开源中国与博客园的页面设计相对怀旧,而知乎、掘金、极客邦的 PC版页面风格更鲜明地接近移动端的设计潮流。
通常,在网站其它页面中也设有搜索栏,位置、风格基本一致。
网页搜索,搜索关键词设为 opencv轮廓
,不是很热门也不算太偏的内容。对于这个关键词,我看过文章超过300篇,所以比较容易评价。
先上搜索结果页面,再做分析讨论。
展开更多
,点击后展开摘要的全部内容。各网站的搜索结果页面中,80%以上的有效面积/有效内容是搜索结果的标题、摘要和摘要图。
搜索结果页面中,有效内容占比最大的是文章摘要。
目前摘要的质量都比较差,很多文章作者并没有写摘要,搜索结果中的摘要是由系统自动生成的。
选择每个网站前 5 篇搜索结果进行分析,检查自动摘要的占比如下:
基于这个简单的抽样结果,我的感受是:
选择每个网站前 5 篇搜索结果,对文章内容的质量进行评价。这是一个非常不靠谱的主观评价。
CSDN:
(1)原创,有图形,有例程,有说明,结构较完整,80
(2)原创,有图形,有例程,有说明,结构很完整,内容全面,文字流畅,95
(3)原创,有图形,有例程,有说明,结构较完整,80
(4)原创,有图形,有例程,有说明,结构很完整,内容丰富,85
(5)下载内容,不做评价
博客园
(1)有图形,有例程,说明简单,部分公式显示异常,内容有点偏,60
(2)无图形,有例程,有说明,结构完整,内容丰富,80
(3)无图形,有例程,有说明,结构完整,内容丰富,部分例程和公式显示异常,70
(4)有图形,有例程,有说明,完整,内容丰富,90
(5)有图形,有例程,有说明,结构较完整内容有点偏,75
掘金:
(1)有图形,有例程,有说明,结构很完整,内容全面,文字流畅,95
(2)有图形,有例程,有说明,结构较完整,85
(3)无图形,有例程,有说明,结构较完整,80
(4)有图形,有例程,说明简单,结构基本完整,75
(5)有图形,有例程,有说明,结构较完整,85
开源中国:
(1)原创,有图形,有例程,有说明,结构基本完整,75
(2)原创,有图形,有例程,说明简单,结构较乱,65
(3)原创,有图形,有例程,说明极少,结构较乱,55
(4)无图形,有例程,有说明,结构较完整,70
(5)只有例程,无说明,无图形,结构不完整,40
极客邦:
(1)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(2)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(3)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(4)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(5)有图形,有例程,说明简单,结构基本完整,70
注:极客邦前 4 篇都是梦想橡皮擦的文章,而且是真原创,怎么能给低分呢。
知乎:
(1)纯视频,长度 16‘43’‘,内容专业完整,可惜无配套文档容,98
(2)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(3)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(4)纯视频,长度 6‘00’‘,专业视频课程,可惜无配套文档容,98
(5)有图形,有例程,有说明,结构很完整,内容全面,文字流畅,95
简书:
(2)图形少,有例程,有说明,结构很完整,内容很全面,文字很流畅,93
(2)有图形,有例程,有说明,结构完整,内容全面,文字流畅,90
(3)有图形,有例程,有说明,结构完整,内容全面,文字流畅,91
(4)无图形,有例程,有说明,结构较完整,75
(5)有图形,有例程,有说明,结构完整,内容丰富,90
首先还是要说明以上评分非常不靠谱,而且只是随机抽样,各位网友不必较真,您完全可以自行评分。
其次还是有些东西可以分析,可供参考的。
为什么要提出搜索结果的二次选择问题?
作为用户,首先关心的是能不能找到需要的内容。随着网站资源的快速增长, 内容的数量应该越来越不是主要问题了。opencv轮廓
这样一个不是很热门的搜索关键词,竟然有数万篇内容。
这说明在数字时代,不是内容太少,而是内容太多了。由此带来的另一个问题,就是能不能从海量的搜索结果中找到优质的内容,找到自己需要的内容。这是一个很有挑战性的问题。
各网站搜索结果的排序,都没有明显的规律,即都不是简单地按照发布日期或阅读量排序。显然,每家网站都有各自的搜索排序算法。
网站提供的搜索结果排序算法,能不能满足用户的需求呢?首先是提供优质内容,其次是提供特定用户需要的特定的内容。
我个人认为目前的现状并不理想。按说内容越多的网站,这个问题会做的比较好,毕竟通过内容积累和读者的阅读选择可以实现优胜劣汰。但我的实际体验并不是这样,内容越多的网站,博主范围越广泛,劣质内容也越多,优质内容被淹没的问题越突出,或者说优质内容被淹没的困扰也很大。
我简单地猜测,阅读量与内容质量一般应该具有较强的正相关性,所以我经常是以阅读量作为重要的辅助筛选指标。但我在 CSDN 的使用体验(不是本次搜索测试),也经常遇到一些阅读量非常大(数万)但质量一般甚至质量较差的内容。我猜想这类似于热榜效应,即阅读量在某些条件下可能发生正反馈,阅读量越高的文章将吸引更多的读者阅读,此时已与内容的质量无关了。
这就需要对搜索结果进行二次选择。
目前,各网站向用户提供搜索结果筛选或更换排序方式的功能都比较有限。
CSDN 在网页端提供了栏目筛选、排序方式两种搜索结果二次选择方案。
全站
、博客
、下载
、代码
、用户
等栏目进行筛选,默认选项为 全站
。如果选择 博客
栏目就可以过滤前述下载内容非会员不能打开的问题。但是这个栏目筛选其实是有些鸡肋的,因为只有 博客
、下载
栏目筛选结果有意义,其它栏目筛选结果基本没用。综合
、最新
、热门
和 VIP内容
4个标签,可以进行搜索结果重排,默认选项为 综合
。但这些标签的设计不显著,我在写本文时才注意到。最新
筛选后的搜索结果,主要是 2022年的内容,也有少量 2021年的内容,阅读量相对都较小,推测加大了发布日期在排序中的权重。热门
筛选后的搜索结果,第 1 位阅读量高达 31万+,前 5 位只有一篇阅读量低于 1 万,推测加大了阅读量在排序中的权重。VIP
筛选后的搜索结果,都需要开通 VIP 会员卡才能阅读。掘金 提供了按照 综合
、文章
、课程
、标签
、用户
进行搜索结果过滤,也可以按照 时间不限
、最近一天
、最近一周
、最近三月
进行搜索结果过滤,或者按照综合排序
、最新优先
、最热优先
进行重新排序。
开源中国 提供了按照 所有内容
、软件
、资讯
、问答
、博客
等栏目进行搜索结果过滤。
极客邦 提供了按照 全部
、InfoQ网站
、微信公众号
进行搜索结果过滤。
博客园 提供了分别按照浏览数、推荐数、发布时间对搜索结果进行筛选,但该筛选栏在屏幕右侧的广告下方,并不太显眼,界面风格非常怀旧。
简书 提供了按"文章"、“用户”、“主题”、“文集” 筛选,或按"最近一天"、“最近一周”、“最近一月”、“时间不限"筛选,或按"综合排序”、“热门文章”、“最新发布”、"最新评论"重新排序。
知乎 提供了按照专栏进行筛选,还设有“筛选”按钮可以提供按照类型、综合、时间进行筛选。
正如生产效率是制造业最核心的指标,搜索效率也是搜索工具的核心指标。搜索工具的竞争,本质上就是搜索效率的竞争。
从用户的角度考虑,我需要的首先是更方便、更快捷地找到我需要的内容,其次是尽可能减少打开后阅读无效资源、低质资源(影响心情,所以影响体验)。
从这个角度出发,并考虑技术实现的可行性,提出一些建议:
产品改善的建议:
深入研究的建议:
更加丰富全面的内容特征,例如段落数、例程数、插图数、是否原创、是否专栏,这些特征并不需要在搜索结果中体现,但可以用于训练内容质量自动评价系统。数据量越大的网站优势就越大。
用户评价机制,例如鼓励用户阅读后对文章评分,顶会论文评审已经从审稿人评审向投稿人评审转变。
作者评价模型,每位作者的文章质量虽然会有波动,但相对来说非常稳定。实际上,作者评价模型是更加客观、精准的优质创作者身份认证。
个人观点:
CSDN 的内容不是太少而是太多了,很多低质量的内容淹没了高质量的内容。
作者分层是自动评价内容质量、提高搜索质量的重要特征。
仅从搜索结果质量来考虑,CSDN 需要进行作者分层,这不仅是创作者资质认证,而是基于内容质量和用户画像等数据的作者评价(不必公开)。创作者资质认证只是作者分层的补充。
主动地、针对性地邀请优质作者在某个方向持续稳定地进行创作,对于提高搜索质量效果显著。
CSDN 拥有最大量的优质创作者,但从搜索结果来看效率并不高。
网站流量支持的创作计划不能只重数量、重热度,更好重视质量,考虑长期建设的需要。
(本文完)
版权声明:
youcans@xupt 原创作品,转载必须标注原文链接:(https://blog.csdn.net/youcans/article/details/125137881)
Copyright 2022 youcans, XUPT
Crated:2022-6-12
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。