赞
踩
内容总结自《亿级流量系统架构设计与实战》
内容发布系统旨在管理从用户发布内容到内容为大众所见的全生命周期流程,包括新建内容、修改内容、内容审校、内容分发、内容下架等。可以说,内容发布系统是面向用户的应用的核心功能性系统之一。
内容发布系统并不是一个简单地进行内容创建与数据存储的系统,其中有很多的业务细节与技术细节需要考虑。这里先抛出如下几个实际问题:
信息表:item_info
字段名 | 类型 | 含义 |
---|---|---|
item_id | int | 内容唯一标识,主键。要求全局唯一,推荐使用分布式唯一ID生成器生成 |
creater_id | int | 创作者ID |
online_version | int | 线上内容的版本号 |
online_image_urls | varchar | 线上内容相关的图片存储的URL列表 |
online_video_id | int | 线上内容的相关视频存储的唯一标识 |
online_text_url | varchar | 线上内容的相关长文本存储URL |
latest_version | int | 最新变更的内容版本 |
create_time | datetime | 内容创建时间 |
update_time | datetime | 内容修改时间 |
visibility | int | 线上内容的可见范围:私密、好友可见、粉丝可见、所有人可见 |
status | int | 内容的状态:待审核、正常展示、被删除、被下架 |
extra | varchar | 其它扩展字段 |
内容修改历史记录表:item_record
字段名 | 类型 | 含义 |
---|---|---|
record_id | int | 主键id |
item_id | int | 此次变更操作关联的内容id |
latest_version | int | 此次变更内容的版本号 |
latest_status | int | 此次变更审核状态:待审核、审核通过、审核拒绝 |
latest_reason | varchar | 此次变更审核不通过原因,如涉黄、涉恐、侵权等 |
latest_image_urls | varchar | 此次变更涉及的内容相关的图片存储的URL列表 |
latest_video_id | int | 此次变更涉及的线上内容的相关视频存储的唯一标识 |
latest_text_url | varchar | 此次变更涉及的线上内容的相关长文本存储URL |
update_time | datetime | 修改时间 |
create_time | datetime | 创建时间 |
每次变更内容后,都不一定化立刻将内容发布上线。item_ info 表的主要作用是存储此内容的基本信息,直接对接每个用户该取的内容元信息;而 item_ record 表的主要作用是存储内容交更记录,待内容审核通过后再将交更记录替换到 irem_infio 表中,相当于暂存待生效的内容元信息。
查询是一个高并发场景,优化策略:
1)全量送审
任何用户发布内容时,都触发内容审核机制
2)部分送审
可以制定业务指标规则,仅针对达到一定业务指标的内容进行送审操作。
业务指标参考:
审核一般由人工智能审核和人工审核两种方式配合完成。
我们需要知道,无论是何种类型的内容,采用人工智能自动审核都不能保证100%判断正确,所以在给出审核结果的同时给出了审核结果判断的置信度。如果置信度极高,则认为采用人工智能进行判断的结果是可信的,判断为审核通过的内容就通过,判断为审核拒绝的内容就拒绝;而如果置信度很低,则属于存疑情况,计算机无法得出明确的结论,需要进一步做人工审核。人工审核的流程比较简单:一批审核人员人工判断内容是否应该通过审核。审核人员会经过公司的专门培训,在对什么内容不可通过审核有强烈的认知后,进人审核岗位。
当内容需要送审时,可以利用MQ通知审核中心,审核中心回查审核内容,继而完成审核操作。审核中心审核完成后,再通知内容发布中心,完成内容审核状态的修改
消息队列主题 | 含义 | 生产者 | 消费者 |
---|---|---|---|
event_audit_content | 内容送审核通知 | 内容发布系统 | 审核中心 |
event_audit_result | 内容审核结果通知 | 审核中心 | 内容发布系统 |
内容送审核通知流程图:
内容审核结果通知流程图:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。