当前位置:   article > 正文

会议__零碎知识点总结_aws技术峰会2018 技术要点

aws技术峰会2018 技术要点

以下内容为参会感想:

2017 AWS技术峰会

GPU(图形处理器)

①显卡又称为“显示核心”、“视觉处理器”、“显示芯片”,是一种专门在个人电脑、工作站、游戏机和一些移动设备(平板、智能手机等)图像运算工作的微处理器。

②其所有的运算采用并行的浮点运算。

③GPU的主要供应商:Intel、NVIDIA(英伟达,AI基础计算架构提供商)、matrox等

⑤GPU能够为深度学习模型的建立(训练过程)提供强大的计算资源

⑥云计算中也有GPU的应用

CV(计算机视觉)

①CV是一门研究如何使机器“看”的科学,准确的来说是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步作图像处理:目标检测、图像分类、图像分割、目标统计等。

②NLP(自然语言处理)是人工智能和语言学领域的分支学科,主要探索如何使用计算机处理及运用自然语言。NLP覆盖了很广泛的研究方向包括:回答问题、语言理解、语言生成、机器翻译、情绪分析等。

基于FPGA的深度学习运算

①定义:一种程序驱动逻辑器件,就像一个微处理器,其控制程序存储在内存中,加电之后,程序自动转载到芯片执行。

②优点:可并行运算使得可进行大规模并行运算;高吞吐率;低能耗;易重构性

视觉AI落地(商汤科技)

    (1)身验证份:线上线下全场景解决方案

             ①主要挑战:账号安全问题、盗用他人身份的欺诈问题、人工成本高易出错

    (2)智慧商业:精准营销破解线下零售困局(智能广告机)

             ①分析解决方案:精准营销、动线分析、商铺运营、价值客户管理、消费大数据

             ②超市摄像设备人脸识别进行客户统计(区别于红外线反复计数)

    (3)智能视频:城市级的公共安全智能视频系统

             ①传统视频监控:视频内容密度低、成本高、效率低、准确度低(抓逃犯)

             ②智能视频:实时监控、人脸搜索(扒手库)、数据分析(可疑动作贴标签)

    (4)娱乐互联网:从手机拍照到娱乐社交

             ①智能手机相册:人脸相册(人脸分组 — )、场景相册(预定义类别丰富、多标签分类场、分类精确度高速度快等)

    (5)AI商业落地原则

             ①真实有效的规则化刚需(真实[有必要的]、刚性[打算花多少钱]、规模化[行业空间])

             ②行业需要的技术红线(技术预判力)

             ③有效的数据闭环(技术+数据+业务的正反馈)

             ④核心价值要素转移(技术壁垒期)

             ⑤技术创新能力

短视频变现方式:

    ①短视频的变现方式非常多额分散,平台补贴和广告是目前短视频创作团队最主要的变现方式,其他方式包括知识付费、电商、衍生品等,还处于发展阶段。

    ②视频贴片广告增速面临瓶颈,信息流广告增长迅速,成为移动营销蓝海

    ③短视频团队以1-5人、成立时间较短(6个月到1年)、一半以上没有市场和营销团队

    ④三农、军事和游戏是目前短视频团队盈利比例最高的内容领域。

    ⑤与电视剧电影等长视频相比,短视频更有能力攫取用户的碎片时间,则意味着有更多的投放广告的空间

2018 AWS技术峰会

未整理

2019 GIOTC世界物联网大会

物联网

1.物联网发展的要求:①低成本 ②协同高时效 ③大集群协同

2.中国物联网发展问题:①安全问题(包括法规)

                                       ②物联网运营成本太高

                                       ③物联网采集数据的价值挖掘不充分

3.中国物联网发展阶段:①人物互联

                                       ②人人互联

                                       ③物物互联(现阶段) -->  车联网

                                                                                   工业互联网

4.物联网芯片:新开发模式(开源)-> REISC-V  -> ①精简

                                                                                  ②丢弃历史的包袱(x86到2014年指令已达到2400多)

                                                                                  ③生态挑战(Windows:桌面端;ARM:嵌入式)

5G

1.1G到5G的对比:

1G2G3G4G5G

1.模拟通信

2.语音质量差

3.安全性差

4.最高速度2.4kbps

1.数字通信(GSM)

2.引入:文本加密,SMS短信服务,图片消息,MMS彩信

3.最高速度(GPRS):50kbps

1.蜂窝通信(LTE)

2.将无线通信与国际互联网等通信技术全面融合

3.全面支持更加多样化的多媒体技术

4.速度快、效率高、信号稳定、成本低廉和安全性能好

1.LTE-A

2.将Wlan和3G技术结合,使得图像传输速度更快、图像质量和清晰度更高

3.APP下载与应用速度更高,费用更高

4.最高速度100M

1.新一代蜂窝移动通信技术

2.速率更快,可满足高清视频和虚拟现实、IOT集群等多种应用,

3.更快的响应时间,满足自动驾驶、远程医疗等应用,

4.超大的网络容量,提供了千亿设备的接入能力,为物联网打下基础

5.流量密度和连接数密度大幅度提升

4.最高速度10Gbit/s

 

 

 

 

 

 

 

 

2.5G存在问题:①基础设施建设成本过高

                          ②波段长,传播距离更短(服务区域被划分为许多被称为蜂窝的小地理区域)

3.5G资费的收取:①按照使用流量进行收费

                              ②按照5G接入的速度进行收费

物联网智慧车

1.法雷奥:①车车互联,实现“超视距”,超车更加方便且安全

                  ②实现“虚拟感知现实技术”,可远程景象共享或远程汽车驾驶

                  ③问题:车车互联过程中,数据共享能否得到用户的同意?

2.360安全大脑:①攻击无人驾驶汽车的方式有三种:接触式协议破解攻击(破门);

                                                                                     远程非接触式攻击

                                                                                     非接触式对抗攻击(干扰传感器、利用光声固有弊端进行算法对抗)

                           ②安全大脑的运作方式:终端分析 -> 结果上传云端 -> 决策

                           ③问题:终端分析的计算能力是否足够?

区块链

1.过度强调区块链的金融属性

2.医疗领域区块链:(1)问题:①医疗领域样本量不足

                                                    ②缺乏共享激励机制

                                                    ③医疗数据隐私问题

                                (2)医疗大数据平台 -> 不同医疗机构数据互联 -> ①科研

                                                                                                                  ②数据哈希上传

3.保险行业:区块链降低人工成本,提升效率

2019 传智汇AI大数据精英大会

1.NeuHub京东人工智能开放平台:ai.jd.com

第二曲线与数字化转型创新

1.传统数据(正态分布) -->  数字化 -->  共享  -->  数据增值(逆正态分布)

2.数字化平台建设过程:①产品服务化(共享单车)

                                       ②服务智能化(RPA:机器人流程自动化技术)

                                       ③员工社会化 (外包:无边界企业)

                                       ④客户员工化(即是使用者,也是营销者)

                                       ⑤资源共享化

                                       ⑥企业平台化(平台集群化:生态链)

3.Web1.0到Web3.0的区别:

Web 1.0

Web 2.0

Web 3.0

功能:

(1) 阅读静态且只读网页

(2) 资料下载

缺点:

(1) 仅能阅读,不能参与

功能:

(1) 增加社交媒体网站、博客和在线社区等

(2) 终端用户可以在任何时间实时地交互和协作

缺点:

(1) 网民之间只能停留在精神层面的交流(不影响物质财产得失)

功能:

(1)  网络看似成为一个真正的社会,通过使用者的共同参与、共同分享、共同拥有和共同治理,打破了超级机器的控制(Google\AWS等)

(2)  引入去中心化互联网

缺点:

(1) 用户无法跨越不同应用平台,并共享不同社区信息资料,以通过简单的入口获取其中需要的信息

(2) 搜索的智能化

以一个书店的发展为例  

物理技术:货架

社会技术:连锁加盟

商业设计(模式):卖书(差价)

物理技术:互联网

社会技术:网络效应

商业设计:效率

物理技术:Web 3.0

社会技术:智能空间、社群

商业设计:生活方式提案

茑屋书店

4.人才培养的过程中 实践 非常的重要

深度学习·医疗

1.医学领域数据打标成本非常高

2.常用打标算法:active-learning(主动学习)-> 对较难数据进行标注

                            半监督学习(边标注边学习)

                            迁移学习

                            weak-supervision(弱监督学习)

3.畅想:脑机接口(human-brain-computer interface: BCI) -->  AI反向辅助人类  -->  AI越智能,人越笨

AI落地自动化/开发效率

1.学术界编程水平不高,模型较大,效率较低

2.模型反哺:人工标注量达到某一阈值时,重新对模型进行训练(用户评论点赞数达到一定程度后调整评论的可信度 / 当用户对推荐结果不喜欢达到一定程度后则调整评分矩阵重新对模型进行训练)

3.模型算例设备:CPU、GPU、ASIC(专用性较强)、FPGA、LOIHI(内含神经元)

4.主流算法框架:TensorFlow(工业界)、PyTorch(学术界)

5.主流开发语言:Python

6.NLP应用:论文筛选与匹配

电信网络运维中的AI

1.常用数据:①固网及无线网管道数据(DPI)

                     ②普通用户注册信息(CRM)

                     ③政企客户信息(CRM)

                     ④流量及话单数据(ODS)

                     ⑤移动位置数据(信令)

                     ⑥家庭智能电视(IPTV)

  •  通过以上数据可得出 -->  什么时间?什么设备?有几个人?哪个人在看什么节目?

2.关键指标异常数据监测算法(20多种):https://blog.csdn.net/micklongen/article/details/89440970

2019 58招聘个性化推荐

1.C端求职者典型推荐场景

(1).首页招聘打类别推荐(类推电商:注重推荐的新颖性 --> 长尾)

(2).类目推荐(类比电商:注重推荐的多样性

(3).相似推荐(类比电商:注重推荐产品的相关性

2.不怀好意用户的主要表现

(1).暴露联系方式(同音变形、象形字 --> 类比电商:第三方引流/店家引流) -->  微信、QQ

(2).内容不成句(类比电商:“宝宝v吃饭就快来了没哪哈尴尬”)

(3).高薪诱惑(类比电商:导向性词汇)

(4).在平台很活跃

3.推荐列表重排序机制原因

(1).内容质量是基础保障

(2).对自己或对方的错误判断(类比电商:对商品质量的错误判断)

(3).求职或招聘都是周期性行为(类比电商:喜好是具有一定周期的)

4.数据稀疏表现:58招聘业务的流量构成中,有一部分三四五线城市,城市越下沉,数据稀疏的情况越明显

                          (类比电商:商品价格越高/低数据稀疏的情况越明显)

2019 从0→1搭建推荐系统

1.推荐列表重排(干预):①推荐场景(类比电商:户外/室内←→不同地点天气状况)

                                           ②推荐年龄层次(类比电商:用户年龄→大人/小孩)

                                           ③推荐终端(类比电商:移动端/网页端 ←→安卓端/苹果端)

                                           ④推荐结果的时序性(类比电商:哈利波特图书1 → 5)

                                           ⑤热门商品(类比电商:满足大众的从众信息)

                                           ⑥用户对感性趣商品的关注时长(类比电商:喜欢A商品一段时间后,就不喜欢A商品了)

                                           ⑦重大时间节点(类比电商:五四青年节期间推荐青年喜欢的商品 / 重要影片)

                                           ⑧用户性别(类比电商:女性为主力军,则可推荐男明星代言商品/女性话题(母亲节)/)

                                           ⑨省份差异(类比电商:不同地区用户的购物习惯存在差异)

                                           ⑩浏览时间(类比电商:晚上用户的下单热情更加高涨)

2.推荐效率:在海量物品组成的可推荐池中,对所有数据进行一定的处理,才能保证在百毫秒内召回需要推荐的物品,并对物品进行排序与推荐。 商品池 → 聚类 → 泛化相似用户/物品群体 → 群体内相似度计算公式计算相似用户/物品 → 产品推荐

3.不管是机器学习(ML)还是推荐系统(RS),追求的是整体的效果提升,而无法具体到优化个人效果

4.流量红利:指访问流量中新用户不断增加,用户平均消费额度不断增加

5.CTR:用户在搜索引擎中输入关键词进行搜索,然后按竞价等因素按序排列后显示;用户按自身兴趣进行点击

                                           点击率 = (网站点击次数/某网站被搜索出的总次数)X100%

2019-2020 今日头条营销通案

1.传媒平台

(1). 传媒平台正在逐渐大众化

(2). 中国移动互联网用户规模趋于平稳,同比增长率持续下降(极光大数据:网民总量11.3亿上下浮动 --> 红利见底

2.阅读时段:(类比电商:不同时段购买需求不同)

 3.阅读喜好:(类比电商:不同年龄段的购物喜好不同)

 4.搜索行为偏好:(类比电商:不同推荐终端的推荐列表(重排)不同)

(1). PC时代:搜索行为相对集中(类比电商:集中于搜索某一类商品,主要因为电脑的办公属性更强)

(2). 移动时代:搜索行为分散,即搜即走(类比电商:漫无目的的闲逛,主要因为手机端休闲属性更强)

(3). 新趋势:用户在信息密度高的综合平台搜索  → 内容推荐+搜索

 

2019 白岩松香港演讲:《白说:读书、阅人、知时》

1.知识 ≠ 智慧

懂得再多,不会做也无济于事

2.数据趋同

数字化时代,产生了海量数据,数据也越来越趋同

3.伟大往往诞生于无聊(手机拿走了人们的无聊,也顺便把与无聊有关的伟大一并拿走)

(1). 手机可打发无聊的时光

(2). 伟大往往会诞生于无聊之中

4.自我提升,在于自我别扭

要喜欢别人不喜欢,要听别人不愿意听,要想别人不愿意想,要做别人不愿意做(跳出舒适圈)

5.多关注不变

(1). 社会在发展,时代在进步,科技在变革,变革无处不在

(2). 当别人都在关注变得时候(自主创业),你更应该关注不变的东西(核心能力)

6.上善若水

上善若水,是一个成语,语出《老子》:“上善若水,水善利万物而不争,处众人之所恶(wù),故几于道。”指的是:至高的品性像水一样,泽被万物而不争名利。不与世人一般见识、不与世人争一时之长短,做到至柔却能容天下的胸襟和气度。在道家学说里,水为至善至柔;水性绵绵密密,微则无声,巨则汹涌与人无争且又容纳万物。水有滋养万物的德行,它使万物得到它的利益,而不与万物发生矛盾、冲突,人生之道,莫过于此。

7.以正治国,以奇用兵

“正”为常道,是不变的原则,“奇”为权变,是因时、人、地、事而制宜的手段,二者相互配合,缺一不可。

2019第四届中国新金融高峰论坛

新消费、新零售的变量与变革

1.金融领域发展前沿:重视普惠金融 → 问题:①认知问题(普惠金融并不仅仅针对农民工等弱势群体或组织)

                                                                         ②路径问题(即:如何进行普惠,并不仅仅是覆盖面的问题,每个人都与之有关系)

2.消费观念发生变换:①小孩 - 老人成为消费主力军

                                   ②年轻群体消费倾向于透支消费

3.AI模型的反应过于灵敏(到底:一眼万里?还是应当大智若愚?)

4.金融结构服务趋势:老龄化(而非无人化)

求解数据治理与数字化转型

1.数据治理之困:

                         ①数据孤岛:外部数据孤立 / 内部数据设定使用权限 / 数据接口格式不统一

                         ②数据质量低:体现在“一致性” + “完整性”

                         ③有数不善用:法律制度不完善 → 非法获取 / 非法买卖

2.数据治理之道:

                         ①全过程的数据安全(存储→共享→……)

                         ②确定统一且明确的数据管理主体(防止数据的重复采集与处理,节省成本)

                         ③数据用途治理

3.不同年龄段对网络的信任度不同

   网络征信系统要开放

2019消费金融新趋势

               【发展现状】

                              ①市场规模逐年扩大

                              ②参与主体多元化(银行、电商平台、消费金融公司、金融科技公司)

                              ③年轻人逐渐成为主力军(借贷消费观念、贷款金额消、贷款频次更高 → 普惠金融)

                【存在问题】

                              ①银行机构在消费金融借贷中占比过高,达97%。且多为成年人

                              ②传统金融覆盖面不足(银行主要依靠信用卡和个人金融业务的部分产品服务拉动个人消费需求:且多为房贷、车贷等,真正用于消费的资金有限)

                              ③多头借贷问题严重(数据共享障碍,存在以贷养贷、恶性欺诈等问题)

                              ④消费者保护有待加强(数据泄露、暴力催收、电话骚扰、利率过高等)

                 【消费金融高质量发展的两大趋势】

                              ①技术创新能力(既包括技术研发能力,也包括技术作用于消费金融带来的节能提效)

                              ②用户下沉能力(区域下沉+用户下沉:有征信优质/有征信次优/无征信优质/无征信次优客户)

2019年中国大数据行业研究报告

1.“美林数据”是工业领域的大数据融合应用

2.全球大数据存储量中,中国占比23%

3.大数据软件市场占比上升,硬件市场占比下降

4.广告投放流程:

5.工业大数据:贯穿在整个生产过程中,包括了设计、研发、订单、采购、制造、供应、库存、发货、交付、售后、运维、报废回收等整个生命周期所产生的各类数据及相关技术和应用

 

工业大数据与商务大数据的区别
 工业大数据商务大数据
采集高时效低时效
处理数据质量要求高数据预处理(要求并不严格)
存储高关联性低关联性,存储相对自由
分析领域差异较大,模型复杂,专用性强常规AI模型
可视化结果→3D场景可视化可视化
闭环反馈闭环反馈,不断优化无须闭环

6.暗数据:尚未转换成数字格式的数据称为暗数据

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/800522
推荐阅读
相关标签
  

闽ICP备14008679号