我家自动化

这个屌丝很懒，什么也没留下！

热门标签

2024智源大会议程公开丨AI安全

作者：我家自动化 | 2024-08-22 05:09:11

踩

黄文灏清华大学

2024年6月14日-15日，第6届北京智源大会将以线下与线上结合的形式召开，线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野，汇聚年度杰出工作研究者，交流新思想，探讨新思路，引领新前沿。目前已正式开放报名渠道。

北京智源大会倒计时：2 天

AI安全论坛丨6月15日全天

通用型人工智能技术飞速发展，已经成为推动社会变革与经济发展的关键力量。随之而来的AI安全问题也日益凸显，引发了巨大的不确定性。从人机对齐，到安全评估，每一个议题都关系到人工智能的可持续发展。如何最大限度地提高人工智能的效益并减轻其风险，需要全球合作。

本论坛由智源研究院和美国Safe AI Forum，FAR AI 联合组织，邀请中外AI安全领域顶尖科学家，包括图灵奖得主、中国科学院院士，姚期智先生；加州大学伯克利分校教授Stuart Russell教授；清华大学智能产业研究院（AIR）院长，张亚勤教授；智源研究院学术顾问委员会主任，美国国家工程院外籍院士张宏江博士；清华大学资深文科教授，苏世民学院院长，薛澜教授；MIT人工智能与基础交互研究中心教授，未来生命研究所创始人Max Tegmark，以及来自Google DeepMind, 新加坡信息通信媒体发展局(IMDA)以及海内外致力于AI安全发展的初创公司及研究机构代表，共议人工智能安全发展。圆桌环节将与加州人类兼容人工智能研究中心（CHAI）连线，探索“全球视角下的前沿AI安全”。论坛通过主旨报告、圆桌讨论、闭门工作坊等多样化讨论形式，与各国AI安全领域专家加强学术交流与对话，凝聚科学共识，促进构建开放、公正、有效的人工智能安全与治理的机制，期望为人工智能技术发展与人类科技文明的可持续性贡献力量。

论坛议程

论坛主席

张宏江，智源研究院学术顾问委员会主任

北京智源人工智能研究院学术顾问委员会主任，美国国家工程院外籍院士。原微软亚太研发集团首席技术官，曾任金山软件CEO、微软亚太研发集团CTO、微软亚洲工程院院长、微软亚洲研究院副院长，微软第一批“杰出科学家”。国际计算机协会（ACM）和电气电子工程协会（IEEE）双会士，曾获2010年IEEE计算机学会技术成就奖和2012年ACM多媒体杰出技术成就奖，并获评2008年度美国杰出亚裔工程师奖。发表过近四百篇学术论文，编著过多本学术专著。自2018年起，在Guide2Research发布的世界顶尖计算机科学家排名中，蝉联中国大陆科学家榜首。

Stuart Russell，加州大学伯克利分校教授

加州大学伯克利分校教授。ACM Fellow、AAAI Fellow、AAAS Fellow。1995年荣获IJCAI Computers and Thought Award。他与Google研究总监Peter Norvig合著的《人工智能：一种现代的方法》是人工智能权威教材。2020年，他的新书《AI新生：破解人机共存密码——人类最后一个大问题》（Human Compatible：Artificial intelligence and The problem of control）在中国出版。

主持人

廖璐，智源研究院国际合作负责人

北京智源人工智能研究院国际合作负责人，致力于人工智能领域国际交流合作与AI青年科学家（青源会）社区建设。她对人工智能安全治理怀有浓厚兴趣，希望AI安全向善发展。加入智源前，她曾就职于联合国总部等国际组织。她拥有美国马里兰大学公共管理硕士学位（受国家留学基金委公派全额资助）和广东外语外贸大学翻译硕士（口译方向）学位。她主译并出版译著《千脑智能》、《新机器智能》。

Saad Siddiqui，Safe AI Forum AI政策研究员

Saad Siddiqui (司慕恒）是Safe AI Forum (SAIF) 的人工智能治理研究员。在加入SAIF之前，Saad在贝恩公司担任管理顾问，也在人工智能治理中心进行研究，研究题目聚焦于识别中西方在人工智能安全和治理方面的潜在合作领域。Saad 目前也是牛津大学牛津马丁学院人工智能治理计划的成员。他拥有清华大学的全球事务硕士学位和剑桥大学的政治与人类学学士学位。

演讲主题及嘉宾介绍（按照发言先后顺序）

1、主题报告

Max Tegmark，MIT人工智能与基础交互研究中心教授，未来生命研究所创始人

宇宙学家，现任麻省理工学院物理学终身教授、基础问题研究所科学主任；生命未来研究所创始人之一。代表作《Life 3.0》、《Life 3.0 Our Mathematical Universe》等。

2、AI安全技术如何促进AI广泛落地？

报告简介：尽管可能威胁人类生存的通用人工智能尚未完全来临，各类专用智能模型和大语言模型已经带来了许多实际安全问题，并成为了当前AI在各类严肃场景落地应用的巨大障碍。如何发展恰当的AI安全技术，以增强AI的安全性和鲁棒性来满足场景应用需求？本次报告将以人脸识别、自动驾驶、大语言模型及AIGC等为例，介绍这一领域发展。

田天，瑞莱智慧RealAI公司联合创始人及首席执行官

田天是瑞莱智慧RealAI公司联合创始人及首席执行官。博士毕业于清华大学计算机系，高级工程师，他致力于建设安全可控的人工智能生态，参与了数十项国家/行业/团体标准制定工作；联合创办瑞莱智慧公司，研发成果“新一代安全可靠可控的人工智能平台”曾入选乌镇峰会世界互联网领先科技成果。田天曾荣获“吴文俊人工智能优秀青年奖”、中华国际科学交流基金会“杰出工程师青年奖”，入选北京市科技新星计划、“海英”人才计划等，还担任上海市人工智能治理专委会委员。

3、可扩展监督：用AI帮人写复杂的程序

报告简介：人类如何可靠地使用 AI 系统来处理人类自身难以解决的复杂任务？作为一个案例研究，我们探讨了构建 AI 系统以辅助人类解决复杂编程问题。我们探索了一套技术：生成易于理解的测试用例，通过信息增益最大化通信效率，将复杂问题分解为更简单的部分，以及从真实的人类调试经验中学习。在Text-to-SQL 和竞赛编程任务中，我们的方法使非专家的表现与未辅助的专家相匹配；初步结果表明，AI 系统有时比人类更能预测什么可以辅助人类解决编程问题的能力。

钟瑞麒，加州大学伯克利分校计算机系博士生

钟瑞麒是加州大学伯克利分校计算机系博士生，在Anthropic兼职，师从Jacob Steinhardt和Dan Klein，专注于自然语言处理和人工智能对齐问题的研究。于2019年哥伦比亚大学本科毕业。

4、圆桌论坛：全球视角下的前沿AI安全（BAAI-CHAI joint panel）

圆桌讨论嘉宾：

Saad Siddiqui｜Safe Al Forum Al政策研究员（主持人）

Stuart Russell｜加州大学伯克利分校教授

姚期智｜图灵奖得主

薛澜｜清华大学资深文科教授，苏世民学院院长

张亚勤｜智源学术顾问委员，清华大学智能产业研究院(AIR)院长

Allan Dafoe｜Google DeepMind前沿安全与治理主任

Max Tegmark｜MIT人工智能与基础交互研究中心教授，未来生命研究所创始人

姚期智，图灵奖得主

图灵奖得主，中国科学院院士。世界著名计算机学家，2000年图灵奖得主，中国科学院院士，美国科学院外籍院士，美国科学与艺术学院外籍院士，国际密码协会会士，清华大学交叉信息研究院院长，"清华学堂计算机科学实验班""清华学堂人工智能班"首席教授，973项目首席科学家，香港中文大学博文讲座教授。

薛澜，清华大学资深文科教授，苏世民学院院长

清华大学文科资深教授，现任清华大学苏世民书院院长、公共管理学院学术委员会主任。研究领域包括：公共政策与公共管理、科技创新政策、危机管理及全球治理等，并在这些领域中多有著述。2000-2018年，他曾先后担任清华大学公共管理学院副院长、常务副院长、院长。2018年9月起担任清华大学苏世民书院院长，同时兼任清华大学人工智能国际治理研究院院长、清华大学中国科技政策研究中心主任、清华大学全球可持续发展研究院联席院长等。

张亚勤，智源学术顾问委员，清华大学智能产业研究院(AIR)院长

张亚勤博士是清华大学智能科学讲席教授，清华大学智能产业研究院院长，智源研究院学术顾问委员。他于2014年9月至2019年10月担任百度公司总裁。出任百度总裁前，张亚勤博士曾在微软公司工作16年，历任全球资深副总裁兼微软亚太研发集团主席、微软亚洲研究院院长兼首席科学家、微软全球副总裁和微软中国董事长。

Allan Dafoe，Google DeepMind前沿安全与治理主任

Allan Dafoe教授是Google DeepMind前沿安全与治理主任。他还是牛津大学AI治理中心的创始主任和董事会成员，以及合作AI基金会的创始人兼受托人。他在建立AI治理与安全领域方面发挥了关键作用，他的研究工作已发表在《牛津AI治理手册》中，并在ICML等国际领先会议上展示。

5、圆桌论坛：负责任扩展

圆桌讨论嘉宾：

Saad Siddiqui｜Safe Al Forum Al政策研究员（主持人）

黄文灏｜零一万物联合创始人

Chris Painter｜METR政策总监

黄文灏，零一万物联合创始人

零一万物联合创始人，负责预训练和多模态。北京大学博士，曾任北京智源人工智能研究院健康计算研究中心技术负责人，创新应用实验室负责人，微软亚洲研究院首席研究员。近年来，主要从事大语言模型、多模态模型研究工作，负责零一万物大模型yi-large，包括yi-34B在内的多个开源模型的训练和发布，在LMSYS，huggingface llm leaderboard上取得优异成绩。在此之前，对使用人工智能技术赋能企业智能、金融投资有丰富经验。研究成果在微软自然语言理解平台LUIS，Office，Teams，Bot Framework等产品中实际应用，实际用户超过30亿。在ICLR、AAAI、CVPR等人工智能领域发表论文五十余篇。

Chris Painter，METR政策总监

Chris Painter是模型评估与威胁研究（METR）的政策总监，该组织前身为ARC Evals。METR是一家研究型非营利组织，致力于评估尖端AI系统是否可能对社会构成灾难性风险。他们与西方的领先AI公司合作，评估其模型的危险能力。工作重点是评估AI系统的自主能力。METR也是最早提出负责任扩展政策概念的组织之一。

6、圆桌论坛：安全评估

圆桌讨论嘉宾：

Saad Siddiqui｜Safe Al Forum Al政策研究员（主持人）

Eric Tan｜新加坡信息通信媒体发展局Biztech集团，执行人工智能科学家

陈文弢｜中国信息通信研究院人工智能研究所安全与元宇宙部高级业务主管

Marius Hobbhahn｜阿波罗研究项目总监兼联合创始人

Eric Tan，新加坡信息通信媒体发展局Biztech集团，执行人工智能科学家

Eric Tan博士是新加坡信息通信媒体发展局（IMDA）Biztech 集团, 执行人工智能科学家。他在普及AI模型方面发挥了重要作用，特别专注于计算机视觉和自然语言处理。他在香港城市大学获得了计算机科学博士学位。IMDA与其公私合作倡议AI Verify Foundation一起，在开发AI风险分类和测试工具包方面处于领先地位。2024年6月，AI Verify推出了Moonshot项目，这是一个利用不同的开放数据集来测试生成式AI模型不同风险的测试平台。

陈文弢，中国信息通信研究院人工智能研究所安全与元宇宙部高级业务主管

陈文弢，中国信息通信研究院人工智能研究中心安全与元宇宙部高级业务主管，负责人工智能自身安全、衍生安全的研究、标准制定、评估测试等工作。具备长时间的安全领域工作经验，参与国家相关政策调研和研究，牵头或参与人工智能安全相关国家标准2份、行业标准4份、团体标准或联盟规范30余份。目前重点推动大模型安全基准测试、大模型赋能网络空间安全、生物特征识别系统安全等领域研究，探索人工智能系统和服务安全加固的方案。

Marius Hobbhahn，阿波罗研究项目总监兼联合创始人

Marius Hobbhahn是Apollo Research首席执行官兼联合创始人。这是一家位于伦敦的机构，专注于模型评估。Apollo开发了当大型语言模型在压力下时如何战略性地欺骗其主要用户的示范demo，并在英国AI安全峰会上展示。其评估和可解释性团队都从事技术研究，而其治理团队则专注于将其技术工作传达给政府和其他利益相关者。

关于AI安全瓶颈工作坊

本场AI安全瓶颈闭门工作坊将于2024年6月15日下午13:40-14:40于中关村展示中心阳山厅召开。工作坊的对象为人工智能安全领域的研究人员，研讨会将重点识别人工智能安全研究人员在进行人工智能安全研究时面临的关键挑战。参与者将有机会通过分组讨论的互动环节分享他们的观点。我们还将集思广益，为解决人工智能安全各个子领域的问题提出潜在解决方案。

这是一个宝贵的机会，让你与相关的同行建立联系，并分享你对如何改进人工智能安全研究生态系统的反馈意见。

请于6月13日星期四晚上11点（北京时间）前报名参加。

如果您通过审核参加研讨会，工作人员将于6月14日邀请您到一个单独的微信群中。

扫描下方二维码报名参加

即刻扫码注册，参与大会报名

本届大会采用线下与线上模式融合，报名通道已开启，欢迎扫码免费注册。由于线下席位有限，请尽早完成注册，组委会将根据注册次序审核，并在会前发送审核结果通知。公开环节将向注册用户全程线上直播。

大会合作、咨询、赞助欢迎联系：press@baai.ac.cn

大会官网 https://baai.org/l/baai2024

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家自动化/article/detail/1014824