引言:前几天写AI简史(链接)的时候,顺便整理了这份编年体的AI大事记,发给大家参考。1942年,美国科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在自己的短篇小说《Runaround(环舞)》中提出了影响深远的“机器人三定律”:机器人不得伤害人类,或坐视人类受到伤害;除非违背第一定律,否则机器人必须服从人类命令;除非违背第一或第二定律,否则机器人必须保护自己。后来,这篇小说被合入1950年出版的短篇科幻小说集《I,Robot(我,机器人)》中。1943年,美国神经生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts),基于人类大脑的神经网络,发表了《A logical calculus of ideas immanent in nervous activity(神经活动中内在思想的逻辑演算)》论文,提出了一个形式神经元的计算机模型,并将其取名为M-P(McCulloch&Pitts)模型。1949年,唐纳德·赫布(Donald O. Hebb)在自己的著作《The Organization of Behavior; a Neuropsychological Theory(行为的组织:一种神经心理学理论)》中,描述了突触可塑性的基本原理,对学习和记忆提供了生理学层面的新理解。赫布也凭此被誉为“神经心理学与神经网络之父”。1950年,阿兰·图灵在《Mind(心灵)》杂志上发表了重要论文《Computing Machinery and Intelligence(计算机器与智能)》,并提出了著名的图灵测试。
阿兰·图灵1950年,马文·明斯基(Marvin Minsky)和邓恩·埃德蒙(Dunn Edmund)构建了第一台神经网络计算机SNARC。1950年,克劳德·香农(Claude Shannon)发表论文《Programming a computer for playing chess(为下棋编程计算机)》”。香农认为,总有一天,计算机会击败世界冠军。这一年,他还发明了一种由机电继电器电路控制的可以走迷宫的机械老鼠——忒修斯(Theseus)。
弗兰克·罗森布拉特1957年,赫伯特·西蒙等人在“逻辑理论家”的基础上,又推出了通用问题解决器(General Problem Solver,GPS)。这是一个旨在模仿人类解决问题的程序。1957年,卡内基梅隆大学建立了世界上第一个人工智能研究实验室。1958年,约翰·麦卡锡正式发布了自己开发的人工智能编程语言——LISP(LIST PROCESSING,意思是”表处理”)。后来的很多知名AI程序,都是基于LISP开发的。
1959年,约翰·麦卡锡和马文·明斯基创立了麻省理工学院人工智能项目。1961年,莱昂纳德·莫里克(Leonard Merrick Uhr)和查尔斯·沃斯勒(Charles M Vossler)发表了题目为《A Pattern Recognition Program That Generates, Evaluates and Adjusts its Own Operators(生成、评估和调整其自身算子的模式识别程序)》的模式识别论文,描述了一种利用机器学习或自组织过程设计的模式识别程序的尝试。1963年,约翰·麦卡锡在斯坦福大学创立了人工智能实验室。1965年,英国数学家厄文·古德(Irving John Good)发表了一篇对人工智能未来可能对人类构成威胁的文章,可以算“AI威胁论”的先驱。1966年,美国麻省理工学院的约瑟夫·魏泽鲍姆(Joseph Weizenbaum),发明了世界上第一个聊天机器人——ELIZA。ELIZA 通过关键词匹配规则对输入进行分解,而后根据分解规则所对应的重组规则来生成回复,是现在Siri、小爱同学等问答交互工具的鼻祖。魏泽鲍姆(坐者)正在与ELIZA对话
2001年,布雷曼(Leo Breiman)和阿黛尔·卡特勒(Adele Cutler)提出随机森林(Random Forest)。2003年,约书亚·班吉欧(Yoshua Bengio)发表一篇基于人工神经网络打造自然语言模型的论文《A Neural Probabilistic Language Model(一种神经概率语言模型)》,提出了具有奠基意义的NNLM“神经网络语言模型”。他还提出了”词向量”的概念。2006年,多伦多大学的杰弗里·辛顿在Science期刊上,发表了重要的论文《Reducing the dimensionality of data with neural networks(用神经网络降低数据维数)》,提出深度信念网络(Deep Belief Networks,DBNs)。杰弗里·辛顿 2006年,在斯坦福任教的华裔科学家李飞飞发起创建了ImageNet项目,号召民众上传图像并标注图像内容。2009年,ImageNet正式发布,包括了1400万张图片数据,超过2万个类别,为全球AI研究(神经网络训练)提供了强大支持。李飞飞和ImageNet 2006年,谷歌公司推出了一种基于统计学习的语音识别技术,该技术被广泛应用于语音助手、智能家居等领域。2008年,谷歌在iPhone上发布了一款语音识别应用,开启了数字化语音助手(Siri、Alexa、Cortana)的浪潮。2011年10月,苹果推出语音助手Siri。
2017年10月18日,DeepMind团队公布AlphaGo Zero。从空白状态学起,只需3天就以100:0的战绩击败曾战胜柯洁的AlphaGo系统。2017年12月,Google机器翻译团队在行业顶级会议NIPS上,发表了重磅论文《Attention is all you need(你所需要的,就是注意力)》,提出只使用“自我注意力(Self Attention)”机制来训练自然语言模型——Transformer(转换器、变压器)。Transformer彻底改变了深度学习的发展方向。它不仅对序列到序列任务、机器翻译和其它自然语言处理任务产生了深远的影响,也为后来AIGC的崛起打下了坚实的基础。2018年5月,谷歌推出Google Duplex服务,允许人工智能助手通过电话预约。2018年6月,OpenAI发布了第一版的GPT系列模型——GPT-1。同时,他们还发表了论文《Improving Language Understanding by Generative Pre-training(通过生成式预训练改进语言理解)》。2019年和2020年,OpenAI接连发布了GPT-2和GPT-3。2018年10月,谷歌发布了有3亿参数的BERT(Bidirectional Encoder Representation from Transformers)模型,意思是“来自Transformers的双向编码表示”模型。2019年,DeepMind公司开发了阿尔法星际争霸(AlphaStar),这是一台专门用于玩星际争霸2游戏的人工智能系统。
2019年3月份,OpenAI正式宣布重组,成为一家”利润上限(caped-profit)”的公司。7月,重组后的OpenAI拿到了微软包括Azure云计算资源在内的10亿美金投资。微软将作为”首选合作伙伴”,今后可获得OpenAI技术成果的独家授权。2020年2月,微软推出Turind Natural Language Generatio(T-NLG),这是一种生成式语言模型,是当时最大的语言模型。2020年6月,OpenAl发布了GPT-3语言模型。该模型通过预先训练的算法生成文本,并完成人类几乎无法完成的语言任务。随后,OpenAI发表了论文《Language Models are Few-Shot Learner》,阐述了大模型的各种新能力,而最重要的就是小样本(few-shot)学习能力。2020年6月,论文《Denoising Diffusion Probabilistic Models(去噪扩散概率模型,DDPM)》发表。这篇论文第一次把2015年诞生的Diffusion”扩散模型”用在了图像生成上。不久之后,DDPM以及后续的Diffusion扩散模型就全面取代了GAN(生成式对抗网络),成为了AI绘画大模型的主流技术。2020年11月30日,DeepMind公司宣布其研制的人工智能系统AlphaFold2可以精准预测蛋白质的3D结构,即解决了“蛋白质折叠”问题,被认为是解决了生物领域50年来的重要难题,是人工智能的又一次巨大成功。2021年1月,OpenAl发布了可从文本生成图像的人工智能模型DALL-E。2021年1月11日,谷歌公司发表论文《Switch Transformers:Scaling to Trillion Parameter Models with Simple and Efficient Sparsity》,提出了最新语言模型—Switch Transformer。这个模型以高达1.6万亿的参数量,成为历史上首个万亿级语言模型。2021年2月,Open AI开源了新的深度学习模型CLIP(Contrastive Language-Image Pre-Training)。同时,OpenAI还发布了自己基于CLIP的AI绘画DALL-E 模型。2021年6月30日,OpenAI和GitHub联合发布了AI代码补全工具GitHub Copilot。Copilot的AI技术核心正是OpenAI的新模型CodeX(随后的8月份也对外发布了)。2021年5月,谷歌公司引入了Language Model for Dialoque Applications(LaMDA)。这是一个大型语言模型,用于在对话中生成类似人类的反应。
2021年10月,第一个开源的AI绘画大模型Disco-Diffusion诞生。2022年3月,OpenAI发布InstructGPT,同时发表论文《Training language models to follow instructions with human feedback(训练语言模型以遵循带有人类反馈的指令)》。2022年3月,AI绘画工具Midjourney问世,创始人是David Holz(戴维·霍尔兹)。2022年4月,OpenAI发布了AI绘画大模型DALL-E 2。2022年7月,DeepMind破解了几乎所有已知的蛋白质结构,其AlphaFold算法数据库里包含了2亿种已知蛋白质结构。2022年8月,Stability AI开源了Stable Diffusion绘画大模型的源代码。这是一款基于文本描述生成图像的文本到图像工具。2022年11月,OpenAI发布了基于GPT模型的人工智能对话应用服务——ChatGPT(也可以理解为GPT-3.5),彻底引爆了全世界。