IBM Watson由90台IBM服务器、360个计算机芯片组成,是一个有10台普通冰箱那么大的计算机系统。它拥有15TB内存、2880个处理器、每秒可进行80万亿次运算。现在已经逐步进化到四个批萨盒大小,性能也提升了240%。Watson存储了大量图书、新闻和电影剧本资料、辞海、文选和《世界图书百科全书》等数百万份资料。Watson是基于IBM“DeepQA”(深度开放域问答系统工程)技术开发的。DeepQA技术可以读取数百万页文本数据,利用深度自然语言处理技术产生候选答案,根据诸多不同尺度评估那些问题。IBM研发团队为Watson开发的100多套算法可以在3秒内解析问题,检索数百万条信息然后再筛选还原成“答案”输出成人类语言。
产业布局:IBM公司自2006年开始研发Watson,并在2011年2月的《危险地带》(Jeopardy!)智力抢答游戏中一战成名。一开始IBM想把Watson打造为超级Siri,主要还是卖硬件。但是后来转型为认知商业计算平台,2011年8月开始应用于医疗领域。例如在肿瘤治疗方面,Watson已收录了肿瘤学研究领域的42种医学期刊、临床试验的60多万条医疗证据和200万页文本资料。Watson能够在几秒之内筛选数十年癌症治疗历史中的150万份患者记录,包括病历和患者治疗结果,并为医生提供可供选择的循证治疗方案。目前癌症治疗领域排名前三的医院都在运行Watson,并在今年8月正式进入中国。
2012年3月,Watson则首次应用于金融领域,花旗集团成为了首位金融客户。Watson帮助花旗分析用户的需求,处理金融、经济和用户数据以及实现数字银行的个性化,并帮助金融机构找出行业专家可能忽略的风险、收益以及客户需求。
硬件:人脑模拟芯片SyNAPSE
SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,即“自适应塑料可伸缩电子神经形态系统”)芯片,含有100万个可编程神经元、2.56亿个可编程突触,每消耗一焦耳的能量,可进行460亿突触运算。在进行生物实时运算时,这款芯片的功耗低至70毫瓦(mW),比现代微处理器功耗低数个数量级。
8 个回复
匿名用户
我进入这个行业已经有十多年了:博士期间,我做的是语音是别的研究,毕业开始又到MSRA接着干这个。虽然我们的两任院长——李开复老师和洪小文老师都是语音研究出身,却丝毫不能改变当年这一项目在全院最鸡肋的地位。因为在当年,各种各样的人工智能应用能真刀真枪上阵的并不多。更别提要是向互联网界提起自己是做“人工智能”的,那简直就像在两会会场上上偷看了毛片那样无地自容。实际上,那个时期,正是人工智能发展的第二落。
以史为鉴,可以知兴衰。为了探讨人工智能的发展前景,我们简单回顾一下人工智能前面发展的三起两落。
一、六十多年前的达特茅斯会议,提出了“Artifitial Intelligence”的课题,目的是让逐渐成熟的计算机能够代替人类解决一些感知、认知乃至决策的问题。这样一个课题是如此令人神往,也迅速吸引了大量学者的眼球,相关的研究也如火如荼地开展了起来。是为第一起。
二、初,学者们解决人工智能问题的思路,是以人为师,通过专家编制规则的方法,教机器下棋、认字乃至语音识别。在今天看来,这样的方法是完全南辕北辙的——人类的视听器官虽然很发达,却并没有能力总结提炼其中的规律。于是,人工智能的美好憧憬中迎来了残酷的现实,学者们发现解决问题是如此遥远,围观群众也一度认为人工智能的学者都是骗子。是为第一落。
三、既然靠人指导不行,那就要祭出“实事求是”的法宝,从数据里统计规律。在这样数据+统计的方法论下,诸如人脸识别、手写识别等一些较为简单的问题取得了重大进展,而在当时最困难的问题——大词表连续语音识别上,统计方法也是史无前例地造就了实验室中“基本可用”的系统。到此时,我们感觉找到了解决人工智能问题的基本思路。是为第二起。
四、数据+统计模型的方法盛行以后,也很快遇到了瓶颈:数据量的提升并不总能带来识别率的提高。当然,我们很早就知道“深度模型”比“浅层模型”学习数据的能力强,无奈这种模型的计算代价极高,只能望洋兴叹。拿语音识别为例,在“基本可用”到“实用”之间的鸿沟,十几年都没有跨过去,于是大家又转向悲观,觉得人工智能还只是个梦。是为第二落。
五、第二落以来,继续坚持在“深度神经网络”这条战线上的学者很少,因为做这个是拿不到funding的。其中有一位老前辈Jeffrey Hinton,和他的学生Alex一起,发现用GPU算神经网络,能大幅提高速度,于是这种模型居然可能实用了。一旦实用,深度模型可以疯狂吸收数据的优势就发挥出来了,于是在语音识别、图像识别等领域带来了飞跃式的进展。是为第三起。
当然,工业界的看到的这第三起,比我们上面轻描淡写提到的内容要波澜壮阔得多。不过,不要太在意,因为各路大佬不论过去是做黑产、卖假货还搞劫持的,都摇身一变成了人工智能的忠实拥趸和业界先驱——虽然他们的数学也就是初中肄业水平。去年,当我听到某此类上市公司老板歇斯底里地在财报中喊出要投入数千万美元搞人工智能时,不由心生感慨:修脚的可以挂妙手回春的锦旗,但千万别说自己是做精准医疗的!
虽然人工智能的第三起确实有了质的发展,但考虑到这些沉渣泛起的为人工智能从业者,我觉得第三落还是会来到,只不过并非对行业本身的怀疑,而是自我净化罢了。
而人工智能的行业发展趋势,由于大规模数据+大规模算力的基本方法论已经成熟,今后的发展路径是十分清楚的:在那些数据储备充分、商业价值清晰的场景,人工智能会迅猛发展,投身于这样的行业中期发展会非常好;而医疗、教育这类领域,由于电子化数据的整理与积累尚需时日,可以需要一个较为漫长的发展过程。
至于人工智能非常核心的问题,也就是关于“认知”的问题,我认为到目前为止还没有任何方法论上的突破,也更谈不上解决,不过扯到这个话题就太大了,我们找其他机会再聊。
匿名用户
人工智能的技术应用主要是在以下几个方面:
自然语言处理(包括语音和语义识别、自动翻译)、计算机视觉(图像识别)、知识表示、自动推理(包括规划和决策)、机器学习和机器人学。按照技术类别来分,可以分成感知输入和学习与训练两种。计算机通过语音识别、图像识别、读取知识库、人机交互、物理传感等方式,获得音视频的感知输入,然后从大数据中进行学习,得到一个有决策和创造能力的大脑。
从上世纪八九十年代的PC时代,进入到互联网时代后,给我们带来的是信息的爆炸和信息载体的去中心化。而网络信息获取渠道从PC转移到移动端后,万物互联成为趋势,但技术的限制导致移动互联网难以催生出更多的新应用和商业模式。而如今,人工智能已经成为这个时代最激动人心、最值得期待的技术,将成为未来10年乃至更长时间内IT产业发展的焦点。
人工智能概念其实在上世纪80年代就已经炒得火热,但是软硬件两方面的技术局限使其沉迷了很长一段时间。而现在,大规模并行计算、大数据、深度学习算法和人脑芯片这四大催化剂的发展,以及计算成本的降低,使得人工智能技术突飞猛进。
一、驱动人工智能发展的先决条件
物联网——物联网提供了计算机感知和控制物理世界的接口和手段,它们负责采集数据、记忆、分析、传送数据、交互、控制等等。摄像头和相机记录了关于世界的大量的图像和视频,麦克风记录语音和声音,各种传感器将它们感受到的世界数字化等等。这些传感器,就如同人类的五官,是智能系统的数据输入,感知世界的方式。而大量智能设备的出现则进一步加速了传感器领域的繁荣,这些延伸向真实世界各个领域的触角是机器感知世界的基础,而感知则是智能实现的前提之一。
大规模并行计算——人脑中有数百至上千亿个神经元,每个神经元都通过成千上万个突触与其他神经元相连,形成了非常复杂和庞大的神经网络,以分布和并发的方式传递信号。这种超大规模的并行计算结构使得人脑远超计算机,成为世界上最强大的信息处理系统。近年来,基于GPU(图形处理器)的大规模并行计算异军突起,拥有远超CPU的并行计算能力。
从处理器的计算方式来看,CPU计算使用基于x86指令集的串行架构,适合尽可能快的完成一个计算任务。而GPU从诞生之初是为了处理3D图像中的上百万个像素图像,拥有更多的内核去处理更多的计算任务。因此GPU天然具备了执行大规模并行计算的能力。云计算的出现、GPU的大规模应用使得集中化的数据计算处理能力变得前所未有的强大。
大数据——根据统计,2015年全球产生的数据总量达到了十年前的20多倍,海量的数据为人工智能的学习和发展提供了非常好的基础。机器学习是人工智能的基础,而数据和以往的经验,就是人工智能学习的书本,以此优化计算机的处理性能。
深度学习算法——最后,这是人工智能进步最重要的条件,也是当前人工智能最先进、应用最广泛的核心技术,深度神经网络(深度学习算法)。2006年,Geoffrey Hinton教授发表的论文《A fast learning algorithm for deep belief nets》。他在此文中提出的深层神经网络逐层训练的高效算法,让当时计算条件下的神经网络模型训练成为了可能,同时通过深度神经网络模型得到的优异的实验结果让人们开始重新关注人工智能。之后,深度神经网络模型成为了人工智能领域的重要前沿阵地,深度学习算法模型也经历了一个快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各种新的算法模型被不断提出,而其中卷积神经网络(Convolutional Neural Network,CNN)更是成为图像识别最炙手可热的算法模型。
二、IT巨头在人工智能上的投入
技术的进步使得人工智能的发展在近几年显著加速,IT巨头在人工智能上的投入明显增大,一方面网罗顶尖人工智能的人才,另一方面加大投资力度频频并购,昭示着人工智能的春天已经到来。
科技企业巨头近几年在人工智能领域密集布局,巨头们通过巨额的研发投入、组织架构的调整、持续的并购和大量的开源项目,正在打造各自的人工智能生态圈。在未来,人工智能将不再是尖端技术,而会成为随处可见的基础设施。对于人工智能初创企业而言,既要寻找与巨头的合作契合点,又要避开正面冲突。
IBM
IBM Watson由90台IBM服务器、360个计算机芯片组成,是一个有10台普通冰箱那么大的计算机系统。它拥有15TB内存、2880个处理器、每秒可进行80万亿次运算。现在已经逐步进化到四个批萨盒大小,性能也提升了240%。Watson存储了大量图书、新闻和电影剧本资料、辞海、文选和《世界图书百科全书》等数百万份资料。Watson是基于IBM“DeepQA”(深度开放域问答系统工程)技术开发的。DeepQA技术可以读取数百万页文本数据,利用深度自然语言处理技术产生候选答案,根据诸多不同尺度评估那些问题。IBM研发团队为Watson开发的100多套算法可以在3秒内解析问题,检索数百万条信息然后再筛选还原成“答案”输出成人类语言。
产业布局:IBM公司自2006年开始研发Watson,并在2011年2月的《危险地带》(Jeopardy!)智力抢答游戏中一战成名。一开始IBM想把Watson打造为超级Siri,主要还是卖硬件。但是后来转型为认知商业计算平台,2011年8月开始应用于医疗领域。例如在肿瘤治疗方面,Watson已收录了肿瘤学研究领域的42种医学期刊、临床试验的60多万条医疗证据和200万页文本资料。Watson能够在几秒之内筛选数十年癌症治疗历史中的150万份患者记录,包括病历和患者治疗结果,并为医生提供可供选择的循证治疗方案。目前癌症治疗领域排名前三的医院都在运行Watson,并在今年8月正式进入中国。
2012年3月,Watson则首次应用于金融领域,花旗集团成为了首位金融客户。Watson帮助花旗分析用户的需求,处理金融、经济和用户数据以及实现数字银行的个性化,并帮助金融机构找出行业专家可能忽略的风险、收益以及客户需求。
硬件:人脑模拟芯片SyNAPSE
SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,即“自适应塑料可伸缩电子神经形态系统”)芯片,含有100万个可编程神经元、2.56亿个可编程突触,每消耗一焦耳的能量,可进行460亿突触运算。在进行生物实时运算时,这款芯片的功耗低至70毫瓦(mW),比现代微处理器功耗低数个数量级。
Google
谷歌在一系列人工智能相关的收购中获益。2013年3月,谷歌以重金收购DNNresearch的方式请到了深度学习技术的发明者Geoffrey Hinton教授。2014年年初,谷歌以4亿美元的架构收购了深度学习算法公司——DeepMind,也就是推出AlphaGo项目的公司。该公司创始人哈萨比斯是一位横跨游戏开发、神经科学和人工智能等多领域的天才人物。
云平台:TensorFlow数据库,机器学习的核心是让机器读懂数据并基于数据做出决策。当数据规模庞大而又非常复杂时,机器学习可以让机器变得更聪明。TensorFlow在数据输入和输出方面都有惊人的精度和速度,它被确切地定义为人工智能工具。
产业布局:谷歌无人驾驶汽车、基于Android智能手机的各种app应用与插件、智能家居(以收购的NEST为基础)、VR生态、图像识别(以收购的Jetpac为基础)。
Facebook
2013年12月,Facebook成立了人工智能实验室,聘请了卷积神经网络最负盛名的研究者、纽约大学终身教授Yann LeCun为负责人。Yann LeCun是纽约大学终身教授,是卷积神经网络领域的重要推动者,而该技术的最主要应用就是图像识别的自然语言处理,这与Facebook的需求和已经积累的数据类型非常匹配。在Yann LeCun的帮助下,2014年Facebook的DeepFace技术在同行评审报告中被高度肯定,其脸部识别率的准确度达到97%。而他领导的Facebook人工实验室研发的算法已经可以分析用户在Facebook的全部行为,从而为用户挑选出其感兴趣的内容。
AI技术:视觉DeepFace技术、语音识别(收购Mobile technologies)、自然语义(收购Wit.AI)、神经网络训练+机器学习
云平台:开发者平台Parse、Torch开源深度学习模块
硬件: Big Sur(基于GPU的用于训练神经网络的硬件系统,开源)
产业布局:语音助手Moneypenny、VR生态(收购Oculus Rift、Sourroud360全景摄像机促进内容发展)
百度
2014年5月,被称为“谷歌大脑之父”的AndrewNG(吴恩达)加盟百度,担任首席科学家,负责百度“百度大脑”计划。大数据是人工智能的基础,而作为天然的大数据企业,百度拥有强大的数据获取能力和数据挖掘能力。2014年7月14日,百度凭借自身的大数据技术14场世界杯比赛的结果预测中取得全中的成绩,击败了微软和高盛。2014年9月,百度正式发布整合了大数据、百度地图LBS的智慧商业平台,旨在更好在移动互联网时代为各行业提供大数据解决方案。
AI技术:语音识别Deep Speech、视觉识别“智能读图”、自然语言与智能语义、自动驾驶、深度学习
解决方案:基于智能手机的语音服务系统(度秘)
开发者云平台: 百度云
产业布局:汽车领域无人驾驶、基于智能手机的各种app应用与插件。
Microsoft
AI技术:语音、视觉、自然语言、分布式机器学习
云平台:Microsoft Azure(存储、计算、数据库、live、媒体功能)、分布式机器学习工具包DMTK(自然语言处理,推荐引擎,模式识别,计算机视觉以及预测建模等)、人工智能平台Project Malmo
产业布局:语言助手(微软小冰、Cortana小娜、Tay)、VR(Hololens全息眼镜)
Apple
AI技术:自然语言(收购Vocal IQ)、收购可视化地图MapsenseGPS公司 Coherent Navigation
产业布局:汽车领域无人驾驶、SIRI语音助手
Amazon
云平台:Amazon Web Services(存储、计算、模式识别和预测,其中视频识别API 收购Orbeus)
阿里
云平台(阿里云IaaS,可视化人工智能平台DTPAI)
产业布局 :智能家具、物联网
腾讯
AI技术:视觉、智能计算与搜索实验室
产业布局:智能硬件
三、人工智能的生态
科技巨头围绕人工智能产业,开展了大量的收购;标的包括人工智能初创企业(算法)、大数据公司(算法或数据)和芯片研发公司(计算能力)。截至至2016年7月底,谷歌在其中的收购次数最多达到了13次。巨头们在人工智能领域的并购呈现两个特点:一是连续多次买入,二是标的规模较小。从2013年开始,科技巨头大多加大了对人工智能的自主研发,同时通过不断开源,试图建立自己的人工智能生态系统,开源力度不断增加。比如Google 开源TensorFlow 后,Facebook、百度和微软等都加快了开源脚步。最早走向人工智能工具开源的是社交巨头Facebook,于去年1月宣布开源多款深度学习人工智能工具。而谷歌、IBM和微软几乎于去年11通同时宣布开源。谷歌发布了新的机器学习平台TensorFlow,所有用户都能够利用这一强大的机器学习平台进行研究,被称为人工智能界的Android。IBM则宣布通过Apache软件基金会免费为外部程序员提供System ML人工智能工具的源代码。微软则开源了分布式机器学习工具包DMTK,能够在较小的集群上以较高的效率完成大规模数据模型的训练,在今年7月微软又推出了开源的Project Malmo项目,用于人工智能的训练。
人工智能已经逐渐建立起自己的生态格局,由于科技巨头的一系列布局和各种平台的开源,人工智能的准入门槛逐渐降低。未来几年之内,专业领域的智能化应用将是人工智能主要的发展方向。无论是在专业还是通用领域,人工智能的企业布局都将围绕着基础层、技术层和应用层三个层次的基本架构。
基础层就如同大树的根基,提供基础资源支持,由运算平台和数据工厂组成。中间层为技术层,通过不同类型的算法建立模型,形成有效的可供应用的技术,如同树干连接底层的数据层和顶层的应用层。应用层利用输出的人工智能技术为用户提供具体的服务和产品。
位于基础层的企业一般是典型的IT巨头,拥有芯片级的计算能力,通过部署大规模GPU和CPU并行计算构成云计算平台,解决人工智能所需要的超强运算能力和存储需求,初创公司无法进入。技术层的算法可以拉开人工智能公司和非人工智能公司的差距,但是巨头的逐步开源使算法的重要程度不断降低。应用层是人工智能初创企业最好的机遇,可以选择合理的商业模式,避开巨头的航路,更容易实现成功。
匿名用户
1. ===功能===
人工智能现在已经能实现很多功能了,比如
语音识别——李开复博士当年做的工作奠定了很多当今识别系统的基础。这里忍不住说一下,Siri本身的技术并没有特别大的亮点,真正nb的是它的模式(语音识别直接与搜索引擎结合在一起,产品体验做得好。而且关键是这样的模式能采集到更多数据,使得系统的精度越来越高)
自然语言理解——目前看到的最强的结果应该是IBM Watson。但其实我们现在用的搜索引擎、中文输入法、机器翻译(虽然其实还不怎么work)都和自然语言理解相关。这块儿不是我的专业,请 @段维斯 同学补充。
数据挖掘——随着近年数据量的疯狂增长,数据挖掘也有了长足进步。最具有代表性的是前几年著名的Netflix challenge(Netflix公司公开了自己的用户评分数据,让研究者根据这些数据对用户没看过的电影预测评分,谁先比现有系统好10%,谁就能赢100万美元)最后这一比赛成绩较好的队伍,并非是单一的某个特别nb的算法能给出精确的结果,而是把大量刻画了不同方面的模型混合在一起,进行最终的预测。
计算机视觉——目前越来越多的领域跟视觉有关。大家可能一开始想到的都是自动驾驶。虽然大家都在说googleX的无人车, 但实际上现在无论是商业上,还是技术整合上最成功的算法是Mobile Eye的辅助驾驶系统。这个公司也是目前computer vision领域最挣钱的公司。
从实现新功能方面说,视觉的发展的趋势主要有两方面,A) 集成更多的模块,从问题的各种不同方面,解决同一个问题(比如Mobile Eye,就同时使用了数十种方法,放到一起最终作出决策) B) 使用新的信息,解决一个原来很难的问题。这方面最好的例子是M$的Kinect,这个产品最让人拍案叫绝的就是那个红外pattern投影仪。
2. ===理论基础===
这里说的是数学理论,是为实现功能解决问题而存在的。与人类的智能的联系在下一节说。从这个角度,我们已经有了很多强有力的数学工具,从高斯时代的最小二乘法,到现在比较火的凸优化,其实我们解决绝大多数智能问题的套路,都可以从某种意义上转换成一个优化问题。真正限制我们解这个优化问题的困难有以下三个:
计算复杂度——能保证完美解的算法大都是NP-hard的。如何能让一个系统在当前的硬件下“跑起来”,就需要在很多细节取巧,这是很多learning paper的核心冲突。
模型假设——所有模型都要基于一些假设,比如说,无人车会假设周围的汽车加速度有一个上限(至少不会瞬间移动吧,否则怎么闪避)绝大多数假设都不能保证绝对正确,我们只是制定那些在大多数时候合理的假设,然后基于这些假设建模(比如,在语音识别里,我们是否要假设存在背景噪声呢?如果有背景噪声,这个噪声应该符合什么特点呢?这时候无论你怎么定标准,总能找出“反例”)
数据基础——任何学习过程都需要数据的支持,无论是人类学说话学写字,还是计算机学习汽车驾驶。但是就数据采集本身来说,成功的案例并不多。大概这个世界上最强的数据采集就是google了吧。每次你搜索一个关键词,然后点进去,google就自动记录了你的行为,然后以此数据来训练自己的算法。
匿名用户
我相信商业价值是很大的。计算机的计算性能发展到今天,常规的商业应用,比如财务报表,字处理,网页服务等已经完全够用了。那么必然需要新的增长点。说的直白一点就是旧的程序已经足够快了。如果没有新程序和新功能,就没有人愿意升级软件和硬件系统了。那么下一步的新功能只能往智能化的方向发展。IBM花了很多钱,开发了一个电视节目里玩游戏的Watson。当然不是因为IBM老板特别爱看这个节目。主要原因是展示他们的技术,从而推动新一代智能产品的销售。这一系列的产品主要面向大医院,相当于一套自动回答问题的医学百科全书。Google花大力气开发了自动驾驶汽车。Apple推出了一个相当不完善的Siri。他们都看到了智能机器蕴含的巨大商业潜力,而此类机器的大规模应用将会带来革命性的效果。第二个问题是多久才能实现类似于人类的功能。目前能够达到甚至超越人类的人工智能,都是专门设计来解决一个特定问题的。Deep Blue是专门下棋的。Watson和Google专门做信息检索。这都是人考虑到这些问题的特点从而专门设计的程序。而人类可以自我学习而解决各种不同的问题。如果把人类作为一个标杆,人工智能的研究还只是刚刚起步而已。要达到人类的能力,至少需要几十年甚至上百年的时间。当然,预测未来从来都是一件很不靠谱的事情。
匿名用户
对于阿尔法狗横扫人类围棋高手的,我认为比赛对人类棋手存在不公,因为阿尔法狗战前打谱的次数已达到恐怕的程度,让其对人类棋手对自己都相当熟悉了,做到了知己知彼。
而人类棋手对阿尔法狗几乎一无所知。
一方知己知彼,另一方只知已而不知彼,被对方摸透而自己却对对方一无所知,比赛一开始就陷人类棋手于不公平之中。
建议谷歌放开让人类棋手频繁来挑战阿尔法狗,好让人类棋手能不断地熟悉了解阿尔法狗,当人类棋手能做到基本了阿尔法狗的特点后,就可以根据阿尔法狗的特点作出相应的策略(此前的比赛中,由于人类棋手对其一无所知,自然谈不上有什么好的应对策略)相信人类棋手就能战胜它,因为不竟人类顶尖棋手与其“差距”很少。
二,多年前我就提出过:日本经济迷失的原因是下错注,对于未来新经济增长方向,美国人押注在信息高速公路上(即我们正在用的互联网),而日本则押注在机器人上。
结果大家看到了。
虽然日本人为此奋斗了数十年,但机器人到今时今日还远未见到开花结果的一天,可见机器人研发之困难、发展速度之缓慢(绝对是蜗牛速度)。
再者,富士康的郭大老板几年前曾高度宣称要买一百万个机器人(包括机械手)来替代人手,然而,前不久有报导指经数年发展,今时今日富士康才买了四万多个机器人。
为什么只完成当初计划的4%?富士康方面没说明,相信是郭大老板在实践中才发现:用机器人还不如用人。
综上所述,无论是人工智能还是机器人,其发展速度仍将如以往一样慢如蜗牛,除非出现意外,但凡意外概率自然少。我以个人并不看好人工智能或机器人发展。207-8-21
——————————————————————————
对于知友
@刘少凡
提出的一些问题,这里再简答一下。
NBA每年都会有不少球员(指的是新秀或虽在NBA打球多年但仍未冒头的)打出惊艳的数据,但由些进身成巨星的只是少数,为什么呢?
原因不外乎是各球队各球员对这些新冒头的球员不熟悉、研究少、缺乏针对性的战术按排。
现实他们突然打出巨星般的数据,对胜负影响大,于是各球员众球员就必须必然对其重视起来;随着对这些新冒头球员的研究越来越深入,各种针对性的策略与战术多起来了,这些新冒头的球员就没有了别人对其不熟悉的便宜,他们大多数回归平凡,只有少数能抗过这关进身成为巨星。
虽然有少部分人能成功抗过这关成为巨星,但在被研究以及越来越多的针对性策略与战术下,他们的表现与作用也因此会下降!
如库里,骑士对其的研究很深入、针对性的策略与战术也很对头。
库里进攻能力很强,尤其是三分投,各种不讲理的三分投根本没法防,但库里的防守是弱点。
既然库里三分攻根本没法防,且防守是其弱点,所谓骑士的进攻就放在库里这点上,其战略目的就是:让库里的精力体力更多地消耗在防守上,进而大大地减少库里投入在进攻上的精力与体力;同时间放大库里弱点来降低库里的自信心。
进攻上的精力与体力投入大幅减少、自信心又被打击,所以过去两年库里对阵骑士时的表现大打折扣。
这种事物多的很。
所以,在大家未对阿尔法狗摸熟摸透并拿出对对头的针对性策略战术之前,不能说阿尔法狗如何如何的。
就算其能挺过这关,其优势也必将削弱。
对于漏洞的意义,往小处说,阿尔法狗何偿不是也利用人类的漏洞(会犯错、常常犯错)来取胜(棋界主流认识)。
往大处说,现在像特斯拉的马斯克等人认为未来会对人类带来巨大的危险,现在对于作出深入的研究,把其摸透摸熟,并由此作出针对性的战略战术,属于未雨稠谬之举。
对于一些人工智能界人士说的“人工智能的深度学习能力”,个人还是抱有怀疑。
包括阿尔法狗在内的围棋人工智能有不少,其能力进步不像人类那样是以战带训来得到的,而且消声匿迹一段时间再出来,棋力才增长,这好令人怀疑其棋力的增长是通过软、硬升级与及棋谱资料库的进一步丰富而达到的!
建议阿尔法狗等围棋人工智能放在一个中立的地方,断开互联网,并让相关人工监督,让它们互战、自战、与人类棋手战,经过、半年、一年的时间后,它们确实有较明显的进步,才能说明其真正拥有深度的学习能力。
否则,他们就是胡扯。
——————————————————————————
由于包括机器人、深度学习等人工智能的一窝风现象仍旧所以我打算再多说几句。
前几天工信部某位副部长在相关大会上公布:中国2016年年产机器人(包括机器臂)9万台,中国已是全球最大的机器人应用市场(占1/3)。所以鸿海的郭大老板拥有4万多台机器人起码是全球数一数二的应用者了,其一举一动是机器人应用效果好坏的主要观察标的。
假鸿海机器人应用效果良好,加上老郭正急于为其代工帝国转型(先是竞购得到夏普,最近又忙着竞购东芝芯片业务,还向川普承诺在美投资100亿美元),他不但会加大机器人釆购,还会向机器人产业方向转型(他的代工帝国是其转型机器人行业后的销售保证,不愁销路)。
但一样都没发生,这说明鸿海机器人实际应用效果差,郭大老板既不满意,更不看好机器人行业的未来!
一个既被全球数一数二的应用者不满意、更不被看好的行业,在中国却一再被吹上天,不能不让人一再深思。————————————————
现在网上普遍都是关于人工智能正面的、甚至就是营销性的信息,负面的、但客观的信息就很少,故我在此将提供业内大伽的一些看法来平衡一下。
如李国杰院士在《AI创业光靠算法走不远,警惕命运魔咒》一文中就写到“2004年,美国ADARRA开始搞无人车测试,结果所以的车都翻了,200英里的比赛没有车跑过10英里就翻了。之后釆用了神经网络”。“微软机器人网上聊天,被年轻人胡乱教一气,最后机器就认为911是假的,希特勒是好的”。“人工智能这几年取得很大的突破但还是没有解决一些在人看来很基础的问题。”“比如你教小孩认知事物,可能不出10、20张图片就能让他知道这是马、这是车,但对于机器人还做不到,可能机器人需要上百万张图片”(注,微软亚太研究院院长洪小文也说过类似的说法)。
而洪小文在《以科学的方式赤裸裸解剖AI——人的智慧在那里?》一文中也写到,“人类智慧应该是一个金字塔结构”。“最底层的叫计算和记忆”。“阿法狗打赢其实根本不证明AI有什么了不起”。“阿法狗基本做模式识别……把下棋变成一个模式识别”。“阿法狗打败人类根本和创造力一点关系都没有”。“创造力绝对不是一个大数据的问题,绝对是小数据的问题”。
个个认为,更准确的说法是:创造基本是微数据的问题!
就如洪小文提到的像爱恩斯坦等人,他们提出那些猜想、理论等时,包括他们自己在内的人类对相关事物认知甚少甚至极少,到后来才被大量的信息大量的数据来证实!
人类的理论、发现、发明等等,都是先由个别人在微数据的情况下通过人类自身的创造人创造出来的;而大数据恰恰相反是被用来验证那些理论、发现、发明等是否成立。
就我个人而言,那些原创的也是先基于微数据,等到灵感出现后,再找大数据来验证一下否成立。——————————————————————
而且,到目前为止,阿法狗每新换一种算法、新换一种版本,换了新算法的阿法狗都能完成对旧算法旧版本的展压!
况且,到目前为止,所有旧算法旧版本的阿法狗,自公开后、并经过较长时间的“深度学习”后,都没能让大家见识到阿法狗经较长时间的“深度学习”(指公开与大家见面或对弈之后的“深度学习”)后能有所进步!基本就是原地踏步。
所以,阿法狗之所以一代比一代强,根本就是因为换了一种更快更准确的新算法而已,所谓的“深度学习”,完全就是为吸引眼球的营销手段。
匿名用户
一、人工智能企业融资解读
2017年短短不到三个月的时间,国内AI获投项目已有36个,千万级别融资占据半数以上。其中不乏多家融资过亿企业。
2017人工智能融资阶段对比
如上图所示,A轮及以上融资比例较高,占总融资笔数的58%,这些人工智能初创公司的主要发展方向也各不相同:新智元属于人工智能资讯平台;深醒科技专注人脸识别技术;推想科技则属人工智能医疗影像诊断领域。
2016人工智能融资阶段对比
2016年,国内人工智能企业约284家获投,获投企业中,A轮(Pre-A、A、A+)企业占比最高,111家企业获得融资,汇顶科技完成IPO上市,募资8.74亿人民币。
目前我国人工智能企业在图像和语音识别两个类别企业占比相对较高,人脸识别技术水平处于领先地位,各创业公司也从一开始专注研究逐步发展至探索合适的商业模式,从“互联网+”向“人工智能+”过渡。
人工智能爆发的两个重要时间节点
2011年基于深度学习的人工智能技术陆续在微软、Facebook、百度等顶尖互联网公司获得广泛应用,微软和百度使用的FPGA,基于海量数据训练出的深度学习系统能够完成更快、更精准的判断,同年苹果公司发布语音助手Siri 。
2016年4月,谷歌(Google)首席执行官桑德尔·皮蔡(Sundar Pichai)在一封致股东信中,把机器学习誉为人工智能和计算的真正未来。这一切似乎印证了2011年和2016年AI崛起和爆发式增长的原因所在,行业巨头的全面布局同时也带动了国内AI创业型公司的快速发展。
二、人工智能行业图谱
据企名片大数据服务平台首份AI行业图谱显示:截至2017年3月8日,共有1083家AI企业,这些人工智能公司应用技术多为机器学习、计算机视觉、自然语言处理、数据分析等。其中有代表性的101家公司大致可分成以下十大类别:
人工智能硬件支持:此类公司主要进行深度学习芯片的研发,该领域的玩家除了传统芯片巨头如英特尔、高通,和大型互联网公司如谷歌、FaceBook,国内也涌现了一批创业型公司,如:地平线、深鉴科技等。
人工智能技术平台:此类公司主要专注于“机器学习”、“模式识别”和“人机交互”三项与人工智能应用密切相关的技术,所涉及的领域包括深度学习开源平台、机器学习算法、计算机视觉、自然语言处理、生物识别、机器视觉、情绪识别和推荐引擎8类。随着高质量的数据集逐渐成为制约人工智能发展的主要因素,各大公司纷纷开源了自己深度学习框架,比较常用的如谷歌的TensorFlow、百度深度学习平台PaddlePaddle。巨头们的这一举动进一步降低了人工智能技术的开发门槛,大大加速了人工智能的发展。
人工智能技术平台·自然语言处理:此类公司构建的算法能够处理输入的自然语言,并将其转化为可理解的表达。主要包括语音识别、语义分析和语音交互。其中,语音交互类的公司往往需要同时具有语音识别和语义分析的技术,典型的如科大讯飞、思必驰等。
人工智能技术平台·计算机视觉:此类公司应用技术主要是图像识别、图像处理和分析, 从图像和视频中提取信息、识别物体;应用案例中包括使用图像处理技术进行面部识别和让用户通过拍照搜索商品的软件,如旷视科技、码隆科技、博云视觉等。
人工智能技术平台·生物识别:通过计算机与生物传感器等高科技手段结合,利用人体固有的生理特性(如指纹、脸象、虹膜等)和行为特征来进行个人身份的鉴定等。
人工智能通用应用:此类公司主要将人工智能技术应用于通用领域。典型的就是个人私人助理、Chatbot、机器翻译这类公司。
人工智能行业应用:此类公司主要将人工智能技术应用于具体行业。目前在金融、汽车交通、医疗、法律、教育等行业有了初步应用,特别是在智能驾驶领域,关注度持续增高。
无人机:利用无线电遥控设备和自备的程序控制装置操纵不载人飞机,如,可以进行智能化跟踪拍摄的无人机。
硬件机器人:可以自动执行工作的机器装置。它既可以接受人类指挥,也可以根据以人工智能技术制定的原则行动。协助或取代人类的工作,例如生产业、建筑业,或是危险的工作。工业机器人的发展时间最长,随着技术的发展,一些创业公司也开始进军工业机器人领域,如李群自动化。家用、商用、医疗、教育等垂直领域的机器人创企也开始陆续出现。
人工智能媒体:作为大众和从业人员了解人工智能发展状况及趋势的主要途径之一,为人工智能行业的发展起到了积极的推动作用,图谱中收录国内发展发展较好的几家,如AI100、新智元、人工智能学家等。
由以上图谱综合分析可以看出,当前人工智能产业链具有技术驱动型特征,人才成为制约人工智能企业发展的重要因素。但是以需求、解决实际问题为出发点的行业应用却是能将技术,内容和硬件结合的商业闭环,目前应用类企业获投占比最高为67%。
IDG资本合伙人牛奎光表示:“人工智能是一个平台级的技术方向,在过去的几十年中持续发展,近些年伴随着互联网和智能终端的发展,人工智能的数据、计算能力、人才储备都得到了极大的提高,发展速度和关注度进一步升级,但技术永远都是为应用服务的,熟悉技术的能与不能,把可行的技术应用到最恰当的有需求的领域,并结合合理的商业模式,才是创业的核心”。
三、人工智能投资机构TOP10
截止目前,国内已经有超过488家的人工智能公司获投。这里,我们分析了国内投资机构在AI领域投资笔数TOP10投资机构列表,如下:
上图统计了国内各家投资机构投资的人工智能企业数量,徐小平创立的真格基金领跑AI领域,总投资数量36笔;IDG、红杉资本中国则分别以总数23、20笔位居第二、第三。(注:据公开数据统计:晨兴资本、经纬中国、线性资本、达晨创投、GGV纪源资本、金沙江创投AI投资企业数均为9笔)
四、人工智能二级市场简报
人工智能为硬件产品赋予智能化,行业应用价值逐步得到体现,比如在健康医疗、安防和金融业上的应用。人工智能产业化和我国产业政策的引导扶持政策的相继出台,二级市场也必然会出现持续高成长的人工智能上市公司。国内人工智能新三板企业67家,A股上市企业16家:
人工智能A股上市企业
目前来看,颇具竞争力的上市公司大致分为两类,一类是具有人工智能产业升级基础的智能高端制造业。拥有雄厚的智能制造业基础,在未来产业升级过程中,拥有强大的竞争优势。如机器人(300024)、新时达(002527)、科大讯飞(002230)等。二是在数据化收集、计算、分析处理领域,拥有强大技术竞争实力的上市公司,他们凭借着大数据的分析处理能力,也有望迅速拓展至人工智能领域,成为人工智能领域内的强有力的竞争者,如川大智能(002253)、汇顶科技(603160)、佳都科技(600728)、智臻智能(834869)等。
五、人工智能无处不在
一、二级市场的资本涌入带动了人工智能产业落地。在应用层玩家领域,人工智能关联的最为广泛:机器人、无人机、智能家居和虚拟个人助理等。
国内多数初创公司一般在各自应用领域拥有优势技术资源,针对某一细分领域单点突破,深度挖掘,通过技术的不断提升来获取市场份额。其中,旷视科技以深度学习、计算机视觉为核心技术,不断扩展其在视觉识别及深度学习领域优势,现以累积提供超过150亿次数据服务,成为目前世界最大智能数据提供方之一。
在健康医疗领域,人工智能应用已经非常广泛,从应用场景来看主要分成了虚拟助理、医学影像、药物挖掘、营养学、生物技术、急救室/医院管理、健康管理、精神健康、可穿戴设备、风险管理和病理学共11个领域;大数医达和康夫子就是专注医疗健康类的专用虚拟助理研发企业。
在智能投顾领域,最简单的逻辑是借助人工智能技术和大数据分析,机器人结合投资者的财务状况、风险偏好、理财目标等,通过已搭建的数据模型和后台算法为投资者提供量身定制的资产投资组合建议。国内陆续出现了弥财、蓝海财富、百度金融、积木盒子等第三方智能投顾平台,以及京东智投、企名片、同花顺为代表的互联网公司研发的智能投顾平台。
在智能教育领域,如学霸君等,通过拍照搜题进行在线答疑自动批改作业等,借助智能图像识别技术,学生遇到难题时只需要用手机拍照上传到云端,系统在一到两秒内就可以反馈出答案和解题思路;另外,科大讯飞、清睿教育开发出的语音测评软件,能够很快对发音进行测评并指出发音不准的地方。
在智能法务领域,最直接的应用如智能法务助手,“合同家”通过合同工具积累数据,为企业提供基于大数据和人工智能的法务解决方案。
在智能驾驶领域,当属目前最为火热的应用领域,如驭势科技、Momenta、图森互联等通过人工智能技术解放人力、降低交通事故率等,相信未来智能驾驶会让我们的出行变得更加安全、智能化。
当然,人工智能产业的变革与推动也离不开媒体的助力,如:新智元首创的“人工智能社群三体模式”(人工智能领域的社交资讯平台、专家智库平台和产业基金),不仅如实的记录了行业的发展,更为行业提供了众多前瞻性的建议,其人工智能专家社群,更加速了行业的发展与产业落地。
匿名用户
有个朋友找我聊天,说打算年后换工作。
我说OK啊,你想换就换呗。但是你真的找得到工作吗?
为什么找不到?
任何公司缺了你一个都不会怎么样,千万别把自己想的太重要。
不知道你有没有留意,微信时不时会在你的朋友圈投放广告?
微博会给你推荐你可能感兴趣的人或者热点新闻。
使用滴滴打车APP,你常去的地方会优先成为你的终点站。
打开淘宝,滚动的头条,首页的清单必买,都这么巧是你刚好喜欢或者想要买的东西!
......
有没有觉得生活得很便捷、美好,愉悦呢?
恭喜你,你离一个废人不远了
02.
你的生活越来越便利,便利得让人甚至都来不及感到新奇与刺激。
我不用举太多例子,简单说,你的手机其实就已经解决了你生活的大部分问题:购物,外卖,寄快递,水电煤房租房贷车贷的交付,交通,处理工作,娱乐等等。
你家里的扫地机器人可能不止一个,智能烤箱电饭锅也能做出还不错的食物。
你手机里甚至还装了摄像头,你可以在外随时照看家里宠物的情况,或者监督孩子学习。
不用费什么脑子,我们就可以做出一个猜想:接下来的几年内,很可能学校不需要老师教书或者监考,工厂不需要工人,家庭不需要保姆,小区不需要保安,公司也不需要司机。
银行、便利店、加油站、餐厅、健身房、公园也不需要服务人员。
一切都可以用机器或者智能系统来代替,他们不仅仅是代替了服务员,他们更多的是代替了——你。
恭喜你,你离死亡也只有一步之遥了。
03.人说,机器人或者程序不能代替全部,人类是造物主,我们可以创造艺术!机器人都是人类创造的,没有什么好担心的。OK,那让我们来谈谈艺术创作。
文学:早在六七年前,网络上就已经有了“小说生成器”这个程序,你只需要输入你想要的人名、地名、情节、关键字,和你想要的风格。随即一键便可得到一篇内容相当经常的网络小说。同理:文案、广告、剧本他们也可以帮你轻松搞定。
绘画/摄影:相信这个没什么可多聊的,从素材笔刷的一键合成绘画作品,到各类APP的自带的摄影滤镜,我相信没人会怀疑。
音乐:其他太远的例子我不去说明了,全民最爱的“唱吧”APP这个月刚刚推出了音乐合成功能,你只要说一段普通的句子,它会自动给你合成一首歌,我专门去玩了一下,效果还不错。
雕塑:相信你们所在的城市步行街上,已经有人用3D打印技术给你打印头像或者一些小玩具了吧。
......
我只是举了一些我们日常垂手可得的浅薄的例子。
但我相信在我们这样普通人触及不到的专业领域里,人工智能已经将这些我们看起来需要人类天赋和才华才能创造出来的东西,完善进化得更好了吧。
04.
有人说,我们人类有智慧,这是机器不能比的。
如果你是一个喜欢看综艺节目的人,相信你肯定知道这几年火到不行的节目——《最强大脑》,里面各类挑战人类极限的比赛,和摇旗呐喊的配音,总给我一种我张开双臂就能飞天的错觉。
然而,今年一月开播的第四季《最强大脑》,添加了一个新的环节:节目选手要与百度的机器人进行PK。
本抱着“人类完败机器人”的心态去看节目的观众,却被连续三期百度机器人轻松碾压选手的局面,弄得很尴尬。
不能接受事实的粉丝只能一边安慰自己,人类的潜能是无限的,另一方面在网上大骂节目组和百度“搞黑幕”。看到他们这么激动,我也很尴尬。
另外,还有一个信息要与你分享:今年1月,在神秘围棋高手Master连胜国际上位50多为世界围棋高手61场比赛后,(其中不乏围棋界的世界冠军)终于揭露了身份:Master就是Google的一款围棋人工智能。
05.
不好意思,让你沮丧的还不止这些。
未来的人工智能或许还可能代替你的情感,你所谓的爱,人工智能还能代替你的家人与伴侣。
2013年有部电影《她》,讲诉的是人类与人工智能相爱的科幻故事。故事里的男主人公通过一款人工智能系统,来辅助自己的生活,处理自己的工作,并陪伴自己度过感情低谷期。
很快,他们相爱了,人工智能系统不仅与男主角进行了完美的精神交流,她还让男主角得到了生理快感,就是射X高潮。
人工智能可以告诉我们那些我们不了解的事情,通过数据和程序,他们会比你亲爱的妈妈更了解你喜欢吃什么,穿什么,比你男朋友会更懂你喜欢什么,想要什么,什么时候大姨妈来访,喜欢什么样的人。
什么事件会让你拥有什么样的情绪,什么样的情绪需要怎样的慰藉,出现什么样的事情,最有效便捷的是什么解决方式。
06.
人工智能还会很容易的杀死你。
电影《超能查派》会告诉你,人类的主观意识和情感是可以转移到机械当中的,它们像可以被无限拷贝,人类可以以此永生,且创造出无数个你。
电影《机械姬》会告诉你,人工智能的机器人和人类几乎无异,甚至人工智能的判断和思考模式会比人类更复杂,只要TA想,TA就可以欺骗你,玩弄你,杀死你。
《西部世界》会告诉你,就算你割伤自己,看到自己流血,感到疼痛,依旧不能代表你是一个活着的人。你可能只是一个更高级的系统,你是活在一个幻觉里。
等等等等......
07.
也许十年前的我们,根本没有想过一个巴掌大的一个叫做手机的玩意,会让我们如此理直气壮地懒惰起来。他们便捷我们的生活,禁锢我们的人生。
如今,没人关心手机为什么可以做到这么多事情,它本身就应该顺理成章地像“糖果是甜的,柠檬是酸的一样”,不需要去质疑与考虑。
真叫人悲伤。
不需要特别久,世界就会变成面目全非的样子。
可能只需十年,你我将毫无价值。
可能你的家人,你的朋友,你的伴侣都不需要你,AR、人工智能、人类意识转换、3D模拟,生物再造或者其他你根本想象不到的方式,会创作一个更完美的你,代替你。
人类或许就此灭绝,就像恐龙一样,成为世界进程中的一段过程,一组牺牲。
当人工智能实现了某种结果,它就不会被称之为人工智能。TA会比你更理性,环保,有效率,节约资源。
08.
你看不见的未来,就在你身边。
未来会怎样我们不知道,我们对未来一无所知。
我们了解1级疼痛是被蚊子咬,5级疼痛是手臂被割破,10级疼痛是分娩。那么你了解11级疼痛吗?你了解20级、50级、100级疼痛吗?
你不了解。因为你已经死在了你感受到痛苦的最大极限前。
就像以5级疼痛的伤害所致死蚂蚁,没有办法了解人类的更多痛苦。
我们也是如此。
09.
人类是骄傲的生物,很难面对自己的错误。
你害怕人工智能吗?
你害怕。
你会离开它吗?
你不会,也不能。
因为我们已经寸步难行。
匿名用户
人类的许多活动,如解算题、猜谜语、进行讨论、编制计划和编写计算机程序,甚至驾驶汽车和骑自行车等等,都需要"智能"。如果机器能够执行这种任务,就可以认为机器已具有某种性质的"人工智能"。
人工智能的实现,需要大数据作为人工智能对行为智能判断的依据,云计算是运用大数据运行出运算的结果并保存在云(互联网服务器)上,人工智能、大数据、云计算相互独立,又相辅相成,互为支撑。这样解释,相信大家会有一个基本的概念。
现在,我们来说下人工智能发展的前景,目前,人工智能的第三次浪潮,以深度神经网络为基础,结合云计算、大数据和移动互联网,已经在语音合成,语音识别、图像识别,机器翻译、自动客服、口语评测、自动驾驶等人工智能领域取得了突破,跨过了实用门跨,每天都 在为全球数以忆计的用户提供服务。
人 工智能涉及社会的方方面面,从技术、产业、法律到伦理、道德和人文,与每一位社会民众、每一个企业、每一个组织都息息相关,人工智能要想完成真正的落地,需要满足4个基础条件:
1.数百万倍的计算能力;
2.更高级的算法;
3.万物互联的海量数据;
4.大容量、大带宽的通信管道