加入收藏 | 设为首页 | 会员中心 | 我要投稿 鹰潭站长网 (https://www.0701zz.cn/)- 图像处理、低代码、云通信、数据工具、物联设备!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

这几招,别说你会使用Jupyter Notebook!

发布时间:2021-02-05 14:14:53 所属栏目:外闻 来源:互联网
导读:机器学习(Machine Learning) 机器学习是推动AI复苏的最重要动力。它的兴起标志着人工智能很长时间弯路的终结。要想让机器比人做得更好,并不是依靠人来教机器规则,而是让机器从历史数据中学习。比如最常见的机器学习场景物体识别,要想让机器从各种照片中找

机器学习(Machine Learning)

机器学习是推动AI复苏的最重要动力。它的兴起标志着人工智能很长时间弯路的终结。要想让机器比人做得更好,并不是依靠人来教机器规则,而是让机器从历史数据中学习。比如最常见的机器学习场景——物体识别,要想让机器从各种照片中找出“猫”,只要让机器学习各种各样猫的照片对象。机器学习算法会将训练用的猫图像背后的向量特征总结为一个预测模型,让这个模型预测任何一张新图片中包含猫的概率。同样的道理,语音识别、语言翻译、人脸识别等都是使用的类似的原理。喂养算法的数据量越大,通常预测的准确率就越高。

机器学习应用可以分为有监督学习和无监督学习。前者需要人工参与训练数据的标识,后者则通过数学方法自动聚类出存在相似性的对象。在缺少训练数据的情况,无监督机器学习就会起到更大的作用。

机器学习的一个分支被称为深度神经网络(DNN),它的设计已经高度参照了人类大脑神经元的连接结构。在深度神经网络中,数据被输送到输入层,结果则从输出层产生,在输入层到输出层之间存在多个隐藏层,每一层会对输入数据的各个特征进行推断,最终能够得到更为准确的预测结果。打败李世石的AlphaGo就是一个基于深度神经网络的算法。但是,DNN对于用户来说依然是一个黑盒子。设计者并不需要也不会知道神经网络中的每一层到底在判断什么具体特征,以及它是如何分解特征的。它背后都是高度抽象的数学方法。不管它有多么玄妙,深度神经网络的确厉害,它不仅具备高超的自学习能力,而且还简化了传统机器学习中大量复杂和耗时的特性工程(Feature Engineering,通过行业专有知识来调优机器学习算法的过程)。
 

大数据在城市交通、社会治理、能源传输、网络安全、航空航天等领域也都已经有了现实的应用。但在这些资本投入密集的领域之外,大数据在一般行业和企业中的应用依然道路曲折。这不是因为大数据技术不够完善,而是诸多行业尚未能够明确抽象出大数据应用的价值以及可付诸实施的方法论。正如前面提到的,云计算和大数据对于普通中小企业来说依然是一个模糊的技术工具,一般企业也很难雇佣大数据专家,而专业服务企业目前还没有找到利用自己的技术专长提供普遍服务的有效机会。通用领域中的大数据应用还停留在理念阶段。所以,在过去几年出现的大数据技术公司大多都还在服务金融、公安、交通、能源等大客户集中的行业。

突破的关键点可能在两个方面,一是大数据技术栈本身十分复杂,当下的工具还依赖专门训练的计算机专家,产业还没有抽象出一个通用领域的应用模型,也无法提供一个类似SaaS这样友好的应用界面。这值得数据技术领域和企业应用领域中的跨界专家来探索。二是企业数字化建设还刚刚开始,很多企业缺失稳定和可靠的数据采集和记录的过程。如果没有数据流,自然就不会有大数据应用。因此大数据技术被广泛应用可能还需要五到十年的时间。

人工智能(Artificial Intelligence)

人工智能的概念和基本原理起源早至1950年代。早期的人工智能研究集中在加州大学伯克利分校,麻省理工,斯坦福和南加州大学等计算机实验室中。今天已经商业化的神经网络算法就来自于半个世纪多前麻省理工大学的明斯基教授发表的《感知元》论文,但是计算机算力在当时实在是太弱了,以至于任何计算理论上的假设都很难付诸于现实。因此,在长达五十年的时间内,人工智能技术都停留在理论研究和一部分不成功的实践上。

虽然人工智能领域经历了漫长的冬天,但它所提出的机器向人类学习,并最终在特定领域能够做得比人类更好的假设却是千真万确的。

千禧年后的AI复苏

2000年以后,有几大动因推动了人工智能概念的复兴。首先,因为摩尔定律的存在,计算机的运算速度和单位存储成本均用指数速率发展到一个新的阶段。云计算和大数据技术也允许计算机用很快的速度处理TB甚至PB级的数据。其次,网络服务的兴起在诸多领域生产出丰富的数据,Google,Netflix和Amazon的业务就像数据机器一样,每分每秒都能产生海量的用户行为数据。

第三,在人工智能的数学方法研究中,AT&T贝尔实验室的三位科学家(Tin Kam Ho, Corinna Cortes, 和 Vladimir Vapnik)在机器学习领域取得了突出的进展。机器学习技术可以将复杂和不确定的非线性问题通过线性的数学公式来解决。在解决不同的问题的过程中,机器学习理论方法和实践被明确验证。最早的一批互联网企业,包括Google,Facebook,Linkedin等在这个过程中既提供了海量数据,也从研究过程中获得了巨大的成果。尤其是Google,它是机器学习及其分支深度学习领域最重要的信奉者和推动者。2010年,Google成立了Google大脑,一个专注人工智能研究的内部组织,后来又收购了英国企业DeepMind。后者在2016年3月击败了人类围棋冠军李世石。

下图是Tom Siebel在Digitlal Transofrmation一书中对AI技术进化史的一张插图,显示了从1950年代开始到现在的主要技术迭代历史。

(编辑:鹰潭站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读