|
什么是人工智能?
纵观人工智能的历史,其定义被不断重写。人工智能是一个概括性术语(这个概念始于50年代);机器学习是AI的子集,而深度学习又是机器学习的子集。
1985年,当我还是美国国家安全局的实习生时,人工智能也是一个非常热门的话题。在美国国家安全局,我甚至上了一节麻省理工关于人工智能专家系统的视频课程。专家系统在规则引擎中捕获专家的知识。规则引擎在金融和医疗保健等行业中有广泛的应用,最近更是用于事件处理,但是当数据发生变化时,规则的更新和维护会变得异常困难。机器学习的优势在于从数据中学习,并且可以提供数据驱动的概率预测。监督算法使用标记数据,这些数据的输入和目标的结果或标签都会提供给算法。
监督学习也被称为预测建模或预测分析,因为你建立了一个能够做出预测的模型。预测建模的一些例子是分类和回归。分类根据已知项的已标记示例(例如,已知是否为欺诈的交易)来识别一个项属于哪个类别(例如,某交易是否为欺诈)。逻辑回归预测了一个概率——例如,欺诈的概率。线性回归预测一个数值——例如,欺诈的数量。
一些分类的例子包括:
-
信用卡欺诈检测(欺诈,不是欺诈)。
-
信用卡申请(良好信用,不良信用)。
-
垃圾邮件检测(垃圾邮件,不是垃圾邮件)。
-
文字情绪分析(快乐,不快乐)。
-
预测患者风险(高风险患者、低风险患者)。
-
恶性或非恶性肿瘤的分类。
逻辑回归(或其他算法)的一些例子包括:
-
根据历史汽车保险欺诈性索赔以及这些索赔的特征,例如索赔人的年龄、索赔金额、事故严重程度等,预测欺诈发生的概率。
-
给定患者特征,预测充血性心力衰竭的概率。
So线性回归的一些例子包括:
-
根据历史汽车保险欺诈性索赔以及这些索赔的特征,如索赔人的年龄、索赔金额、事故的严重程度等,预测欺诈金额。
-
根据历史房地产销售价格和房屋特征(如平方英尺,卧室数量,位置),预测房子的价格。
-
根据历史上的社区犯罪统计,预测犯罪率。
-
我们想要预测什么?
-
某一笔借记卡交易是否为欺诈。
-
欺诈是标签(对或错)。
你可以用来进行预测的“ 是否 ”问题或属性是什么?
-
今天花费的金额是否大于历史平均水平?
-
今天的这些交易是否在多个国家?
-
今天的交易数量是否大于历史平均水平?
-
今天的新商户类型与过去三个月相比是否较高?
-
今天是否在多个带有风险类别代码的商家处购买?
-
今天是否有不寻常的签名与以往使用PIN相比?
-
与过去三个月相比,是否有新的购买行为?
-
与过去三个月相比,现在是否有国外购买?
要构建分类器模型,你需要提取对分类最有贡献的有用特性。
决策树
决策树创建一个基于输入特征预测类或标签的模型。它的工作原理在于评估每个节点上包含一个特征的问题,然后根据答案选择到下一个节点的分支。预测借记卡欺诈的可能决策树如下所示。特性问题是节点,答案“是”或“否”是树中到子节点的分支。(注意,真正的树会有更多的节点。)
问题一:24小时内的花费是否大于平均?
问题2:今天是否有多笔交易来自高风险的商家?
聚类的一个例子是,一个公司希望细分其客户,以便更好地定制产品和服务。客户可以依据比如人口统计和购买历史记录等特征被分组。为了得到更有价值的结果,无监督学习的聚类常常与有监督学习相结合。例如,在这个banking customer 360用例中,首先根据问卷答案对客户进行细分。接着对客户群体进行分析,并标上用户画像。然后,这些标签通过客户ID与账户类型和购买内容等特性进行链接。最后,我们在被标签的客户身上应用了监督机器学习,允许将调查用户画像与他们的银行行为联系起来,以提供深入的见解。

(编辑:鹰潭站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|