神经网络挖掘模型与logistic回归挖掘模型的不同点有哪些?

神经网络挖掘模型与logistic回归挖掘模型的不同点有哪些?,第1张

逻辑回归有点像线性回归,但是它是当因变量不是数字时使用。比如说因变量是布尔变量(如是/否响应),这时候就需要逻辑回归。它称为回归,但实际上是是根据回归进行分类,它将因变量分类为两个类中的任何一个。

网页链接

如上所述,逻辑回归用于预测二进制输出。例如,如果xyk公司打算建立一个模型来决定是否向客户发放xyk,它将模拟客户是否需要这张或者能够承担这张xyk 。

它给出了事件发生概率的对数,以记录未发生事件的概率。最后,它根据任一类的较高概率对变量进行分类。

神经网络(Neutral Network)是通过数学算法来模仿人脑思维的,它是数据挖掘中机器学习的典型代表。神经网络是人脑的抽象计算模型,我们知道人脑中有数以百亿个神经元(人脑处理信息的微单元),这些神经元之间相互连接,是的人的大脑产生精密的逻辑思维。而数据挖掘中的“神经网络”也是由大量并行分布的人工神经元(微处理单元)组成的,它有通过调整连接强度从经验知识中进行学习的能力,并可以将这些知识进行应用。

神经网络就像是一个爱学习的孩子,您教她的知识她是不会忘记而且会学以致用的。我们把学习集(Learning Set)中的每个输入加到神经网络中,并告诉神经网络输出应该是什么分类。在全部学习集都运行完成之后,神经网络就根据这些例子总结出她自己的想法,到底她是怎么归纳的就是一个黑盒了。之后我们就可以把测试集(Testing Set)中的测试例子用神经网络来分别作测试,如果测试通过(比如80%或90%的正确率),那么神经网络就构建成功了。我们之后就可以用这个神经网络来判断事务的分类了。

具体来说,”神经网络“是一组互相连接的输入/输出单元,其中每个连接都会与一个券种相关联。在学习阶段,通过调整这些连接的权重,就能够预测输入观测值的正确类标号。因此可以理解为人工神经网络是由大量神经网络元通过丰富完善的连接、抽样、简化和模拟而形成的一种信息处理系统。

数据挖掘的常用方法有:

神经网络方法

神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。

遗传算法

遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。

决策树方法

决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。

粗集方法

粗集理论是一种研究不精确、不确定知识的数学工具。粗集方法有几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于 *** 作。粗集处理的对象是类似二维关系表的信息表。

覆盖正例排斥反例方法

它是利用覆盖所有正例、排斥所有反例的思想来寻找规则。首先在正例集合中任选一个种子,到反例集合中逐个比较。与字段取值构成的选择子相容则舍去,相反则保留。按此思想循环所有正例种子,将得到正例的规则(选择子的合取式)。

统计分析方法

在数据库字段项之间存在两种关系:函数关系和相关关系,对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计、回归分析、相关分析、差异分析等。

模糊集方法

即利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。系统的复杂性越高,模糊性越强,一般模糊集合理论是用隶属度来刻画模糊事物的亦此亦彼性的。

文献资料显示,目前,对于滑坡预测预报,国内外学者已先后提出了约40种滑坡预测预报模型和方法。表43为现有的具有代表性的滑坡定量预报模型和方法一览表。这些滑坡预测预报模型主要是随着数学的发展阶段而提出的相应模型,具体包括确定性预报模型、统计预报模型、非线性预报模型三类。确定性模型是把有关滑坡及其环境的各类参数用测定的量予以数值化,用数学、力学推理或试验方法,对滑坡的稳定性或发生事件做出明确的判断。统计预报模型主要是运用现代数理统计的各种统计方法和理论模型,着重于对现有滑坡及其地质环境因素和其外界作用因素关系的宏观调查与统计,获得其统计规律,并用于拟合不同滑坡的位移-时间曲线,根据所建模型进行外推预报。非线性预报模型是引用了对处理复杂问题比较有效的非线性科学理论而提出的滑坡预报模型。

表43 滑坡预测预报模型和方法一览表

续表

大量的滑坡预测预报实例表明,尽管表43罗列了近40种滑坡预测预报模型和方法,但真正能在实际滑坡预测预报时可 *** 作性和可靠性均较好的预测预报模型和方法并不多。本手册推荐了几种适合于常用的、且具有一定可 *** 作性的滑坡中长期和短临预报模型和方法。

4621 滑坡中长期预测预报模型与方法

A基于极限平衡理论的稳定性评价与预测

斜坡的变形破坏是一个复杂的地质力学过程。在这个发展演化过程中,伴随着变形的不断发展,斜坡的稳定性不断降低。描述斜坡稳定性的具体指标为稳定性系数,可以通过极限平衡理论的多种稳定性计算方法作定量计算。因此,斜坡的稳定性系数可以作为斜坡中长期预测预报的一个重要指标。不过,斜坡的稳定性只能从宏观上反映斜坡的演化阶段,不能直接计算和预测预报滑坡的具体时间。

B基于数值模拟的GMD数值预报

斜坡的变形破坏是一个复杂的地质力学过程,也是一个变形从量变的积累到质变的发生过程。这个过程最大的特点就是伴随着坡体的形成和变形的发生,坡体内部的潜在滑动面逐渐孕育,“损伤”逐渐累积,强度逐渐降低,这是一个量变的过程;当变形发展到一定程度后,潜在滑动面的“损伤”累积所导致的强度降低已经维持不了坡体的稳定性,从而导致滑动面的累进性贯穿,发生质变,滑坡形成。

欲对上述斜坡发展演化过程进行较为准确的描述,可通过建立斜坡的地质模型,结合变形破坏的力学机理分析和实际位移监测数据,建立描述斜坡变形破坏过程的数值预测模型。这种模型可将地质(G)-力学机理(M)-变形(D)三者有机耦合,并从本质上阐明通常利用各种手段监测到的滑坡外在表现所代表的滑体变形和失稳的地质-力学机理内涵,我们称其为GMD模型。依托于GMD模型,通过数值模拟等手段对时间的进一步延拓和条件的改变,进行现今变形稳定性的评价和今后发展趋势的预测,因此,我们将这种滑坡预报方法称为GMD数值模型预报。

C斜坡发展演化趋势的外推预测(回归分析、神经网络)

在斜坡演化的各个阶段,随时通过对已有的监测数据进行外推,预测今后的发展演化趋势,是滑坡预测预报的常用做法。从数学的角度讲,外推预测主要有两种做法:一种为利用函数表达式(如多项式、指数函数等)对已有监测数据进行回归拟合,构建斜坡演化的回归方程,并据此进行外推预测。另一种为人工神经网络方法。神经网络方法主要是模拟人类分析和解决问题的思路和工作方式,首先构造一个由多个神经元组成的网络系统,用此模拟人脑的神经细胞。通过对已有监测数据的“学习”并将学习结果存储“记忆”,然后根据新的要求,实现联想预测。实践结果表明,对于规律性较强的监测数据,神经网络具有较强的外推预测能力。

但是,仅对监测数据进行外推预测,是不能直接确定滑坡发生时间的,这就需要根据滑坡发生时监测曲线的一些基本特征或与外推预测方法的配套判据等的配合,才能预报滑坡发生时间。

D滑坡发生时间预报的黄金分割数法

黄润秋、张倬元等人通过对国内外数十个岩体失稳实例的位移观测曲线进行研究和统计分析发现,斜坡随时间发展演化的三阶段曲线中,线性阶段所用的时间与线性和非线性阶段所用时间的总和之间呈黄金分割数关系。具体可用下式表示:

三峡库区滑坡灾害预警预报手册

式中:T1——斜坡演化过程中线性阶段的历时;

T2——非线性阶段的历时。

监测资料表明,斜坡演化的三阶段理论不仅仅适用于变形,也适用于能反映斜坡发展演化状态的其他状态变量,如声发射频率等。斜坡演化过程中的黄金分割数具有一定的普适性。对于变形曲线而言,上式中的线性阶段对应于等速变形阶段,非线性阶段对应于加速变形阶段。因此,黄金分割数法可表述为:斜坡演化过程中等速变形阶段历时是等速变形阶段与加速变形阶段总历时的0618倍。因此,如果有自斜坡等速变形以来的监测数据,一旦斜坡演化进入加速变形阶段,便可利用黄金分割数法概略地估算滑坡滑动时间,可以不必等到斜坡进入加加速阶段才进行预测预报。

从另一方面讲,如果斜坡演化还未进入加速变形阶段,要预报滑坡发生的具体时间是很难的,甚至是不可能的,这一点已被非线性科学理论中的最小熵产生原理所决定。

4622 短期临滑预测预报模型与方法

A斋藤迪孝预报模型

日本学者斋藤迪孝提出,当坡体进入加速变形阶段后,可根据位移-时间曲线进行预报。取斜坡位移-时间曲线上三个点t1,t2,t3,使其t2-t1和t3-t2两段之间的位移量相等,滑坡发生破坏时间tr的计算公式为:

三峡库区滑坡灾害预警预报手册

斋藤迪孝法仅适合于滑坡进入加速变形阶段后的时间预报。式(413)也可用如图421所示的作图法直接求出滑坡发生的时间tr。图中,MM′、NN′为以A2为圆心的圆弧。

B灰色系统预报模型

灰色系统理论是我国著名学者邓聚龙教授1982年创立的一门新兴横断学科,它以“部分信息已知,部分信息未知”的“小样本”“贫信息”不确定系统为研究开发对象,主要通过对“部分”已知信息的生成、开发、提取有价值的信息,实现对系统运行行为的正确认识和有效控制。灰色预报模型的基本思想是把滑坡看作一个灰色系统,依据滑坡随时间变化的监测时序数据,通过适当的数据处理,使之变为一递增时间序列,然后用适当的曲线逼近,以此作为预报模型对系统进行预测预报。灰色系统预测模型的具体建模过程和方法,参考附录11。

图421 根据加速变形阶段曲线推算滑坡发生时间图解(斋藤迪孝法)

Mt1与t2的中点;Nt1与t3的中点

CVerhulst预报模型

基于滑坡的变形、发展、成熟和破坏的过程与生物繁殖、生长、成熟、消亡的发展演变过程具有相似性,德国生物学家费尔哈斯(Verhulst)1837年提出了一种生物生长模型,即Verhulst模型。晏同珍等(1988)考虑到滑坡的演变也有一个变形、发展、成熟到破坏的过程,二者在发展演变上具有相似性。于是将这一模型引进到滑坡的变形和时间的预测预报中。Verhulst的基本原理和建模过程,参考附录12。

当然可以,神经网络具有极强的非线性映射能力,对非线性函数的拟合效果非常好,你可以试试BP神经网络,拟合能力已经很强。

当对系统对于设计人员来说,很透彻或者很清楚时,则一般利用数值分析,偏微分方程等数学工具建立精确的数学模型,但当对系统很复杂,或者系统未知,系统信息量很少时,建立精确的数学模型很困难时,神经网络的非线性映射能力则表现出优势,因为它不需要对系统进行透彻的了解,但是同时能达到输入与输出的映射关系,这就大大简化设计的难度。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/zaji/12457076.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-23
下一篇2023-05-23

发表评论

登录后才能评论

评论列表(0条)

    保存