‘壹’ 怎么算个人的一年的个人流水
算?什么意思?你直接去银行打印不就完了。
‘贰’ 数据挖掘常用算法有哪些
1、 朴素贝叶斯
朴素贝叶斯(NB)属于生成式模型(即需要计算特征与类的联合概率分布),计算过程非常简单,只是做了一堆计数。NB有一个条件独立性假设,即在类已知的条件下,各个特征之间的分布是独立的。这样朴素贝叶斯分类器的收敛速度将快于判别模型,如逻辑回归,所以只需要较少的训练数据即可。即使NB条件独立假设不成立,NB分类器在实践中仍然表现的很出色。它的主要缺点是它不能学习特征间的相互作用,用mRMR中的R来讲,就是特征冗余。
2、逻辑回归(logistic regression)
逻辑回归是一个分类方法,属于判别式模型,有很多正则化模型的方法(L0,L1,L2),而且不必像在用朴素贝叶斯那样担心特征是否相关。与决策树与SVM相比,还会得到一个不错的概率解释,甚至可以轻松地利用新数据来更新模型(使用在线梯度下降算法online gradient descent)。如果需要一个概率架构(比如,简单地调节分类阈值,指明不确定性,或者是要获得置信区间),或者希望以后将更多的训练数据快速整合到模型中去,那么可以使用它。
3、 线性回归
线性回归是用于回归的,而不像Logistic回归是用于分类,其基本思想是用梯度下降法对最小二乘法形式的误差函数进行优化。
4、最近邻算法——KNN
KNN即最近邻算法,其主要过程为:计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离,马氏距离等);对上面所有的距离值进行排序;选前k个最小距离的样本;根据这k个样本的标签进行投票,得到最后的分类类别;如何选择一个最佳的K值,这取决于数据。
5、决策树
决策树中很重要的一点就是选择一个属性进行分枝,因此要注意一下信息增益的计算公式,并深入理解它。
6、SVM支持向量机
高准确率,为避免过拟合提供了很好的理论保证,而且就算数据在原特征空间线性不可分,只要给个合适的核函数,它就能运行得很好。在动辄超高维的文本分类问题中特别受欢迎。可惜内存消耗大,难以解释,运行和调参也有些烦人,而随机森林却刚好避开了这些缺点,比较实用。
‘叁’ 银行流水是什么意思怎样算流水
一、针对个人的话,银行流水就是每个月的交易支出或者存款,会根据日期来进行排序,罗列每一项支出和收入。
以前只需要拿到银行卡就可以在柜台上打印相应的流水,但是现在会有更加严格的规定,必须要银行卡和身份证同时出示,才有资格打印流水。其实大多数人打印流水也是想看一下自己的总体收入和支出是否正常。一般作为个人的话很少去做这样的事情,企业会更多,因为企业毕竟要依靠银行流水去做帐。
‘肆’ 如何审查银行流水(深度分析)
我们谈及信贷和抵押贷款,需要提供的材料之一必有银行流水这一项,不管是银行放款还是私人资方配资。出借方考虑到贷款出借风险,必须考虑借款人的还款能力,而界定借款人还款能力,主要还是看其银行流水。
基本要素
众所周知,狭义的流水主要是指银行流水,包括对私和对公流水,两者的基本要素没有太大差异,主要内容包括账号、户名、交易日期、借方金额(支出)、贷方金额(收入)、交易摘要、交易对象等内容。
分析内容
(1)流水真伪
在对流水进行分析之前,首先需要确认客户提供的流水是否真实,否则一切分析都是空中楼阁,可以从以下几个方面分析其真伪。
第一,纸张:很多银行的流水都用专门的纸张进行打印;
第二,姓名和账号等重要信息是否完整和准确,可以通过电话银行验证真伪性;
第三,银行公章是否清晰和正常,可以通过向银行拨打电话询问客户是否在那里打过流水。这类情况比较少见,一般由中介推荐的客户比较容易出现此类情况,需要特别关注。
(2)交易频率
查看流水中一定周期内客户的交易次数是否与生意资金往来的基本规律相符,比如一个开超市老板的流水每日的现金存取有10多次,这个与其生意的资金往来规律不太符合,需要向客户询问其原因,分析其解释的合理性。
(3)交易金额
查看流水中的交易金额是否有异常,包括两个方面。
其一,是否有明显异常与日常结算或者生意规模的大额资金往来,比如流水中日常交易金额都在10万以内,有一笔100万的交易,就需要关注;
其二,是否有时间规律的相同金额的交易金额。如有上述情况,需要和客户询问具体的交易对象和原因。
(4)交易对象
查看流水中每笔交易对象,主要包括与日常经营相关和无关的交易对象。和经营相关的交易对象有上下游客户,这些都属于正常的,从而验证了客户前期口述经营信息的真伪;和日常经营无关的交易对象有小贷公司、投资公司、信托公司和金融公司等,此时需要和客户询问具体的交易原因。
(5)总交易量
关于总交易量分析包括三部分。
第一,客户在一定周期内所有的进账或出账交易量,统计比较容易,比较粗略的反应了客户的流量规模;
第二,通过对流水进行筛选,统计一定周期内与客户生意经营相关的进账或出账交易量,统计比较冗繁,比较客观的反应了客户的真实交易流量;
第三,通过对筛选后的月度进出帐交易量对比分析,能够直观反应其资金回笼周期及淡旺季。
(6)日均余额
关于日均余额分析包括两部分。
第一,根据流水中季度结息总额和活期利率反推其日均余额,该值越大,说明其备用资金越充分;
第二,根据流水中每个季度结息和活期利率反推每个季度的日均余额,推算其标准差,直观反应其波动性,该值越小,说明其备用资金越稳定。
主要风险点
通过对银行流水进行一系列分析,从中可以挖掘一些信息,提炼出重点关注的事项,主要有以下三个方面:
(1)隐性负债
通过对流水中交易金额和交易对象,我们可能会发现客户存在一些未反应在征信中的负债,比如消费金融、小贷公司、P2P机构或民间机构等借款,这样可以更进一步了解客户的诚信度、真实负债水平和还款压力。
(2)交易量与销售额匹配度
通过对客户流水交易量的筛选分析,将月度和年度数据与客户月度和年度销售额进行对比,一般而言两者匹配度在50%-100%为正常,如果低于50%,可能原因有流水可能不是客户主帐流水、客户的结算方式不是转账(如现金或承兑)、销售款回笼周期过长(期间内资金回笼少);如果过高,比如达到200%,可能原因有筛选不准确、低估销售额、存在其他生意和虚增交易流水。无论过高或过低,都需要和客户进一步沟通,弄清真实原因,揭示其隐藏的风险因素。
(3)日均余额与月还款额匹配度
通过对流水的日均余额分析,可将与月还款额(等额还款)进行对比,一般而言,该比例大于1较好,在低于1的情况下,越小说明客户还款压力越大,比如某客户日均余额1万,每月还款5万,无其他还款来源补充情况下,一般而言还款压力较大。
四,对公银行流水审查
既然银行流水的秘密已经尽人皆知,所以现在的银行流水并不是非常可靠。企业造流水并不是说做个假证,而是联合几个企业或者干脆自己七大姑八大姨开几个,相互转帐形成贸易繁荣的样子,银行流水很多,但都是造的。所以在浏览流水时最好要求提供其他资料如购销合同、纳税纪录、增值税发票、水电费、租赁合同等。对于大中型企业还可以要求提供经审计带附注的报表,作为参照验证钩稽关系。
补充理解:(一)
第一,企业帐户众多,从完整性的角度考虑,除非收集齐企业所有的帐户流水,检查才有意义,可是这样的工作量真的扛不住啊,再说还有走企业老板个人帐户的不开票交易呢,完全理不完啊;
第二,各个银行的对账单的格式都各不相同,其中主要的转账原因,有些对账单都根本不显示,只有单纯的数字和时间的流水作为证据实在相关性太差了,直接证明力太低,无解;
第三,私以为在需要辅助佐证时选取确定时点的银行流水有针对性的核实才是必要的,这样时间成本可以接受,比如这个企业提供了x月x日的营业税完税凭证复印件,可是按理说企业没必要把物业出租收入全部归入租金范畴足额缴纳营业税啊,至少按管理费啊,物业费啊等其他名目分摊掉一些,税务成本就能下降很多嘛,私营企业这样处理实在很不科学,而且企业这份复印件看起来就很假的样子。
补充理解:(二)
具体拿到银行流水的时候,一一对应公司可以拿到的一切财务资料,包括且不限于meta和nerv所提到的报表及附注发票、购销合同、海关记录、纳税登记、水电费、借贷凭证等等。如果出现在以上资料中无法查询到的收支信息,当然要找企业的人详细问个清楚。
从我个人的角度,是很喜欢对照着企业的购销合同,计算账期(当然是计算占比较大的上下游)。因为这很能部分反映企业和上下游的关系。通常当然是账期越短越好,但是规律且账期长短适中的上下游,如果不是有猫腻,那势必是和该企业有着长期稳定的合作关系。另外,企业工资和奖金的支付情况,尤其是奖金支付的频率和金额,也能侧面反映出企业一段时期内盈利情况的好坏。
由于一般企业在购销合同进出项中,以整数的情况居多;利息收支的期限和数字相对固定;而水电、工资或者纳税等数字通常都比较不规律。因此在日常流水中,出现的大额近整数或者比较异常如尾数是66或者88之类的数字;或者是定期出现的金额相仿,但是来源或者去向不明的收支记录,都应该是特别值得注意的。
五,真假流水的鉴别
信贷从业者,每天不断与客户的真假信息战斗,今天和大家谈谈,如何识别虚假流水?
虚假流水辨别-流水纸张
虚假流水辨别-字体
虚假流水辨别-明细划分
虚假流水辨别-结息点是否正常
虚假流水辨别-余额是否连接上
虚假流水辨别-银行盖章的真伪
虚假流水辨别-其他小技巧
虚假流水辨别-各大银行流水模版
建设银行
中国银行
交通银行
华夏银行
光大银行
中国民生银行
虚假流水辨别
虚假流水辨别-电话核实
电话核实主要抽核大额的进账项目和结息是否与提供的流水一致,并核对户名。了解信贷知识请加“信贷共学 ”。
(1)个人流水:除了以下所列出的几个银行的特殊情况外,大多数银行都可让客户提前通过电话直接开通电话查询功能。
特殊情况:
a.中国银行不可以通过电话直接开通查询功能,只能柜台开通电话银行。了解信贷知识请加“信贷金融家”。
b.广发银行通过电话只能查询最近10笔,若无法满足查询范围,可指导客户或让客户自行通过网上注册开通免U盾的网银(不用去柜台开通,直接电脑可注册)。
c.兴业银行存折不可以开通电核查询功能,但银行卡可以通过电话开通查询。
(2)对公流水:对公流水一律不可通过电话直接开通查询,需让客户提前去柜台开通电话银行、网银或者由服务人员陪同至开户行打印。
虚假流水辨别-电话核实经验分享
虚假流水辨别-网银核实
网上银行的开通一般都需要客户事先在银行柜面开通好,才能进行核实工作。了解信贷知识请加“信贷金融家”。一般网上核实流水都会有户名和卡号,较为安全方便。在核实时需要注意:
1.核实时尽量通过客服的电脑操作
2.确保银行网址的真实性,准确性
虚假流水辨别-柜面核实
一般个人流水都是采用电话核实和网上核实的,但在这两钟方法都无法查询到的情况下,则客服人员亲自需要陪同客户到银行柜面拉取流水,以验证流水的真实性。
致电银行柜面核实的方法风险比较大,为了防止中介公司包装参与,需要注意一下几点:
1.客户提供的银行网点或者客户经理的号码,必须经过核实
2.通过114查询银行网点号码进行电话核实
3.电话核实必须通过客服电话,全程录音,以备之后查询。
【泽宇金服】融资规划师--吕明辉
2018.11.14
‘伍’ 数据挖掘的经典算法
1. C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。
2. K-means算法:是一种聚类算法。
3.SVM:一种监督式学习的方法,广泛运用于统计分类以及回归分析中
4.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。
5.EM:最大期望值法。
6.pagerank:是google算法的重要内容。
7. Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器集合起来,构成一个更强的最终分类器。
8.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。
9.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes)
10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。
关联规则规则定义
在描述有关关联规则的一些细节之前,我们先来看一个有趣的故事: 尿布与啤酒的故事。
在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在尿布与啤酒背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。
按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率;对关联规则的应用进行推广。关联规则挖掘在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。
‘陆’ 数据挖掘算法有哪些
统计和可视化要想建立一个好的预言模型,你必须了解自己的数据。最基本的方法是计算各种统计变量(平均值、方差等)和察看数据的分布情况。你也可以用数据透视表察看多维数据。数据的种类可分为连续的,有一个用数字表示的值(比如销售量)或离散的,分成一个个的类别(如红、绿、蓝)。离散数据可以进一步分为可排序的,数据间可以比较大小(如,高、中、低)和标称的,不可排序(如邮政编码)。图形和可视化工具在数据准备阶段尤其重要,它能让你快速直观的分析数据,而不是给你枯燥乏味的文本和数字。它不仅让你看到整个森林,还允许你拉近每一棵树来察看细节。在图形模式下人们很容易找到数据中可能存在的模式、关系、异常等,直接看数字则很难。可视化工具的问题是模型可能有很多维或变量,但是我们只能在2维的屏幕或纸上展示它。比如,我们可能要看的是信用风险与年龄、性别、婚姻状况、参加工作时间的关系。因此,可视化工具必须用比较巧妙的方法在两维空间内展示n维空间的数据。虽然目前有了一些这样的工具,但它们都要用户“训练”过他们的眼睛后才能理解图中画的到底是什么东西。对于眼睛有色盲或空间感不强的人,在使用这些工具时可能会遇到困难。聚集(分群)聚集是把整个数据库分成不同的群组。它的目的是要群与群之间差别很明显,而同一个群之间的数据尽量相似。与分类不同(见后面的预测型数据挖掘),在开始聚集之前你不知道要把数据分成几组,也不知道怎么分(依照哪几个变量)。因此在聚集之后要有一个对业务很熟悉的人来解释这样分群的意义。很多情况下一次聚集你得到的分群对你的业务来说可能并不好,这时你需要删除或增加变量以影响分群的方式,经过几次反复之后才能最终得到一个理想的结果。神经元网络和K-均值是比较常用的聚集算法。不要把聚集与分类混淆起来。在分类之前,你已经知道要把数据分成哪几类,每个类的性质是什么,聚集则恰恰相反。关联分析关联分析是寻找数据库中值的相关性。两种常用的技术是关联规则和序列模式。关联规则是寻找在同一个事件中出现的不同项的相关性,比如在一次购买活动中所买不同商品的相关性。序列模式与此类似,他寻找的是事件之间时间上的相关性,如对股票涨跌的分析。关联规则可记为A==>B,A称为前提和左部(LHS),B称为后续或右部(RHS)。如关联规则“买锤子的人也会买钉子”,左部是“买锤子”,右部是“买钉子”。要计算包含某个特定项或几个项的事务在数据库中出现的概率只要在数据库中直接统计即可。某一特定关联(“锤子和钉子”)在数据库中出现的频率称为支持度。比如在总共1000个事务中有15个事务同时包含了“锤子和钉子”,则此关联的支持度为1.5%。非常低的支持度(比如1百万个事务中只有一个)可能意味着此关联不是很重要,或出现了错误数据(如,“男性和怀孕”)。要找到有意义的规则,我们还要考察规则中项及其组合出现的相对频率。当已有A时,B发生的概率是多少?也即概率论中的条件概率。回到我们的例子,也就是问“当一个人已经买了锤子,那他有多大的可能也会买钉子?”这个条件概率在数据挖掘中也称为可信度,计算方法是求百分比:(A与B同时出现的频率)/(A出现的频率)。让我们用一个例子更详细的解释这些概念: 总交易笔数(事务数):1,000包含“锤子”:50包含“钉子”:80包含“钳子”:20包含“锤子”和“钉子”:15包含“钳子”和“钉子”:10包含“锤子”和“钳子”:10包含“锤子”、“钳子”和“钉子”:5 则可以计算出: “锤子和钉子”的支持度=1.5%(15/1,000)“锤子、钉子和钳子”的支持度=0.5%(5/1,000)“锤子==>钉子”的可信度=30%(15/50)“钉子==>锤子”的可信度=19%(15/80)“锤子和钉子==>钳子”的可信度=33%(5/15)“钳子==>锤子和钉子”的可信度=25%(5/20)
‘柒’ 银行流水怎么算
银行的有效流水需满足以下条件:
1、多存少取,存入1000取500,反之则为无效,支出大于收入。
2、针对信用贷款,存入时间和金额固定。
3、如果工资走现金形式,银行流水无法在转入方体现工资收入,请在固定时间存入固定的金额,这样也能体现有效的收入。
4、24小时内不能存入取出的部分,也就是不能当天存入当天取出。
5、针对信用贷款,连续3个月或6个月有金额存入,余额不为零。(7)交易流水挖掘算法扩展阅读
私人账户流水指的是客户自己本人名下的银行卡(借记卡)或者银行活期存折,在一段时间内与银行发生存取款业务交易清单明细。
对公账户流水指的是银行客户《公司客户》(开设基本对公账户)其对公银行账户上一段时间与银行发生存取款业务清单。
银行流水的进项主要表现方式:进项表现贷方,出项表现于借方,主要有卡存、现存、转入、工资、续存、网银转账、货款、劳务费等。
信用卡对账单:贷记卡账户的交易记录,是银行给客户的交易对账单,只能当做交易记录看待,不是银行流水记录。
流水账单
1、个人流水:个人半年内的交易明细、消费、进出账、转账、网银、话费充值等。
2、工资流水:个人有在当地公司工作,并且公司有为员工义务缴纳个人所得税的流水,每月工资银行代发,银行代缴个人所得税,有消费、进出账、转账、网银、话费充值等。
3、大额个人流水:个人半年内的交易明细、消费、进出账、转账、网银、话费充值等,个人生意往来流水体现。
4、个人异地流水:个人半年内异地交易明细、消费、进出账、转账、网银、话费充值等;非理财金卡用户异地转账、取现需扣手续费。
5、企业流水:俗称企业对账单企业所在当地银行开的一般账户,半年内的企业资金流动。
‘捌’ 银行流水是怎么计算的
01
我们在办理贷款或者购买房产的时候,会遇到需要我们提供银行流水证明的情况。有的时候,甚至出国旅游,也会遇到类似的情况。其实,提供银行流水只是为了证明一个人的经济实力。
02
我们找银行办理流水证明的时候,最好选定几张平时一直在用的银行卡,去这几张银行卡的开户行,找柜台的工作人员说明你需要打印银行流水单,然后工作人员会帮你叫号,你就可以开始办理银行流水单打印了。
03
一般打印流水单,是在柜台完成,有的银行是单独划分出来一个业务区,有专门的人员帮你完成。流水单一般都是一年的,一年之内的流水才算是完整的证明材料,如果有多年的,也可以全部打印出来。
04
银行流水一般来说,有两种算法,一种是一整年(自然年)的现金入账,也就是银行这一端的收入;还有一种是一整年(自然年)的现金入账+现金支出,这个主要看你的银行卡的现金流量。一般银行的工作人员会问你是打哪一种,你自己选择就可以。
05
银行流水的完整证明,是一张很长的明细单,上面不仅有你的银行名称、你的姓名、银行卡号,还有你的每一笔银行动态,这份证明上会加盖银行的公章,才算是真实有效。
银行流水是指银行活期账户(包括活期存折和银行卡)的存取款交易记录。根据账户性质不同分为个人流水和对公流水。银行流水是证明个人或公司收入情况的一种证明材料,是向银行申请贷款所必须的材料。
‘玖’ 银行流水是怎么算的银行流水算的规定是什么
银行流水一般来说,有两种算法,一整年(自然年)的现金入账,也就是银行这一端的收入。一整年(自然年)的现金入账+现金支出,这个主要看你的银行卡的现金流量。
1.多存少取,存入1000取500,反之则为无效,支出大于收入。
2.针对信用贷款,存入时间和金额固定。
3.如果工资走现金形式,银行流水无法在转入方体现工资收入,请在固定时间存入固定的金额,这样也能体现有效的收入。
4.24小时内不能存入取出的部分,也就是不能当天存入当天取出。
5.针对信用贷款,连续3个月或6个月有金额存入,余额不为零。
拓展资料:
银行流水是指银行活期账户(包括活期存折和银行卡)的存取款交易记录。根据账户性质不同分为个人流水和对公流水。银行流水是证明个人或公司收入情况的一种证明材料,是向银行申请贷款所必须的材料。
一、银行流水怎么打
1.在你确认银行卡后存折所属银行后,携带本人身份证件及银行卡,到就近的银行网点查询即可,工作人员会帮你将其进行打印。
2.也可以携带卡或存折到营业网点自助查询机自行打印。自助打印流程:
自助查询机--插入卡或存折--输入密码--进入查询明细页面-历史明细-输入查询打印所需日期-查询-打印即可。
此外,还可以通过以下方式查询银行流水:
1.对于开通了网银的用户来说,可登陆网上银行进行查询。
2.对于已开通了手机网银的客户,也可登陆手机终端进行查询。
注意事项
如需要证明类的账单流水明细,请申请打印后,让打印柜员盖银行章。
打印银行流水账单后,不要随意丢弃,防止泄露个人(对公)账户信息。
二、银行流水的作用
银行流水是证明个人或公司收入情况的一种证明材料,是向银行申请贷款所必须的材料
‘拾’ 流水帐计算公式
这种流水帐很简单,错位相加减就出来了,如图,F2单元格输入计算公式=E3+C2-D2
下拉公式。