企业邮箱 杂志订阅
文章搜索
杂志栏目
杂志栏目-> 专题\专稿
大数据时代银行资产管理业务探索
作者: 范彦君 / 时间: 2013年 11月号

随着社交网络、移动互联网、云计算等相继进入人们的日常工作和生活中,全球数据信息量呈指数式爆炸增长。以数据、资金和平台为基础的互联网金融在2013年的飞跃式发展,更是充分证实了数据的价值,使得数据真正成为一种商业资本、一项重要的经济投入,并且可以创造新的经济效益。

通过大数据分析客户行为,有助于企业在创新经营模式时更加贴近、深刻理解客户需求并做出预判,从而改善经营水平、提升经营效率,这将是今后金融机构核心竞争力所在。对于以投研和销售为核心的商业银行资产管理业务,当面临来自互联网金融企业的挑战时,如何利用大数据思维、挖掘大数据技术带来的市场潜力是当前亟需关注、思考的问题。

 

“大数据”起源及其内涵

互联网与传统行业的碰撞产生了今天全民关注的“大数据”,而大数据概念真正盛行是因为奥巴马政府在2012年高调宣布了其“大数据研究和开发计划”。美国政府希望利用大数据解决一些政府部门面临的重要的问题,该计划由横跨6个政府部门的84个子课题组成。这标志着大数据真正开始进入主流经济。

虽然大数据的概念被广泛使用,但业界仍未形成统一的定义。隶属IBM公司的TDWI(The Data Warehousing Institute)在其研究报告中首次提出了大数据的3V特性,主要是指:一是容量大(Volume),二是数据来源的多样化(Variety),三是数据源速度(Velocity)。大数据的核心内涵包括:一是跨领域数据的交叉融合。相同领域数据量的增加是加法效应,不同领域数据的融合是乘法效应。例如,对于消费者行为的分析不仅分析对于某一产品的消费,结合其他产品消费分析得到的预测性效果会更好。二是数据的流动。数据必须流动,才可能产生价值。事实上,在十多年前建立企业级数据仓库开始,企业级数据仓库的目标就是让不同部门的数据流动起来;而如果各个部门数据割裂,数据价值便得不到发挥,对大数据的有效分析才是真正的挑战。

首先,要分析与某事物相关的所有数据,而不是分析少量的随机样本。利用所有数据的分析必然要求较高的处理信息的速度和更为先进的技术。大数据分析是基于可以获得全体数据,总体即为样本。过去由于信息处理技术的受限,数据分析的准确性依赖于样本抽样的随机性,但实现抽样的绝对随机非常困难,一旦抽样存在偏见,分析结果会相去甚远。而有些分析只有使用所有数据分析方可得到结果。例如,信用卡诈骗是通过观察异常情况来识别的,只有分析所有数据才能做到,这种情况异常值才是最有用的信息,是一个大数据问题;再如,从事跨境汇款业务的公司也开始得到了大数据分析技术的支持,因为交易是即时的,所以数据分析也应该是即时的。

其次,大数据时代的数据分析允许我们接受数据的混杂性,而不再过多关注其分析数据的精确性。只有接受数据的混杂性,才可以利用95%的非结构化数据。数据的混杂性,一是指数据量之大,可能会包容了错误的数据,造成分析结果的不准确;二是格式不一致。“小数据”分析最基本的要求是在分析之前进行数据清洗达到格式一致的要求。因而大数据分析也是精确性与数据量的权衡。计算人员发现,大数据的简单算法要比小数据的复杂算法更为有效。但是对于数据混杂性的处理,要求新型数据库的诞生来弥补传统数据库设计要求数据严格一致性的缺陷。此外,因为大数据储存在不同的电脑和硬盘中,同步更新记录不甚现实,所以对于精确性要求不高的领域,允许适当错误的大数据分析不妨是一种选择。

最后,建立在相关关系分析法基础上的预测是大数据的核心。在小数据时代,分析员需要收集和选择关联物,并且在某些假设基础之上进行数据相关性的分析。而在大数据时代,较高的计算能力和互联网平台不需要人工选择关联物或建立假设基础。大数据的相关关系分析法更准确、更快且不易受偏见的影响。例如,德勤公司为中英人寿保险公司设计建立的个人风险预测模型,就利用了大数据分析技术。德勤把信用报告和顾客市场分析数据作为部分申请人的血液尿液分析的关联物,分析找出易患高血压、糖尿病和抑郁症的人;其中用来分析的数据包括好几百种生活方式的数据,比如个人爱好、常浏览的网站等。

 

大数据在金融领域的应用

银行作为金融中介的本质是解决了资金融通过程的信息不对称问题,而大数据、互联网对于金融的贡献也在于解决信息不对称和降低交易成本,也因此对传统金融机构的功能形成挑战。大数据集合海量非结构化数据,通过实时分析客户交易和消费信息进而掌握客户的消费偏好,可以准确预测客户行为,在营销和风控方面做到有的放矢。以下主要以案例形式介绍大数据在投资决策、信用评分、金融服务平台三个金融领域的应用,以及国内银行业的战略举措。

投资决策——利用微博信息预判市场走势

微博信息一般是以文本、图片、音频和视频形式存在的外部数据,具有典型的大数据特征。近年来,微博数据量迅猛增加,微博在国内出现之后,其信息扩散速度之快使其迅速成为信息交流的重要方式。

事实上,华尔街的金融分析师们已经开始使用微博信息进行大数据分析挖掘,不断找出互联网中金融微博的“数据财富”,如金融微博股民的情感信息,并进一步利用广大股民在互联网上的信息预判市场走势,取得了很大收益。这些外部的互联网数据有:一是金融机构可以根据微博中民众的情绪抛售股票;二是对冲基金根据购物网站的评论分析企业产品的销售状况;三是银行根据收集、挖掘求职网站上的岗位数量,推断就业率;四是投资机构搜集并经过文本挖掘,分析上市企业声明,从中寻找破产企业的蛛丝马迹。通过这些大数据挖掘手段,金融机构把这些大数据成功地转化成“财富”。

IBM估计,这些微博“大数据”的价值主要是时间性。快速掌握互联网信息对金融机构来说至关重要。目前,华尔街有一半金融机构已经使用了这种技术。虽然新的大数据技术应用与研究在金融领域还处于初级探索阶段,但未来的金融大数据将会包括金融数据提供方、金融数据监管者等因素,并最终成为金融业重要的基础设施之一。

信用评估应用—ZestFinance的探索

ZestFinance从本质上来看是一家数学企业,它精通于数据计算、分析和逻辑。其创始人之一梅里尔曾是谷歌前CIO,在麾下65人团队中,大部分是数据科学家。他们开发了数十个基于学习机器的分析模型,对每位贷款申请人拥有的上万条原始信息数据进行分析,并得出超过几千个可对其行为做出预测的指标,而这一过程在5秒钟内就能全部完成。与传统信用评分模型使用的1015条数据相比,该公司能够更精准地评估借款人的信用风险。

ZestFinance目前是为次级贷款者提供担保服务的第三方机构,其退出直接借贷业务是为了避免和新的合伙人竞争。ZestFinance创始人由于在信用评分和数据挖掘方面的丰富经验和最近得到的投资资金,ZestFinance在利用和继续研发大数据技术解决信用担保问题上具有巨大的优势。但同时也面临着监管风险,如危机后监管部门对次级贷款的严格监管以及利用大数据进行信用评估触及了消费者保护法的红线等。可以预见,将机器算法与人工预测相结合的信用评分法会进一步应用到金融领域其他相关业务的信用风险评估中。

基于大数据的金融服务平台——以Bankrate(银率网)为例

1976年成立的“Bank Rate Monitor”原是一家金融出版公司,1996年开始在线运行。如今Bankrate是一家全球领先的个人金融产品信息服务公司,凭借其资深的金融编辑、优秀的分析师团队,Bankrate对全美、加拿大及中国境内约5600多家金融机构的金融产品进行实时跟踪调研,通过其网站“Bankrate”在线向消费者提供及时、客观、全面的金融产品查询及190多种个人理财计算器,金融产品数据高达32.6万多款,内容涉及房贷及各类个人贷款、银行卡、理财产品、储蓄与国债、黄金、基金、保险、外汇等多个专栏。除了提供实时更新的金融产品数据信息,Bankrate还通过原创的个人理财故事帮助消费者增强理财观念,把握投资方向。Bankrate这种将原创的个人金融资讯、金融产品查询及个人理财计算器集合于同一平台服务的形式,不仅时刻影响消费者理财决策的每个环节,赢得广大消费者的信赖,同时也为金融机构搭建了直接有效的精准营销平台,使得金融机构能够在潜在用户群中有效推广自身的产品与服务,并降低营销成本。

Bankrate的成功,一是依托了专业化的金融研究团队和独特的网络平台;二是依托平台细分客户和推送信息的精准营销模式,获得了各金融机构和监管部门的认可,也成为了消费者信赖的金融产品超市和金融产品数据的信息源。

目前国内金融平台模式主要是两类,一类是只提供搜索和销售的金融产品销售平台,另一类是以阿里金融为代表的互联网企业,依托购物网集投融资、消费、支付系统为一体的互联网金融平台。该类平台服务人员多数是互联网行业出身,多数产品只停留在客户体验方面;相比金融机构建立的互联网金融平台,其后台风控和投研能力有所不足。随着客户群体更加专业化的需求以及利率市场化的深入推进,以银行为主导的电商平台或是信用卡服务平台将逐渐凸显其投研和风控优势。

 

大数据时代国内银行业举措

大数据时代,信息价值体现方式及获取方式都发生了根本变化,过去以提供信用服务为主的银行业正在面临信息脱媒的挑战,也不再是经济关系的信息中心。银行必须提高对于非结构化数据收集、存储、分析和运用的能力和效率,方可适应瞬息万变的金融市场。面对外部的冲击和挑战,目前国内同业积极发挥自身优势,逐步开始实施适应各行优势业务的互联网金融与大数据金融战略举措,并取得了初步的成效。具体市场探索归纳如表1

随着大数据在金融领域的广泛应用和发展,未来银行业有可能发展成为智能型银行。例如,在光大银行的未来规划中将提供具有身份识别功能的定制化信息推送、视频客服和自动发卡服务。而信息化银行作为工商银行的重要战略方向,打造大而全的电商平台成为目前重要的举措之一。工商银行的电商平台将具有融资、消费信贷等功能,并将充分发挥其拥有大量资质较高的大企业和强大信息系统的优势,成为集供应链金融与互联网金融于一体的电商平台。

目前商业银行信息库中主要的数据为结构化数据,非结构化数据通过Hadoop系统应用到信息发布层,而非结构化数据的应用与整合尚处于规划阶段。HadoopApache软件基金会开发的开放源代码并运行运算编程工具和分布式文件系统,能够以可靠、高效、可扩展和高容错的方式对大量数据进行分部处理的软件框架。它可以维护多个工作数据的副本,确保能够对失败的节点重新分部并处理。

由于大数据挖掘在银行业尚处于起步阶段,技术也并不成熟,因此商业银行对于大数据的应用普遍采用外购系统。就工商银行而言,其信息化银行的建设将着力于加快建立集团信息库,同时将社交媒体信息等行内外各类非结构化数据入库,并在非结构数据挖掘平台实现对客户行为、信息等数据的分析,届时非结构化数据有望应用到全行的营销、客户管理和风控系统之中。

 

大数据时代的资产管理业务

尽管大数据的应用在技术方面仍存在许多挑战,例如如何探索大数据复杂性和不确定性特征描述方法及大数据的系统建模、如何对数据进行“二次挖掘”等,应用也尚处于摸索阶段。但我们仍可借鉴大数据思维方式和新的数据挖掘技术提高商业银行资产管理业务的产品开发、销售和管理能力。

充分利用集团信息库进行资产管理业务信息挖掘

商业银行信息化平台的最终目标是要建成非结构化信息的统一检索、集中共享与综合应用的平台,面向全行提供信息检索和挖掘服务,并与数据仓库中结构化信息相互配合、互为补充,形成面向客户和应用的信息资源整合。因此,资产管理业务应充分利用集团信息库进行信息挖掘。

首先,信息化平台打通了银行内部已有的各个数据仓库,实现了原有的结构化数据的流动,进而资产管理业务可将原有结构化数据仓库及其他部门的研究成果应用到投资管理实践中;其次,在实现了非结构化数据集中共享之后,可将与资产管理业务相关的各类外部数据,如客户外部信息、微博信息、销售信息、价格信息等整合到信息平台,利用Hadoop模块对于各类非结构数据进行“数据清洗”和“打标签”,为资产管理业务的客户营销、投资管理、风险管理等提供有效支持。

创建多元化理财产品销售渠道和营销模式

精准营销是大数据时代的主要特点之一,对于资产管理业务而言,真正达到精准营销需要利用大数据技术打通内外部数据,分析客户需求和客户流失的原因,有的放矢地进行销售和市场预测,并及时调整产品及销售战略。营销的过程始终不会离开“人”的因素,包括营销的受众、推动和评估,而互联网营销很好将其结合并凸显了移动化、智能化、感知化和精准化等特点。

因此,大数据背景下资产管理业务发展应多元化理财产品销售模式:一是拓宽渠道,包括利用电商直销平台、微信银行、微信推送信息、第三方销售平台等方式扩大投资群体,同时加入客户评价和推荐功能。二是针对机构投资主体或是大客户,建立客户信息库,及时跟踪大客户和机构客户在投资和消费方面的偏好变化,同时培养资产管理部门自己的销售队伍。通过针对性的产品设计和营销、实时地推送和推荐,减少客户流失和增加潜在客户。三是做好市场预测。利用大数据进行预测是大数据挖掘的核心,营销部门应利用信息平台优势、结合同业市场产品动向,及时向后台反馈销售变化预警信息,辅助中后台实现迅速有效的流动性管理和风险管理。

探索基于大数据挖掘的量化投资策略

资产管理业务涉及的投资市场和领域广泛,涵盖了国内外市场可以投资的所有金融产品,因此投资策略中对套期保值和风险管理的要求也日渐增加,量化投资策略的作用也逐渐受到关注。商业银行可以探索将微博的作用加入到量化投资决策中,同时利用非结构化信息平台开发新型的简单易行的投资策略模型。

一般来说,数据库形式的金融数据挖掘分为两类,一是银行历史数据挖掘,另一类是证券数据挖掘。资产管理业务的数据挖掘既涉及对融资人的信用评估,又包括证券市场的数据挖掘。以股票投资为例,基于大数据挖掘的量化投资方法主要有两类应用,一类是上述案例中利用网络信息预测金融市场价格,印第安纳大学的著名学者约翰·博伦和毛慧娜的实证研究表明,分析师将Twitter中的情感表现加入神经网络模型进行分析预测,发现预测准确率上升了18.3%,绝对平均误差下降了6.5%。二是基于粗糙集(Rough set)的股票价格预测方法。该理论的核心思想是在稳定分类能力不变的情况下,通过约简得到分类规则或问题的决策分类,从不完整、不充分的信息中挖掘数据中隐含的有价值的规律。此外,债券投资也可以对全体债券样本进行神经网络分析进而得到债券评级,为投资决策服务。

开发基于大数据挖掘的信用风险评分法

传统的信用风险评分法是利用历史违约样本通过本地化的数据挖掘,结合定性分析得到信用评分的代表性指标的过程。而宏观经济不确定性、客户需求的多元化正在考验着商业银行及资产管理业务的风险管理能力,并对传统信用评分法的准确性提出了更高的要求。在资产管理业务中,占有多数份额的项目融资非标资产需要资产管理人员对融资人进行信用评价。由于资产管理业务是完全不同于商业银行信贷业务的契约模式,除了可以参照银行信贷审批系统和信贷标准之外,项目审批人应该建立一套有别于传统信用评分模式、适合资产管理业务特征的项目融资信用评价体系。因此,借鉴Zestfinance评分模式,基于银行信息平台对融资人进行信用风险评估的大数据挖掘方法,如神经网络信用评分法与支持向量机(SVM)信用评分法,可能将成为未来金融领域信用评分的新趋势。其中,支持向量机的信用评分在解决小样本、非线性及高维模式识别中具有一定优势。目前,结合支持向量机和模糊系统的机器学习方法正在成为继神经网络研究之后新的研究热点,并逐渐应用在系统识别、生物信息和行为科学以及金融等领域。Zestfinance便是将机器学习法首先开发应用于贷款违约主体信用评分体系中的金融机构。

利用数据挖掘进行流动性管理

随着利率市场化的深入,资产管理业务将面临愈加严峻的流动性风险,也要求更高的流动性风险管理技术。区别于传统银行业的流动性风险管理技术,资产管理业务流动性管理要求更加准确的市场预测,包括对政策风险、客户偏好、销售业绩和同业竞争等信息的全面把握和分析预测,同时及时调整投融资策略。大数据挖掘采用非结构化数据的分析技术,符合了资产管理业务流动性管理的多样需求。因此,在资产管理业务中,流动性管理可以说是大数据理念最为简单易行的实践。阿里金融使用大数据分析进行流动性管理的实践为业内提供很好的借鉴,理财业务也应充分利用现有的资源和平台,发挥数据优势,开发建立在全行信息平台基础上的流动性管理系统,提高监测和预警准确性,进一步提升流动性管理水平。

随着信息化银行的推进和大数据技术的蓬勃发展,资产管理业务的发展既有机遇也面临着一定挑战。正如工商银行资产业务总监陈晓燕所强调:“资产管理业务没有创新,便无法生存。”在大数据时代,资产管理业务的创新应是全面的创新,包括产品创新、销售管理创新、投融资方式创新、金融数据挖掘方法的创新以及后台理财业务流动性风险管理、投融资信用风险管理等涵盖资产管理业务前中后台各个方面的创新。这与其说是信息技术带来的革命,不如说是一次理念和思维的转变。

(作者单位:中国工商银行)