[ 登录 ][ 注册 ] 天极传媒: 比特网 | 天极网 | IT专家网 | IT商网 | 52PK游戏网 | 手机天极 | IT分众 |

充分利用数据分析工具获益

作者: Hannah Smalltree,  出处:TechTarget, 责任编辑: 叶江, 
2007-09-03 09:29
  如果谁曾经办理过住宅按揭的文书手续的话,一定对程序中用到的成堆的表格和大量数据再熟悉不过了。在这时候,对数据分析工具的使用将会带来明显的优势……

  【IT专家网独家】对此可能没有什么人比LoanPerformance公司的员工更清楚的了。LoanPerformance公司是一家按揭风险情报公司,总部位于旧金山,属于First American Core Logic研究所的子公司,负责从按揭贷款人那里收集数据,并加以分析。负责资料目录的副主席Carlos Santiago称,该公司拥有超过一亿份住宅贷款的历史资料,银行和按揭公司利用这些数据以更好的了解他们的贷款组合和针对行业调整基准点。但是为了提供这些资料,LoanPerformance公司必须定期从它众多的客户那里抽取数据,并把数据标准化和加载到数据库里,而这些数据通常都是以平面文件的形式传输的。Santiago称,这曾经是相当费时的处理过程,直到公司安装了数据整合和数据分析软件。

  “那时候我们都是手动编写要用来说明数据的大量例行指令和脚本,并把他们编译和标准化成通用格式。”他解释道,“每次我们拿到新数据的源文件时,都好像在实施一个软件开发的项目一样。”

  这个冗长的处理过程造成了客户和未成交顾客文件的积压。因此,去年LoanPerformance开始集中搜寻抽取、转化和装载(ETL)工具,希望找到能够协助改善这一程序,提高数据整合速度的工具。Sandiago称,公司审查过的大部分ETL工具可以划分为两种截然不同的类型。如果把这些工具排成一列,位于其中一端是“皮包”类型的ETL工具,只有最基础的功能;另一端的类型则是“象枪”,或者是更坚固的平台,它们操作起来更困难,而且价格更昂贵。总部位于德克萨斯州奥斯汀的Pervasive软件公司则处在序列中间的某个位置,它的软件很好的组合了各种数据整合特征,价格公道,而且能够处理LoanPerformance海量的数据。

  LoanPerformance公司团队把他们的候选范围缩小成两个,一是Pervasive公司,另外一个是总部位于加利福尼亚州红杉城的Informatica 公司,并且运行两个工具的演示版完成了“概念性验证”。Santiago称,就是在那时候,他们发现了Pervasive工具具有数据分析的特点。数据分析工具能够利用客户化业务规则来分析数据文件,并且识别不完善的数据库区域、不连续的区域格式和其他的问题。

  “利用一个很简单的方法,你就能够抽取出以你从来没见过的格式呈现的文件,做一个分类,很快地将其编码,按一个键然后就可以自动生成所有这些信息组。”Santiago说,“要把它编码——尤其是一个含有一千万条记录的文件——本来是要需要很长的时间,要运行就需要更长的时间了。”

  Santiago称,虽然Informatic公司也能提供数据分析,但是LoanPerformance根据功能、可用性和价格综合分析,最终还是选择了Pervasive的工具。公司在去年秋天就完成了工具安装过程,现在正在运行Pervasive工具来处理新接入文件。正如大家所期待的,这个ETL工具显著的提高了数据整合的效率,处理一个平均大小的新接入数据文件所花费的时间大概是原来所用时间的四分之一。数据剖析功能也非常管用。以前没有数据剖析功能时,新接入文件里的问题可能表现的并不明显,直到错误的数据出现在LoanPerformance应用过程中才被发现。现在,提前进行数据分析能够帮助团队在新接入数据被处理之前更好的发现数据中的问题和变化。如果发现了问题,LoanPerformance把数据重新反馈给客户,这样客户就能够在产生数据的源系统中进行修正了。

  “这些数据来自我们客户的关键业务数据仓库系统。” Santiago说,“通常,他们并不知道他们获得的数据存在质量问题,他们很高兴我们能够发现这些问题。”

  Santiago说:“最终的结果是新接入数据的整合更快了,数据的质量更好了,客户服务改善了——这些都帮助LoanPerformance保持着竞争优势。”

  数据分析软件评价和实施建议

  Santiago建议:“数据整合和数据分析工具的管理界面看起来像是总体技术决策的一个小部分,但是其可用性对于每天都要把它作为日常工作的基本工具使用的人来说关系重大,而且可能会影响长远效果实现。”这就是为什么终端用户应该积极参与到软件的测评中,他说。

  虽然数据分析可能是作为一个整合项目中后续加入的工具开始应用的,就像在LoanPerformance公司中一样,Santiago还是强烈要求其他人仔细考虑它所带来益处。

  “提前进行数据分析能够节省很多浪费掉的时间和无用工。” Santiago说,“而且,它能够对下游数据的质量产生极为正面的影响。”

  TechTarget独家授权文章,严禁转载

  查看本文国际来源 >>

  • 本文关键词:

网友评论

笔名 
请您注意:遵守国家有关法律、法规,尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任。    IT专家网友拥有管理笔名和留言的一切权利。

邮件订阅