商业智能的数据库管理探讨
商业智能的基本原理就是分析过去预测未来,本文从数据库管理的角度出发,细观商业智能技术的演变历程,纵览现实世界里数据库技术是如何影响我们对这些海量可视化数据的操纵过程,看看如今的数据库管理系统如何帮助商业智能专家统筹、收集数据,构建有效的预测模型,并探讨一下商业智能的成本问题……
【IT专家网独家】商业智能的基本原理就是分析过去预测未来,本文从数据库管理的角度出发,细观商业智能技术的演变历程,纵览现实世界里数据库技术是如何影响我们对这些海量可视化数据的操纵过程,看看如今的数据库管理系统如何帮助商业智能专家统筹、收集数据,构建有效的预测模型,并探讨一下商业智能的成本问题。
商业智能系统的数据库管理
把客户数据用于市场分析早在美索不达米亚人把橄榄油和其他商品销往古希腊帝国的买卖市场中就得到应用。从美索不达米亚粘土片到今天的现代用户数据库管理系统,数据存储的基础介质早就发生了巨大变化,不过商业智能和数据挖掘的目标还是亘古不变的。
商业智能的基本原理就是通过分析过去预测未来,把关联的客户群分组归并,你就能够开发出精密度和准确度极高的预测模型,每年能够帮助你节省数十亿美元的广告费用。同时,为消费者提供具有针对性的营销服务能最大程度满足消费者的需求。
商业智能并不仅限于地区性市场营销和销售活动。医院根据患者的年龄和病症把他们分为不同的组别,进而分析治疗方法以便确定对特定患者群的最佳治疗方针。
尽管商业智能的应用能够“拯救生命”,但是商业智能技术也引发了广泛的社会问题,最重要的便是数据隐私问题。随着对消费者的监测行为越来越普遍(试想,商场是怎样通过您手中的会员卡控制您在超市的购买行为的),于是很多隐私保护主义者不愿意连我们无伤大雅的日常行为都被记录在案。
所幸的是,大多数消费者并不关心你是喜欢西红柿还是更钟爱马铃薯,他们允许销售点系统随时追踪采购行为。通过会员卡的推广,商业智能专家能够把个人消费行为与其统计背景资料紧密联系起来。当消费者申请会员卡的时候,他们会提供基本的个人资料;反过来,商业智能专家会把这些资料和公开获得的有关主要生活资讯和收入信息(例如,有没有房,已婚还是单身、有没有孩子等等)一起加以分析。因此,数据库不仅仅拥有关于客户购买了什么产品的详细信息,还包括购买这些产品和服务的客户个人基本信息。
由于技术在不断变革,数据存储问题一直以来都是商业智能的重中之重。硬盘的价格每年都不断下跌,在上世纪八十年代,1.2GB容量的存储硬盘成本可能高达20万美元,而今天,用不到1000块人民币就能买到上百GB容量的硬盘。鉴于我们现在用很低的成本就能存储海量的实证信息,商业智能管理人员在某种程度上就能够清洗和操纵这些数据,并通过这种方法构建精确的预测模型。
下面我们会从数据库管理的角度出发,细观商业智能的演变历程,纵览现实世界里数据库是如何影响我们对这些海量的可观测数据的操纵过程。
数据——预测工具
就像前文所述,人类数百年来年前就一直在利用数据分析预测消费者未来的购买行为和其他一些重要事务(如医疗项目)的行为。数百年来,用于分析预测数据的统计方法不断得到改进,数据挖掘分析技术使我们能够相对准确地预测特定的大众群体行为及其内在机制。我们来看看耶鲁大学的教授Ian Ayres在其著作《超级运算器》(Super Crunchers)是怎么探讨这个有趣的概念的。
Ayres教授在书中描述了数据如何替代人类直觉应用在商业智能的众多领域。现在,大家都知道大公司的顶级CIO和CEO每年能为公司赚取数以亿计的利润,大部分靠的是他们的直觉。大部分人往往都认为在任何决策任务中,计算机只能管理好高度结构化的那部分数据。我们常常把这些结构化信息系统分成不同类别:
专家系统——专家系统就是那些将决策任务中高度结构化的组分加以量化,能够在没有人类(专家)的干预下提出建议的系统;其中最具代表性的系统就是MYCIN。MYCIN是上世纪70年代由美国斯坦福大学开发的分析工具,用来帮助医生对血液感染疾病患者进行诊断,并选用合适的药物治疗。该专家系统利用患者病史、症状和化验结果等原始数据,运用医疗专家的知识进行逆向推理,对感染可能性进行量化,找出病根。我们可以同样的方法应用于商业管理的各个领域,包括数据库管理系统本身。本世纪初期,Oracle数据库管理管理员就能够使用Oracle数据挖掘和自动化工作量信息库(AWR,被称为数据库的数据仓库,用来存储数据库本身的信息)等工具来过滤数据库元数据和性能数据,并提前预测数据库管理系统中的资源耗费趋势,帮助系统做出自我管理决策。
决策支持系统(DSS)——决策支持系统承认人类直觉在制定决策的过程中扮演着重要角色,因此决策支持系统技术不像专家系统那样直接下达解决问题的论断。相反,决策支持系统为决策者提供问题的相关信息,分析工具和分析环境,帮助决策者提高决策水平,而把实际决策过程留给决策者(专家)自己实施。因此,决策支持系统起到的是辅助决策者的作用。决策支持是信息系统的一个重要概念。
有一个有趣的现象值得我们关注:不少信息系统一开始被认为是决策支持系统,最后却变成了专家系统。举个著名的例子,某饮料制造商想要让一个为其服务了四十年之久的员工卸任,不过只有这个员工熟悉公司所有罐装饮料配方和复杂工艺。制造商决定创建一个决策支持系统以便使公司在没有这名员工的情况下仍然照常运作。一开始,决策分析师利用几个月的时间对该雇员进行提问测试以便为这个决策支持系统提供决策规则,最后发现曾经被分析师认为是直觉的东西实际上却是对一大堆高度结构化决策规则的运用;要知道,当这个罐装饮料专家用“我觉得问题在于……”这样的语句回答问题时,对于那些缺乏专业知识的观测者来说,似乎是出于直觉的回答。实际上,这只是罐装饮料专家用来表达一个已经遗忘很久的决策规则,或者说是对他所遗忘的知识所做的经验式回应。最后对于这个决策支持系统的应用实际上变成了专家系统。而这位四十年工龄的老员工也舒舒服服的退休了,他多年积攒下来用做决策规则的知识实际上被量化了,用来帮助这个饮料公司在没有他在的情况下继续做出更快速更好的决策。
商业智能预测的应用
数据挖掘概念的提出使我们能够做的远不止预测某个消费者的购买行为。像Amazon这样的公司率先提出了“推荐引擎”的概念,用来分析已知消费者的行为模式,为他们在线推荐其他产品,对他们未来的购买计划提供个性化的建议。其他很多网页式界面网站也都纷纷采用了这种技术,用来引导消费者连接到具有相似兴趣的人可能会感兴趣的相关娱乐产品和服务。
数据挖掘得到应用的另外一个案例便是银行贷款专员。传统上,所有的银行贷款专员用的都是同一套数据,但是,总有一些专员的业绩和表现比另外一些要好。这可以归咎于人类的直觉,贷款专员就是凭借这种直接而不是根据量化的特征来判断客户是否会偿还贷款的倾向。
- 本文关键词:

