数据挖掘在证券客户流失分析中的应用与研究 - 图文 

上海交通大学硕士学位论文

数据挖掘在证券客户流失分析中的应用与研究

姓名:胡超申请学位级别:硕士专业:计算机技术指导教师:姚天昉;李显志

20100525

上海交通大学工程硕士学位论文 摘要

数据挖掘在证券客户流失分析中的应用与研究

摘 要

论文通过对导致证券客户流失的原因进行分析总结和指标化,并在这些指标的基础上利用合适的数据挖掘平台和数据挖掘算法对证券客户流失行为建立相应的数据模型,并将该模型应用于实际的数据分析中,达到利用该模型对未来证券客户是否将流失进行准确预测的效果。

在数据挖掘技术方面,论文通过对数据挖掘的基本理念和常用流程进行分析,从模型相似性角度选择了贝叶斯网络算法和神经网络算法,从实际建模角度选择了Waikato大学的WEKA平台,并针对证券客户流失分析主题设计了系统整体技术方案。

在流失原因分析方面,对证券交易客户的资金账户注销行为进行了分析,从客户自身属性、客户行为、客户资产和客户接受的服务四个角度分析了导致客户流失的原因,并建立了证券客户流失模型图;对涉及客户流失的50多个指标进行了分析和统一的编码管理。

在系统实施方面,首先采用每家营业部随机抽取1000个客户的采样算法,保证了数据的简约性和代表性;然后对建立的样本分别采用贝叶斯网络算法和神经网络算法进行分析,并根据最终的结果选择了贝叶斯网络算法建立的数据模型。

论文通过将建立的数据模型应用于实际的样本数据对证券客户流失进行了预测测试。测试结果表明,选择WEKA平台与贝叶斯网络算法对证券客户流失现象进行预测是合理的。

关键词:数据挖掘,证券客户流失分析,WEKA,贝叶斯网络

I

上海交通大学工程硕士学位论文 ABSTRACT

DATAMINING APPLICATION AND RESEARCH

IN SECURITIES CHURN ANALYSING

ABSTRACT

The thesis objective is to churn through the causes leading to securities customer loss and summary indicators of these reasons. Using appropriate data mining platform and data mining algorithm it churns behavior of securities and builds corresponding data model.

Related technology in data mining, data mining on the basic concepts and processes are analyzed. It chose Bayesian network algorithm and neural network algorithm and WEKA platform of Waikato University.

In securities customer churn analysis in the stock theme, it chose the trade customer as the customer source of the theme and chose customer account write-off as a loss of definition of securities. The customer's own property, customer behavior, customer assets and customer acceptance of service lead to the loss of customers for various reasons. Finally it established a securities customer churn model graph and a unified code management for more than 50 indicators.

In the system implementation, each business department with 1000 randomly selected customers of the sampling algorithm. Samples were established by using Bayesian network algorithm and neural network algorithm. System testing shows the Bayesian network algorithm establishing the most appropriate data model.

The application results show choosing of WEKA platform and Bayesian network algorithm to predict securities customer churning is reasonable.

KEYWORDS Data Mining, Securities churn analysis, WEKA, Bayesian network

II

上海交通大学工程硕士学位论文 符号说明

符号说明

Abbreviations

缩略语

Full spelling 英文全名

Chinese explanation

中文解释 商业智能 条件概率表 数据挖掘

数据抽取、转换、装载 图形用户接口 数据库中知识发现 开放数据库互连 开放式基金

BI Business intelligence CPT Conditional probability table DM Data mining ETL Extract Transform Load GUI Graphical User Interface KDD Knowledge discovery in database ODBC Open Database Connectivity OFS Open Fund Stock ★ 注:在此缩略语按字母顺序排列,并非按文中出现顺序排列。

III



联系客服:cand57il.com