首发集团智慧交通大数据中心筹备组负责人,经管之家(原人大经济论坛)大数据培训中心负责人,统计学专业博士,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文。
Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。
具有10年大企业项目经验,现任职于耐克体育中国有限公司,担任大数据分析职位。先后参与过《基于日月光半导体制造业大数据分析挖掘》,《E消费会员忠诚度分析》,《基于罗宾逊全球物流可视化分析》等项目。
现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场\业务\财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。
CDA LEVEL II大数据分析师等级考试命题组组长,曾就职于电子科技大学大数据中心,从事医疗大数据分析相关工作,拥有丰富的海量数据分析经验、算法研发经验、省级数据平台搭建经验,拥有算法专利若干,主要研究方向为机器学习和深度学习。
精通Java编程 Python语言等。具有9年项目开发经验,多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。独立或带团队完成互联网、电信等多个大型项目。
深度学习神经网络领域。多年开发研究经验,精通算法原理与编程实践。曾完成过多项图像识别,目标识别,语音识别的实际项目,经验丰富。关注深度学习领域各种开源项目,如TensorFlow,Caffe,Torch等。
现任职于南京上度市场咨询有限公司,人大经济论坛数据处理中心数据分析顾问,SAS、SPSS 软件讲师、中国学习路径图国际中心技术顾问。曾参与2012 国家宏观经济预测、中国城镇居民家庭投资调查、泸州老窖目标管理与绩效考核、中国卫生状况调查、江苏广电 CRM 数据挖掘等大型数据处理项目。
案例介绍:基于用户用电行为典型数据,分析用户用电行为轨迹,抽象用户用电 特征,输出用户群体的聚类分析结果和典型行为特征。
技能涉及:电力工业统计基础知识,用电负荷特性指标,数据清洗、归一化处理、 聚类程序开发、结果分析。
案例介绍:将所有数据导入到 mysql 中,同时 hive 中,并编写 spark 程序, 统计出每天的交易额,并输出到 mysql 中,hive 中的数据, 编写 spark 程序,使用漏斗模型统计分析出某日数据增加的原因。
技能涉及:1 检查集群、节点、索引的健康情况 2 管理集群、节点,索引数据、元数据 3 执行CRUD,创建、读取、更新、删除 以及 查询 4 执行高级的查询操作,比如分页、排序、脚本、聚合等
案例介绍:使用Flume来完成Apache服务器日志收集工作,并自动上传到指定的HDFS系统中存储,使用MapReduce将HDFS中进行数据清洗,使用Hive对清洗后的数据进行统计分析,使用Sqoop将Hive统计后的数据导出到关系型数据库MySQL,数据可视化技术呈现分析结果。
技能涉及:Hadoop是个可靠的、可伸缩的存储和分析平台,主从架构:1台NameNode,多台DataNode。在map阶段,通常执行输入格式解析、投影(选择相关的字段)和过滤(删除不感兴趣的记录),reduce阶段,一个聚合或汇总的阶段。在这个阶段,map阶段的输出被聚合以产生期望的结果。
案例介绍:使用Flume来完成Apache服务器日志收集工作,并自动上传到指定的HDFS系统中存储,使用MapReduce将HDFS中进行数据清洗,使用Hive对清洗后的数据进行统计分析,使用Sqoop将Hive统计后的数据导出到关系型数据库MySQL,数据可视化技术呈现分析结果。
技能涉及:Hadoop是个可靠的、可伸缩的存储和分析平台,主从架构:1台NameNode,多台DataNode。在map阶段,通常执行输入格式解析、投影(选择相关的字段)和过滤(删除不感兴趣的记录),reduce阶段,一个聚合或汇总的阶段。在这个阶段,map阶段的输出被聚合以产生期望的结果。
上百家合作企业高新推荐就业,将求职简历推送至目标名企,简历直达HR、技术经理,免去申请环节!
经管之家CDA LEVEL Ⅲ数据科学家认证证书,行业顶尖人才认证,已获得IBM大数据大学,中国电信,苏宁,德勤,猎聘,CDMS等企业的认可。
CDA认证是根据商业数据分析专业岗位设立的一套体系化、科学化、正规化的人才标准。全国统考、专家命题、评分公平、流程严格,更具含金量。
持证人享有系列特殊权益。证书皆绑定考生真实身份,可在CDA官网查询,确保唯一性与防伪性。证书三年审核一次,保证持证人的实力与权益。
1.可吸纳为CDA Institute、中国数据分析师(CDA)俱乐部会员,活动中具有优先报名参与权。 2.可优先获得CDA内部就业及职业发展推荐。 3.免费参与CDA举办的中国数据分析师行业峰会、大数据峰会、研讨会等各项活动,Level Ⅱ与Level III持证人享受特权位置。 4.可申请加入CDA数据分析项目组,参与项目合作(提供项目给持证人演练)。 5.CDA Level Ⅰ持证人免费享受员服务6个月(价值588 RMB),Level Ⅱ与Level III持证人免费享受peixun.net会员服务1年 (价值998 RMB);
CDA大数据就业班最新课程采用基础班+进阶课程+案例实战,每天6小时上课和2小时晚自习,赠送全套录播视频可以反复观看,学习中的疑问也有内部交流群。
学习大数据课程计算机内存推荐为 16G (享受飞驰的感觉),至少8G。CPU推荐四核八线G。关于内存是考虑了spark对内存的需求较大,大数据其他组件内存需求会低一些。关于开发工具:推荐pyspark使用jupyter notebook,Scala使用 IntelliJ IDEA 社区版,python脚本可以使用pycharm。
Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快的进入了这个行业,成为了最先的大数据分析师。但IT人士的宿命就在于他们太IT了,他们热衷于计算更快、处理更高效的程序设计,而忽略了大数据分析的本意,为企业带来商业价值,因此他们只能是大数据分析工程师,而正真的大数据分析师应当了解和熟悉hadoop技术架构和算法设计,但不必成为一个优秀的JAVA程序员。
普通的数据分析师具有一定的数理统计基础,熟悉业务逻辑,能熟练地操作传统的数据分析软件,能使数据成为企业的智慧。他们通常遇到的都是一些结构化、体量小的小数据。而大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如Hadoop、Spark等软件。

