数据分析师
性别:女
电话:188-8888-8888
生日:1999.05
邮箱:email@jianli1.com
所在地:广东省珠海市
基础信息
教育经历
中国石油大学(北京)
数据计算及应用
2014.09 ~ 2018.06
学历:本科
本科
学校:中国石油大学(北京)
专业:数据计算及应用
身体状况:健康
主修课程:数学分析、高等代数、解析几何、概率论、数理统计、常微
分方程、数据科学导论、高级语言程序设计、数据库原理、数据结构、
统计预测与决策、数据建模、数值最优化方法、数据算法与分析、应用
时间序列分析、数据挖掘基础、统计推断、统计计算、机器学习、R 语
言与数据分析、Hadoop 大数据分析、数据可视化分析、多元统计分析
等、概率统计、数学模型、离散数学、模糊数学、实变函数、复变函
数、微分方程、物理学、信息处理、信息编码与信息安全、现代密码学
教程、计算智能、计算机科学基础、数值计算方法、数据挖掘、最优化
理论。
求职意向
意向城市:广东省珠海市
技能列表
爬虫
工作经历
上海电气集团股份有限公司
数据分析师
2018-2-1 ~ 2020-8-1
Databases
Mysql
Step1:报表自动化 DashBoard(python+hql 实现)。
Step2:电销数仓分层。
将代码优化规整,调整数仓分层结构,制定数仓报表 ETL 制度。
Step3:电销部门组长以及主管 kpi 计算通过两个大方向确定考核指
标。
SQLServer
团队管理其中两大父指标按照业务线不一样细拆到 23 个子指标,
此项 kpi 报表已调整为 powerbi 展示,自动更新。
Step4:业务部分需求实现:通过和业务确定监控逻辑,现将底层报表
开发完成,在通过 powerbiortableau 进行展示。
个人优点:熟练使用 python 进行数据分析,能独立从初始代码编
写到 dashboard 的结果呈现,擅于通过数据发现问题,并思考如
何形成结果闭环的方案给到 boss 决策。
自我评价
3 年数据分析经验,独立完成数据分析全流程,
精通 R, excel 等数据分析语言,代码写作 10 万
行以上
熟练使用 Java, R, Python, Julia, SPSS,
Matlab, Atom, Gurobi, SAS,LaTex, Excel,
PowerPoint
中国工商银行股份有限公司
数据分析师
2020-9-1 ~ 2023-1-1
理论背景:概率论,数学统计,凸优化,随机
过程,动态规划,深度学习,医疗管理
通过 SQL 获取数据并对数据进行规范化处理;
优化 finreport 报告模板,输出药品不良反应数据统计分析报告;
对接扬子江、恒瑞等各大药企负责人,定期输出药品生产企业安全
性评价报告;
项目经验
电气相关项目
2018-2-1 ~ 2020-8-1
上海电气集团股份有限公司
数据分析师
项目搭建:
Hdfs MapReduceHbase Mysql Zookeeper redis
通过各个维度对医院的数据进行分析,达到更省钱,更快速,更高
效的寻找适合自己的医院
使用 MapReduce 计算框架计算各个维度每日的新增数据。
与 Hbase 连接把新增数据存入 Hbase 作为历史数据。
使用 MapReduce 计算框架计算各个维度的至于比例。
把计算后的数据比例存入 MySql 用于前台查看。
使用 Shell 脚本定时启动任务 每天重复一次。
项目总结:
更深刻的理解 MapReduce 计算框架,对于 Hbase 的使用更加的熟练,
工商银行相关项目
2020-9-1 ~ 2023-1-1
中国工商银行股份有限公司
数据分析师
研究描述: 通过研究股市的历史数据,包括新闻数据、历史的价格,研究市场与新闻文本数据之前存在的关系以及历史数据本身存
在的模式,预测市场趋势
主要工作:
课题调研,调查了解相关研究方向存在的研究方法,重复相关实验
结合深度学习与事件驱动的方法,应用 OPENIE 命名实体识别(NER),把新闻标题表示为‘实体
-关系-实体’,用两层张量网络学习事件的向量表示,用两层 CNN 结合全连接网络,做二分类
融合不同类型数据,结合基于文本的事件驱动模型与时间序列数据的 CNN 与 LSTM 模型做预测
针对时间序列特征选择,选择以 motif 频繁模式来做序列重构,在重构序列上用 CNN 做特征提
取,结合 MLP 做二分类