数据分析师
性别:女
电话:188-8888-8888
邮箱:email@jianli1.com 所在地:广东省珠海市
生日:2000.05
基础信息
学历:本科
学校:延边大学
专业:数据计算及应用
身体状况:健康
求职意向
意向城市:广东省珠海市
教育经历
延边大学
2014.09 ~ 2018.06
数据计算及应用
本科
主修课程:数学分析、高等代数、解析几何、概率论、数理统计、常微分方程、数据科学导论、高级语言程序设计、数据库原理、数据
结构、统计预测与决策、数据建模、数值最优化方法、数据算法与分析、应用时间序列分析、数据挖掘基础、统计推断、统计计算、机
器学习、R 语言与数据分析、Hadoop 大数据分析、数据可视化分析、多元统计分析等、概率统计、数学模型、离散数学、模糊数学、
实变函数、复变函数、微分方程、物理学、信息处理、信息编码与信息安全、现代密码学教程、计算智能、计算机科学基础、数值计算
方法、数据挖掘、最优化理论。
工作经历
上海电气集团股份有限公司
2018-2-1 ~ 2020-8-1
数据分析师
采购、生产、销售等相关业务数据分析并形成日报、周报、月报。
相关操作手册(SOP)制作。
SQL 查询及数据监控。
月末盘点及异常数据处理。
系统的新增需求分析并反馈至开发人员,以及后期的测试、上线、人员培训。
MES、ERP、WMS 异常数据分析处理。
中国建材股份有限公司
2020-9-1 ~ 2023-1-1
数据分析师
使用 pyspark.sql 从数据库中获取并处理所需数据。
计算每个创作者的相对单价及其发文量的相关系数并作为分组依据。
选取其他代表创作者和创作者视频特征的因子作为控制变量,通过因果推断得到单价增量与发文量之间的关系作为单价弹性系数。
求解线性规划模型:在不超过总预算允许浮动的范围内,求对每个创作者的单价调整方式,以最大化总发文数。
即将进行相关实验和专利申请。
项目经验
电气相关项目
2018-2-1 ~ 2020-8-1
上海电气集团股份有限公司
数据分析师
掌中云数据分析平台,是通过我掌中云旗下的 Web 端/Android/IOS 三种平台
下的小说用户的数据的基本分析,通过这些数据分析的结果,为产品以及运营测
提供有力的活动数据信息。
负责模块:
用户画像数据分析:通过不同的语言,求出用户的地域分布,性别分布,年龄
分布,充值人数的趋势,消耗人数的趋势等;
用户数据分析:包括新增用户的注册率、付费转换率、订单完成率、用户的平
均充值金额(arpu)以及付费用户的平均充值金额(arppu);
小说数据分析:通过用户的阅读行为,求出小说的阅读章节的跳出率、阅读率
等。
建材股份相关项目
2020-9-1 ~ 2023-1-1
中国建材股份有限公司
数据分析师
参与问答预测模型的设计与产出, 确定有关维基百科页面内容的真实用户问题的答案,满足提高精准度的需求。
数据处理:整合 Google 的自然问题数据库提供的 17.53GB 真实数据。采取数据清洗、采样、格式化 EDA 等预处理方式,删减
无效无意义的回答,规范数据格式。数据转化,选取不同的特征工程进行迭代。
模型实现: 在官方提供的BERT 基本模型的基础上,改进精准度,通过构建知识库,问题意图识别、段落粗筛、句子筛选、答案
抽取和排序各角度进行模型融合和迭代。模型 F1 分数 0.634,相比基准模型准确率提高 20.2%。
技能列表
Databases:一般
SQL:熟练
爬虫:良好
Mysql:精通
自我评价
持续探索学习新的数据和算法模型,并具有较好的工程实现能力。
技术栈:
深度学习框架(Pytorch、TensorFlow、Keras)、机器学习工具包(sklearn、gensim)、
数据科学工具包(pandas、numpy)、前后端工具 Linux、Docker、MySQL、RestFul、Git、Flask、Nodejs 等
熟练掌握 机器学习算法(分类、聚类、回归、决策树等)、深度学习基本算法(CNN、RNN、Transformer、GAN 等)、NLP 相
关技术(如情感分析、序列标注、问答系统、阅读理解等)