数据分析师

性别:女

电话:188-8888-8888

邮箱:email@jianli1.com 所在地:广东省珠海市

生日:2000.05

基础信息

学历:本科

学校:延边大学

专业:数据计算及应用

身体状况:健康

求职意向

意向城市:广东省珠海市

教育经历

延边大学

2014.09 ~ 2018.06

数据计算及应用

本科

主修课程:数学分析、高等代数、解析几何、概率论、数理统计、常微分方程、数据科学导论、高级语言程序设计、数据库原理、数据

结构、统计预测与决策、数据建模、数值最优化方法、数据算法与分析、应用时间序列分析、数据挖掘基础、统计推断、统计计算、机

器学习、R 语言与数据分析、Hadoop 大数据分析、数据可视化分析、多元统计分析等、概率统计、数学模型、离散数学、模糊数学、

实变函数、复变函数、微分方程、物理学、信息处理、信息编码与信息安全、现代密码学教程、计算智能、计算机科学基础、数值计算

方法、数据挖掘、最优化理论。

工作经历

上海电气集团股份有限公司

2018-2-1 ~ 2020-8-1

数据分析师

采购、生产、销售等相关业务数据分析并形成日报、周报、月报。

相关操作手册(SOP)制作。

SQL 查询及数据监控。

月末盘点及异常数据处理。

系统的新增需求分析并反馈至开发人员,以及后期的测试、上线、人员培训。

MES、ERP、WMS 异常数据分析处理。

中国建材股份有限公司

2020-9-1 ~ 2023-1-1

数据分析师

使用 pyspark.sql 从数据库中获取并处理所需数据。

计算每个创作者的相对单价及其发文量的相关系数并作为分组依据。

选取其他代表创作者和创作者视频特征的因子作为控制变量,通过因果推断得到单价增量与发文量之间的关系作为单价弹性系数。

求解线性规划模型:在不超过总预算允许浮动的范围内,求对每个创作者的单价调整方式,以最大化总发文数。

即将进行相关实验和专利申请。

项目经验

电气相关项目

2018-2-1 ~ 2020-8-1

上海电气集团股份有限公司

数据分析师

掌中云数据分析平台,是通过我掌中云旗下的 Web 端/Android/IOS 三种平台

下的小说用户的数据的基本分析,通过这些数据分析的结果,为产品以及运营测

提供有力的活动数据信息。

负责模块:

用户画像数据分析:通过不同的语言,求出用户的地域分布,性别分布,年龄

分布,充值人数的趋势,消耗人数的趋势等;

用户数据分析:包括新增用户的注册率、付费转换率、订单完成率、用户的平

均充值金额(arpu)以及付费用户的平均充值金额(arppu);

小说数据分析:通过用户的阅读行为,求出小说的阅读章节的跳出率、阅读率

等。

建材股份相关项目

2020-9-1 ~ 2023-1-1

中国建材股份有限公司

数据分析师

参与问答预测模型的设计与产出, 确定有关维基百科页面内容的真实用户问题的答案,满足提高精准度的需求。

数据处理:整合 Google 的自然问题数据库提供的 17.53GB 真实数据。采取数据清洗、采样、格式化 EDA 等预处理方式,删减

无效无意义的回答,规范数据格式。数据转化,选取不同的特征工程进行迭代。

模型实现: 在官方提供的BERT 基本模型的基础上,改进精准度,通过构建知识库,问题意图识别、段落粗筛、句子筛选、答案

抽取和排序各角度进行模型融合和迭代。模型 F1 分数 0.634,相比基准模型准确率提高 20.2%。

技能列表

Databases:一般

SQL:熟练

爬虫:良好

Mysql:精通

自我评价

持续探索学习新的数据和算法模型,并具有较好的工程实现能力。

技术栈:

深度学习框架(Pytorch、TensorFlow、Keras)、机器学习工具包(sklearn、gensim)、

数据科学工具包(pandas、numpy)、前后端工具 Linux、Docker、MySQL、RestFul、Git、Flask、Nodejs 等

熟练掌握 机器学习算法(分类、聚类、回归、决策树等)、深度学习基本算法(CNN、RNN、Transformer、GAN 等)、NLP 相

关技术(如情感分析、序列标注、问答系统、阅读理解等)

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注