数据科学家

性别:女

电话:188-8888-8888

生日:1997.05

邮箱:email@jianli1.com 所在地:广东省珠海市

基础信息

教育经历

内蒙古大学

电子封装技术

2012.09 ~ 2016.06

本科

学历:本科

学校:内蒙古大学

专业:电子封装技术

身体状况:健康

主修课程:电子工艺材料、微连接技术与原理、电子封装可靠性理论与

工程、电子制造技术基础、电子组装技术、半导体工艺基础、先进基板

技术、MEMS 和微系统封装基础、表面组装技术、电子器件与组件结构

设计、光电子器件与封装技术、微电子制造科学与工程概论。

求职意向

工作经历

意向城市:广东省珠海市

上海汽车集团股份有限公司

2016-2-1 ~ 2019-8-1

数据科学家

技能列表

编写游戏环境安装、游戏项目部署、游戏服务器性能监控、mysql

主从配置、游戏日志切割、数据库备份及备份检查等脚本,并不断

根据实际情况进行脚本优化搭建 nagios 监控和 zabbix 监控服务

器,对服务器进行监控,对服务器进行优化,对 nginx、mysql、

php 等软件进行调优,保障游戏安全上线。

对运维主管联系的机房进行网络,rsync 速度进程测试,并制作测

试报告提交给公司领导。

编写游戏合服,切机、批量更新等脚本,安装游戏新服,对服务器

进行日常维护,游戏版本更新和日常维护,对游戏进程合服,切机

等操作,对游戏服务器进行监控,数据备份等数据查看,保障游戏

的正常运行。

Databases

数理统计

同声传译

PPT

搭建 nagios 监控、cacti 监控和 zabbix 监控,并自定义 zabbix 监

控项,对服务器进行监控,对服务器进行优化,对 nginx、php、

mysql 等进行调优,排错等,对游戏服务器进行监控,数据备份等

数据查看,保障游戏的正常运行。

自我评价

近 6 年⼤作经验,包括数据分析、量化风控、风

险定价,资产组合分析,拥有互联⼤⼤融⼤业风

控模型和澳⼤利亚保险⼤业定价的⼤作经验;具

有世界 50 强的⼤学教育背景和 500 强企业⼤作

经验。完整扎实的统计数学理论知识和项⼤经验

以及对机器学习的热情;通过数据分析挖掘主

导风控模型开发;多项风险产品定价项⼤;

与运营沟通,获取实时开服,更新、维护等操作要求。

中国交通建设股份有限公司

数据科学家

2019-9-1 ~ 2023-1-1

从社交媒体中提,如 twitter、instagram 等搜集用户新闻数据并

进行分析和评估。

实施并验证预测模型,为客户识别、跟踪及评估决策提供有力保

障。

数据仓库/数据集市的建模开发(AWS Redshift,gradle)根據研究

需求文档提取测试点、参与各个配置管理流程优化。

建立与测试机器,如 jenkins、maven 私服 nexus 搭配脚本的编写

及构架等。

项目经验

上汽相关项目

2016-2-1 ~ 2019-8-1

上海汽车集团股份有限公司

数据科学家

利用 Thompson Sampling, Ellison- Greedy , contextual Linear UCB实现抗凝血药的推荐算法;

利用 DQN 算法实现 Deep-mind 的 Atari 游戏端到端自动学习;

利用 REINFORCE 算法实现 OPENAI 的模拟物理环境 MUJOCO 上机器人的动作训练如 Cheetah, CartPole 的学习。

交建股份相关项目

2019-9-1 ~ 2023-1-1

中国交通建设股份有限公司

数据科学家

项目背景:公司数据仓库建设中存在各个业务的数据孤岛,需要一个统一的业务主键进行信息关联,公司以数字营销为核心,需要对

药企和医院,商品药和医生进行数据关联,一个标准化运营工具能够量化,数据偏差,规范数据录入,加强数据安全,指导数据运营

主要工作:通过爬虫获取多源异构的数据,其中利用文本分类工具筛选医院官网中的医院描述,使用规则匹配获取机构名。获取数据

名称后,初期通过手工构建特征,使用 logistics regresion 作为 baseline 获取 78%的准确率,70%的召回率;后期使用预训练模型

BERT 减少特征工程时间

在 jieba 分词的基础上,二次开发针对复合词进行二次切分,其中对一些噪声数据进行语义级别的补全和矫正。

通过核心信息的提取,进行有解释性的数据召回,在通过第三方指标(医院等级,企业信用)介入,用户行为数据(链入链出情

况),优化粗排,细排结果。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注