数据总监
性别:女
电话:188-8888-8888
邮箱:email@jianli1.com 所在地:广东省珠海市
生日:1997.05
基础信息
学历:本科
学校:内蒙古大学
专业:工业智能
身体状况:健康
求职意向
意向城市:广东省珠海市
教育经历
内蒙古大学
2014.09 ~ 2018.06
工业智能
本科
人工智能技术、工业机器人技术、计算机程序设计(Python、Java)、智能制造信息系、工业互联网、数据库技术、机械设计基
础、物联网技术与应用等。
、高等数学,线性代数,概率论数理统计和随机过程,离散数学,数值分析,其次需要算法的积累:人工神经网络,支持向量机,遗
传算法等等算法。
工作经历
万洲国际有限公司
2018-12-1 ~ 2020-12-1
数据总监
大数据团队从无到有搭建,实现公司内部基础平台服务(bi)、交易协同前端展示。
负责大数据事业,主要工作是对 oracleebs 的运行机制和报表开发。
带领团队搭建 ha,hadoop 平台。
搭建分析体,监控并把握数据指标变化趋势。
中国通信服务股份有限公司
2021-1-1 ~ 2022-11-1
数据总监
任集团信息技术部数据团队负责人。
带领团队搭建 ha,k8s 集群。
数据分析:经营,供应链管理等流程的建立、执行。
《中国通》、《中国郎中》、《家庭健康服务平台》项目中负,产品建模。
项目经验
万洲国际相关项目
2018-12-1 ~ 2020-12-1
万洲国际有限公司
数据总监
为了解决招聘领域寻访工作重复度高,时间消耗大的问题。第一步在常规搜索引擎的基础上进行定制化开发,提高搜索效率的同
时,通过对 jd、cv 等文本信息进行抽取、分类等多种方式,达到无效简历过滤、简历适配程度排序等功能。
阶段一:职位、简历搜索系统
利用 hadoop、sparkSQL、elasticsearch 从 0 开始搭建搜索平台
基于 TF-IDF、TEXTRANK 等方法,对 jd 和 cv 进行关键字提取,建立行业关键字词库
完善 suggest 词库、分行业 stopwords 词库、同义词词库,完成自动提示,召回率提升 10%,准确率提升 13%。
阶段二:智能标注系统
创建 TextCNN、预训练模型(Bert、Enire 等)文本分类任务 baseline
创建 TextCNN+NER、预训练模型序列标注 baseline
通过对比 baseline,结合公司实际情况。选定文本分类任务为主要研究方向,节约人力标注成本 50%,确保模型效果可以短期实
现。
通过分析 badcase,进行模型优化,提升准确率 5.6%
通过对 bert 改造,将 transformer 变为 TextCNN,模型训练速度提升 60%
阶段三:人岗匹配度评价系统
建立评价体系
将其转换为文本分类任务,通过多次迭代,个别标签预测准确率接近 95%。简历通过率提高 30%
阶段四:人岗智能匹配系统
修改评价指标,由追求准确率改为更为符合现状的 nGDC,使得业务落地更加简单、更加快捷
创建 TextCNN、预训练模型文本分类任务 baseline
创建 seq2seq 生成式模型,训练生成式模型,完成多标签分类任务 baseline
通过对比 baseline,确定利用文本分类模型完成人岗智能匹配任务。
通过多次迭代,nGDC 提升 0.26。节约寻访时间约 50%
利用知识蒸馏、数据增强,在模型效果基本不变的情况下。模型预测速度提升 3 倍
中国通信相关项目
2021-1-1 ~ 2022-11-1
中国通信服务股份有限公司
数据总监
为了解决招聘领域寻访工作重复度高,时间消耗大的问题。第一步在常规搜索引擎的基础上进行定制化开发,提高搜索效率的同
时,通过对 jd、cv 等文本信息进行抽取、分类等多种方式,达到无效简历过滤、简历适配程度排序等功能。
阶段一:职位、简历搜索系统
利用 hadoop、sparkSQL、elasticsearch 从 0 开始搭建搜索平台
基于 TF-IDF、TEXTRANK 等方法,对 jd 和 cv 进行关键字提取,建立行业关键字词库
完善 suggest 词库、分行业 stopwords 词库、同义词词库,完成自动提示,召回率提升 10%,准确率提升 13%。
阶段二:智能标注系统
创建 TextCNN、预训练模型(Bert、Enire 等)文本分类任务 baseline
创建 TextCNN+NER、预训练模型序列标注 baseline
通过对比 baseline,结合公司实际情况。选定文本分类任务为主要研究方向,节约人力标注成本 50%,确保模型效果可以短期实
现。
通过分析 bad case,进行模型优化,提升准确率 5.6%
通过对 bert 改造,将 transformer 变为 TextCNN,模型训练速度提升 60%
阶段三:人岗匹配度评价系统
建立评价体系
将其转换为文本分类任务,通过多次迭代,个别标签预测准确率接近 95%。简历通过率提高 30%
阶段四:人岗智能匹配系统
修改评价指标,由追求准确率改为更为符合现状的 nGDC,使得业务落地更加简单、更加快捷
创建 TextCNN、预训练模型文本分类任务 baseline
创建 seq2seq 生成式模型,训练生成式模型,完成多标签分类任务 baseline
通过对比 baseline,确定利用文本分类模型完成人岗智能匹配任务。
通过多次迭代,nGDC 提升 0.26。节约寻访时间约 50%
利用知识蒸馏、数据增强,在模型效果基本不变的情况下。模型预测速度提升 3 倍
技能列表
数据挖掘:一般
Databases:熟练
同声传译:良好
Visio:精通
自我评价
5 年以上技术管理经验,熟悉开源大数据体系,具备公有云复杂业务场景的大数据架构能力。大数据分布式系统 10 年以上开发经
验,具备双 11 每秒数十亿消息处理能力的实时计算系统以及每秒数亿吞吐存储系统实战经验和架构能力。Apache 软件基金会成员
(ASFMember),ApacheFlink&HBase 开源社区管理委员会成员(PMCMember)。