基础信息
学历:本科
学校:北京中医药大学
专业:数据科学与大数据技术
身体状况:健康
求职意向
意向城市:广东省珠海市
教育经历
北京中医药大学
2013.09 ~ 2017.06
数据科学与大数据技术
本科
主修课程:数据结构、数据库原理与应用、计算机操作系统、计算机网络、Java 语言程序设
计、Python 语言程序设计、大数据算法、人工智能、数据建模、大数据平台核心技术、数学
分析、高等代数、普通物理数学与信息科学概论、数据科学导论、程序设计导论、程序设计实
践、离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论、计算机系统
基础、并行体系结构与编程、非结构化大数据分析。
算法工程师
性别:女
生日:1987.05
电话:188-8888-8888
工作经历
中国中信股份有限公司
算法工程师
2017-2-1 ~ 2020-2-1
邮箱:email@jianli1.com
<1>沟通和梳理用户需求,编写功能说明书和技术开发文档,细化和分配开发任务,协
调相关部门完成测试和部署。
<2>参与多个跨平台数据接口项目的设计,开发,维护解决过一系列复杂数据传输、映
射、接口问题。
<3>性能调优,对数据量大,加载慢的功能定期进行数据库端优化,监控数据备份和异
常日志,及时处理异常。
<4>结合当前新技术,对系统进行升级改造,为全球客户提供更好的使用体验和技术支
持。
所在地:广东省珠海市
技能列表
CNN
HMM
<5>挖掘客户需求,争取预算,管理预算,团队建设。
国电电力发展股份有限公司
算法工程师
2020-3-1 ~ 2023-1-1
Tensorflow
Erlang
风控策略算法工程师 | 海外内容安全组
2021 年 4 月 – 至今
针对海外多个国家地区(巴西、西语、印尼、巴基斯坦、孟加拉)训练单语言预训练模型
(4 层 bert),供评论、视频
标题等多个下游任务使用。模型最终均达到 mlm accuracy约 60%
搭建和迭代海外评论治理策略体系,综合应用敏感词、语义模型、黑库相似、行为策略、
离线回溯等手段进行评论治理
搭建海外违规评论识别模型自动化更新流程,重构代码,实现数据 ETL、模型 fine-
tune、效果评估、模型上线的闭环
搭建海外评论治理报表指标体系
承接产品和运营提出的评论专项治理需求,包括:邀请码评论治理、美洲杯集卡活动评论
治理
风控策略算法工程师 | 主站生态策略组
2020 年 4 月 – 2021年 3 月
建立诈骗敏感词库(传统分词+新词发现),从诈骗帐号在平台各场景(私信、评论、视
频标题)曝光的文本语料中自
动挖掘敏感词并做排序(RFM),为线上策略提供标签
开发交易意图识别模型(albert-tiny),识别有买卖意图的私信对话,为线上私单交易反
欺诈策略提供标签
开发通用用户诈骗风险标签,基于多场景下的用户特征,训练离线 xgb 模型并每日对主站全量活跃用户进行预测,并将
输出得分通过 hive2redis 生成线上标签供策略使用
承接反欺诈专项需求,包括:海外婚恋交友诈骗治理、国内金融杀猪盘治理
项目经验
中国中信相关项目
2017-2-1 ~ 2020-2-1
中国中信股份有限公司
算法工程师
在现代搜索引擎的个性化排序与推荐中,如何把内容精准的推荐给需要的人,是大数据在推荐和精准营销中最核心的问题,本项目以
搜索引擎中基于搜索内容的用户画像为例,应用 NLP 技术来更细致精准的刻画用户属性(性别、年龄、学历),在本项目中,主要
开展的是基于搜索内容预测用户的学历(小学、初中、高中、大学、硕士、博士)。
数据探索:数据量(小学:5693;初中:37107;高中:28148;大学:18858;硕士:560;博士:354);不同学历下用户的总
搜索量、平均搜索量、搜索的内容长度、平均长度、网址数量及占比、空格数量及占比,词频及字频等;
数据处理:分词,不同的特征提取(LDA、word2vec、TFIDF、统计特征等),数据归一化,数据不平衡处理等
建模:对搜索内容进行分词以及去停用词后,使用 FastText 模型做初步预测,快速查看预测效果,然后对效果继续有针对性的根据
上面的数据处理方式扩展或者修改特征。最终使用的模型,对提取的不同特征分别建立预测模型,然后使用集成算法做最终的预测。
国电电力发展相关项目
2020-3-1 ~ 2023-1-1
国电电力发展股份有限公司
算法工程师
图像算法 SDK 项目旨在为整个创作底层多媒体能力栈提供图像处理能力。包括基础图像处理能力、美颜、美型、抠图等一些列能力。
过程中负责带领同学完成图像算法 SDK 的技术架构设计工作。以及日常开发管理工作。
图像算法 SDK 整体架构设计上汲取了 GPUImage 的一些设计思想。同时规避了 GPUImage 中的一些问题。整体效率及可用性高于
GPUImage。最终也在 B 站的粉版 App 中。完成了对 GPUImage 这个图像算法库的整体替换。成为了当前粉版 App 的底层图像算
法能力的基础组件。
同时滤镜、美颜、美型能力输出给了拍摄 SDK。让自研的拍摄 SDK 在美型,美颜、图像滤镜等方面具备了全自研能力。摆脱了对商
汤的依赖
抠图能力输出给了虚拟形象项目。是得 up 主可以从现有市面资源中快速获得虚拟形象部件的纹理。完成对形象的自定义。
自我评价
数学物理计算机竞赛全国一二三等奖,素描 8 级。本科选修了所有课程,用 matlab 实现卡尔曼滤波,用 3DCREATE 建模;研究生
选修所有数学,用 python 实现 BP 神经网络、随机数生成和马尔可夫数学模型等;学习图像处理与计算机视觉,完成 opencv 、吴
恩达和李飞飞等课程学习和论文阅读。