基础信息

学历:本科

学校:北京中医药大学

专业:数据科学与大数据技术

身体状况:健康

求职意向

意向城市:广东省珠海市

教育经历

北京中医药大学

2013.09 ~ 2017.06

数据科学与大数据技术

本科

主修课程:数据结构、数据库原理与应用、计算机操作系统、计算机网络、Java 语言程序设

计、Python 语言程序设计、大数据算法、人工智能、数据建模、大数据平台核心技术、数学

分析、高等代数、普通物理数学与信息科学概论、数据科学导论、程序设计导论、程序设计实

践、离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论、计算机系统

基础、并行体系结构与编程、非结构化大数据分析。

算法工程师

性别:女

生日:1987.05

电话:188-8888-8888

工作经历

中国中信股份有限公司

算法工程师

2017-2-1 ~ 2020-2-1

邮箱:email@jianli1.com

<1>沟通和梳理用户需求,编写功能说明书和技术开发文档,细化和分配开发任务,协

调相关部门完成测试和部署。

<2>参与多个跨平台数据接口项目的设计,开发,维护解决过一系列复杂数据传输、映

射、接口问题。

<3>性能调优,对数据量大,加载慢的功能定期进行数据库端优化,监控数据备份和异

常日志,及时处理异常。

<4>结合当前新技术,对系统进行升级改造,为全球客户提供更好的使用体验和技术支

持。

所在地:广东省珠海市

技能列表

CNN

HMM

<5>挖掘客户需求,争取预算,管理预算,团队建设。

国电电力发展股份有限公司

算法工程师

2020-3-1 ~ 2023-1-1

Tensorflow

Erlang

风控策略算法工程师 | 海外内容安全组

2021 年 4 月 – 至今

针对海外多个国家地区(巴西、西语、印尼、巴基斯坦、孟加拉)训练单语言预训练模型

(4 层 bert),供评论、视频

标题等多个下游任务使用。模型最终均达到 mlm accuracy约 60%

搭建和迭代海外评论治理策略体系,综合应用敏感词、语义模型、黑库相似、行为策略、

离线回溯等手段进行评论治理

搭建海外违规评论识别模型自动化更新流程,重构代码,实现数据 ETL、模型 fine-

tune、效果评估、模型上线的闭环

搭建海外评论治理报表指标体系

承接产品和运营提出的评论专项治理需求,包括:邀请码评论治理、美洲杯集卡活动评论

治理

风控策略算法工程师 | 主站生态策略组

2020 年 4 月 – 2021年 3 月

建立诈骗敏感词库(传统分词+新词发现),从诈骗帐号在平台各场景(私信、评论、视

频标题)曝光的文本语料中自

动挖掘敏感词并做排序(RFM),为线上策略提供标签

开发交易意图识别模型(albert-tiny),识别有买卖意图的私信对话,为线上私单交易反

欺诈策略提供标签

开发通用用户诈骗风险标签,基于多场景下的用户特征,训练离线 xgb 模型并每日对主站全量活跃用户进行预测,并将

输出得分通过 hive2redis 生成线上标签供策略使用

承接反欺诈专项需求,包括:海外婚恋交友诈骗治理、国内金融杀猪盘治理

项目经验

中国中信相关项目

2017-2-1 ~ 2020-2-1

中国中信股份有限公司

算法工程师

在现代搜索引擎的个性化排序与推荐中,如何把内容精准的推荐给需要的人,是大数据在推荐和精准营销中最核心的问题,本项目以

搜索引擎中基于搜索内容的用户画像为例,应用 NLP 技术来更细致精准的刻画用户属性(性别、年龄、学历),在本项目中,主要

开展的是基于搜索内容预测用户的学历(小学、初中、高中、大学、硕士、博士)。

数据探索:数据量(小学:5693;初中:37107;高中:28148;大学:18858;硕士:560;博士:354);不同学历下用户的总

搜索量、平均搜索量、搜索的内容长度、平均长度、网址数量及占比、空格数量及占比,词频及字频等;

数据处理:分词,不同的特征提取(LDA、word2vec、TFIDF、统计特征等),数据归一化,数据不平衡处理等

建模:对搜索内容进行分词以及去停用词后,使用 FastText 模型做初步预测,快速查看预测效果,然后对效果继续有针对性的根据

上面的数据处理方式扩展或者修改特征。最终使用的模型,对提取的不同特征分别建立预测模型,然后使用集成算法做最终的预测。

国电电力发展相关项目

2020-3-1 ~ 2023-1-1

国电电力发展股份有限公司

算法工程师

图像算法 SDK 项目旨在为整个创作底层多媒体能力栈提供图像处理能力。包括基础图像处理能力、美颜、美型、抠图等一些列能力。

过程中负责带领同学完成图像算法 SDK 的技术架构设计工作。以及日常开发管理工作。

图像算法 SDK 整体架构设计上汲取了 GPUImage 的一些设计思想。同时规避了 GPUImage 中的一些问题。整体效率及可用性高于

GPUImage。最终也在 B 站的粉版 App 中。完成了对 GPUImage 这个图像算法库的整体替换。成为了当前粉版 App 的底层图像算

法能力的基础组件。

同时滤镜、美颜、美型能力输出给了拍摄 SDK。让自研的拍摄 SDK 在美型,美颜、图像滤镜等方面具备了全自研能力。摆脱了对商

汤的依赖

抠图能力输出给了虚拟形象项目。是得 up 主可以从现有市面资源中快速获得虚拟形象部件的纹理。完成对形象的自定义。

自我评价

数学物理计算机竞赛全国一二三等奖,素描 8 级。本科选修了所有课程,用 matlab 实现卡尔曼滤波,用 3DCREATE 建模;研究生

选修所有数学,用 python 实现 BP 神经网络、随机数生成和马尔可夫数学模型等;学习图像处理与计算机视觉,完成 opencv 、吴

恩达和李飞飞等课程学习和论文阅读。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注