(1)个人在社交媒体上受到新浪微博知名资深算法专家张俊林、京东科技官方账号、paperweekly官方账号、飞桨paddlepaddle官方账号、微软亚洲研究院主管研究员王晋东、AINLP官方账号、《Python3网络爬虫开发实战》作者&微软亚洲研究院工程师崔庆才、华为诺亚方舟实验室首席科学家刘群博士的关注。(2)发表20余篇学术论文,Google Scholar引用累计达到550次以上,虚假新闻检测的论文在行业内具备一定的影响力,影响因子累计达到40以上,曾是13个国际期刊(SCI)和国际会议的审稿人。(3)喜欢的格言--不积跬步,无以至千里;不积小流,无以成江海;日拱一卒,功不唐捐;骐骥一跃,不能十步;驽马十驾,功在不舍;骐骥之跼躅,不如驽马之安步
全面负责浦发银行创新实验室的NLP招聘、团队方向规划、团队日常管理、相关课题管理工作。
Hilight 1: 组建了一支NLP团队,具备IDP、会话、图谱的自主研发能力,支撑公司200个以上场景,每年至少节省800人年以上工作量,相当于1500万人民币的成本节省
Hilight 2: 发表两篇期刊论文,发表会议workshop论文4篇,发表SCI论文2-3篇,形成至少46项发明专利申请,参与并主导4本“金融科技”图书的撰写工作,参与4项信通院行业标准的编写工作 Hilight 3: 探索大模型、prompt等技术在集团业务中的应用
主导了会话机器人文本纠错、主动学习风控、图风险模型探索工作,参与客服对话数据分析与运用(客服、催收)、短文本挖掘项目。
Hilight 1: 对用户输入的文本信息进行纠错,使得意图识别模型在96%效果的基础上再提升0.3%,编写的技术文章成为“文本纠错”入门热门文章
Hilight 2: 为加快公司业务在印尼业务中的“冷启动”,探索了主动学习相关技术,使得在较少用户数据的情况下,快速得到一个不错的风控模型
Hilight 3: 探索GNN系列技术在风控模型中的应用
通过“知识即服务”的理念,形成知识中台初步规划,推动浦发银行AI架构建设
Hilight 1: 梳理NLP相关系统、服务,形成整体规划方案
Hilight 2: 形成知识接入、分析、处理、管理、分享、运用的知识体系
Hilight 3: 推动相关平台系统的建设工作
构建智能文本审核平台系统,形成抽取、比对、审核能力,支撑公司上百个场景的应用
Hilight 1: 项目管理工作,系统技术方案设计与研讨
Hilight 2: 业务场景横向拓展,支撑76%的主要业务部门,立项业务价值达到400+人年
Hilight 3: 核心算法的自主掌控
基于知识库的客服聊天机器人
Hilight 1: 客服机器人中的QA算法
Hilight 2: 魔镜杯比赛出题
Hilight 3: 文本纠错算法
Active Learning在印尼风控、数据标注项目中的探索
Hilight 1: 探索主动学习的应用场景
Hilight 2: 主动学习在印尼风控项目上的应用
Hilight 3: 主动学习在数据标注任务上的应用
评价标题与正文之间的关系:agree, disagree, discuss, unrelated
Hilight 1: 设计并实现Exp-pseudo-Siamese network进行立场检测
Hilight 2: 模型FNC-score达到93%,假新闻检测竞赛第一名仅有82%
Hilight 3: 对抗训练:仅需要50%的数据,FNC-Score就能达到89%
构建了行业内的知名数据集,为行业早期的虚假新闻论文
Hilight 1: 多分支模型的搭建,同时运用图像和文本信息,F1: 92%
Hilight 2: 隐式和显式特征:问号,叹号,第一、二、三人称,情感值