【1】个人在社交媒体上受到新浪微博知名资深算法专家张俊林、京东科技官方账号、paperweekly官方账号、飞桨paddlepaddle官方账号、微软亚洲研究院主管研究员王晋东、AINLP官方账号、《Python3网络爬虫开发实战》作者&微软亚洲研究院工程师崔庆才、华为诺亚方舟实验室首席科学家刘群博士的关注。【2】发表20余篇学术论文,Google Scholar引用累计达到660次以上,虚假新闻检测的论文在行业内具备一定的影响力,影响因子累计达到40以上,曾为13个国际期刊(SCI)和国际会议的审稿。【3】喜欢的格言--骐骥之跼躅,不如驽马之安步 【4】从本科开始,除去升学和换工作的年份,几乎每年都获得荣誉称号,那是我对待自己时间的态度
全面负责浦发银行创新实验室的NLP招聘、团队方向规划、团队日常管理、相关课题管理工作。
Hilight 1: 组建了一支NLP团队,具备IDP、会话自主研发能力,支撑公司200个以上场景,每年创造数字化劳动力1000人年
Hilight 2: 推动团队形成近百项技术成果,受邀在《知识计算白皮书发布会》会上进行主题演讲,发表SCI论文2-3篇,发表期刊文章2篇,参与并主导4本“金融科技”图书的撰写工作,参与4项信通院行业标准的编写工作
Hilight 3: 探索大模型相关技术在集团业务中的应用
主导了会话机器人文本纠错、主动学习风控、图风险模型探索工作,参与客服对话数据分析与运用(客服、催收)、短文本挖掘项目。
Hilight 1: 对用户输入的文本信息进行纠错,使得意图识别模型在96%效果的基础上再提升0.3%,编写的技术文章成为“文本纠错”入门热门文章
Hilight 2: 为加快公司业务在印尼业务中的“冷启动”,探索了主动学习相关技术,使得在较少用户数据的情况下,快速得到一个不错的风控模型
Hilight 3: 探索GNN系列技术在风控模型中的应用
通过微调大模型,提升大模型生成的效果
Hilight 1: 完成大模型的选型,完成训练数据的生成
Hilight 2: 通过SFT完成大模型的效果优化
探索并设计总体解决方案,完成授信调查报告中十余种关系的抽取,使得总体F1达到0.8
Hilight 1: 完成总体方案设计,完成各阶段模型选型
Hilight 2: 协助推动团队对表格抽取、文本关系抽取的效果提升
完成外呼回听质检的技术方案设计,并优化准确率至0.9以上
Hilight 1: 完成标签体系逻辑梳理,完成模型选型
Hilight 2: 推动团队对文本切分逻辑、小样本要素的效果提升
通过“知识即服务”的理念,形成知识中台初步规划,推动浦发银行AI架构建设
Hilight 1: 梳理NLP相关系统、服务,形成整体规划方案
Hilight 2: 形成知识接入、分析、处理、管理、分享、运用的知识体系
Hilight 3: 推动相关平台系统的建设工作
构建智能文本审核平台系统,形成抽取、比对、审核能力,支撑公司上百个场景的应用
Hilight 1: 项目管理工作,系统技术方案设计与研讨
Hilight 2: 业务场景横向拓展,支撑100%的主要业务部门
Hilight 3: 复杂关系抽取等核心算法的自主掌控
基于知识库的客服聊天机器人
Hilight 1: 客服机器人中的QA算法
Hilight 2: 魔镜杯比赛出题
Hilight 3: 文本纠错算法
Active Learning在印尼风控、数据标注项目中的探索
Hilight 1: 探索主动学习的应用场景
Hilight 2: 主动学习在印尼风控项目上的应用
Hilight 3: 主动学习在数据标注任务上的应用
基于讯飞转写后的文本,完成多项任务
Hilight 1: 催收语音文本的标签--PU learning
Hilight 2: 借出语音文本的非监督短语摘要
Hilight 3: 借出语音文本的突发事件检测
评价标题与正文之间的关系:agree, disagree, discuss, unrelated
Hilight 1: 设计并实现Exp-pseudo-Siamese network进行立场检测
Hilight 2: 模型FNC-score达到93%,假新闻检测竞赛第一名仅有82%
Hilight 3: 对抗训练:仅需要50%的数据,FNC-Score就能达到89%
构建了行业内的知名数据集,为行业早期的虚假新闻论文
Hilight 1: 多分支模型的搭建,同时运用图像和文本信息,F1: 92%
Hilight 2: 隐式和显式特征:问号,叹号,第一、二、三人称,情感值
构建了一个寻人文本数据集,并发表了两篇相关论文
Hilight 1: 寻人微博机器人:微博收集,分类,转发,存储,自动问答
Hilight 2: 构建文本分类模型:稀疏学习, r-instance learning, 卷积神经网络文本分类模型
Hilight 3:微博寻人接入自动问答、信息自动发布