Yang's Homepage


【1】个人在社交媒体上受到新浪微博知名资深算法专家张俊林、京东科技官方账号、paperweekly官方账号、飞桨paddlepaddle官方账号、微软亚洲研究院主管研究员王晋东、AINLP官方账号、《Python3网络爬虫开发实战》作者&微软亚洲研究院工程师崔庆才、华为诺亚方舟实验室首席科学家刘群博士的关注。【2】发表20余篇学术论文,Google Scholar引用累计达到660次以上,虚假新闻检测的论文在行业内具备一定的影响力,影响因子累计达到40以上,曾为13个国际期刊(SCI)和国际会议的审稿。【3】喜欢的格言--骐骥之跼躅,不如驽马之安步 【4】从本科开始,除去升学和换工作的年份,几乎每年都获得荣誉称号,那是我对待自己时间的态度

Skills

自然语言处理

ADVANCED
  • IDP
  • 抽取
  • 匹配
  • 审核
  • 比对

复杂网络

ADVANCED
  • 社团挖掘
  • 中心性
  • 鲁棒性

人工智能架构

INTERMEDIATE
  • KaaS
  • LMaaS
  • AIaaS

学术能力

ADVANCED
  • 发表文章20余篇
  • H-index:10
  • Citation:660+
  • 累计影响因子40+

技术影响力

ADVANCED
  • Github 64k star 2k 关注者
  • Zhihu阅读量152+万 获3.5万收藏
  • 公益“寻人微博”转发万余条
  • 曾至少位于Github Trending Top20

团队管理

INTERMEDIATE
  • nlp方向规划
  • 课题管理
  • 日常管理

Work Experience (2)

自然语言处理方向负责人 负责20人团队的管理
上海浦东发展银行股份有限公司.
Apr 2019 - Now
https://www.spdb.com.cn/

全面负责浦发银行创新实验室的NLP招聘、团队方向规划、团队日常管理、相关课题管理工作。

  • Hilight 1: 组建了一支NLP团队,具备IDP、会话自主研发能力,支撑公司200个以上场景,每年创造数字化劳动力1000人年

  • Hilight 2: 推动团队形成近百项技术成果,受邀在《知识计算白皮书发布会》会上进行主题演讲,发表SCI论文2-3篇,发表期刊文章2篇,参与并主导4本“金融科技”图书的撰写工作,参与4项信通院行业标准的编写工作

  • Hilight 3: 探索大模型相关技术在集团业务中的应用

资深数据挖掘工程师
信也科技股份有限公司.
May 2018 - Apr 2019
https://www.xinye.com/

主导了会话机器人文本纠错、主动学习风控、图风险模型探索工作,参与客服对话数据分析与运用(客服、催收)、短文本挖掘项目。

  • Hilight 1: 对用户输入的文本信息进行纠错,使得意图识别模型在96%效果的基础上再提升0.3%,编写的技术文章成为“文本纠错”入门热门文章

  • Hilight 2: 为加快公司业务在印尼业务中的“冷启动”,探索了主动学习相关技术,使得在较少用户数据的情况下,快速得到一个不错的风控模型

  • Hilight 3: 探索GNN系列技术在风控模型中的应用

Education

北京航空航天大学
自然语言处理,机器学习,人工智能
Sep 2013 - Apr 2018
Beijing
伊利诺伊大学芝加哥分校
自然语言处理,机器学习--国家公派联合培养
Sep 2016 - Aug 2017
US, IL Chicago
密歇根大学安娜堡分校
自然语言处理,机器学习--国家公派联合培养
Sep 2015 - Aug 2016
US, MI Annarbor
西安电子科技大学
复杂网络,统计机器学习
Sep 2010 - Apr 2013
Shanxi, Xi'an
西安电子科技大学
数据结构,算法,单片机等
Sep 2006 - Jun 2010
Shanxi, Xi'an

projects (11)

基于大模型的财富研报生成
Jun. 2023 - Present

通过微调大模型,提升大模型生成的效果

  • Hilight 1: 完成大模型的选型,完成训练数据的生成

  • Hilight 2: 通过SFT完成大模型的效果优化

授信调查报告的复杂关系抽取
Jun. 2023 - Present

探索并设计总体解决方案,完成授信调查报告中十余种关系的抽取,使得总体F1达到0.8

  • Hilight 1: 完成总体方案设计,完成各阶段模型选型

  • Hilight 2: 协助推动团队对表格抽取、文本关系抽取的效果提升

外呼回听质检
Dec. 2022 - Jun. 2023

完成外呼回听质检的技术方案设计,并优化准确率至0.9以上

  • Hilight 1: 完成标签体系逻辑梳理,完成模型选型

  • Hilight 2: 推动团队对文本切分逻辑、小样本要素的效果提升

知识中台建设
Dec. 2021 - Present

通过“知识即服务”的理念,形成知识中台初步规划,推动浦发银行AI架构建设

  • Hilight 1: 梳理NLP相关系统、服务,形成整体规划方案

  • Hilight 2: 形成知识接入、分析、处理、管理、分享、运用的知识体系

  • Hilight 3: 推动相关平台系统的建设工作

智能文档处理(IDP)
Apr. 2019 - Present

构建智能文本审核平台系统,形成抽取、比对、审核能力,支撑公司上百个场景的应用

  • Hilight 1: 项目管理工作,系统技术方案设计与研讨

  • Hilight 2: 业务场景横向拓展,支撑100%的主要业务部门

  • Hilight 3: 复杂关系抽取等核心算法的自主掌控

任务型客服聊天机器人
May. 2018 - July. 2018

基于知识库的客服聊天机器人

  • Hilight 1: 客服机器人中的QA算法

  • Hilight 2: 魔镜杯比赛出题

  • Hilight 3: 文本纠错算法

基于主动学习的风控、数据标注项目
Aug. 2018 - Oct. 2018

Active Learning在印尼风控、数据标注项目中的探索

  • Hilight 1: 探索主动学习的应用场景

  • Hilight 2: 主动学习在印尼风控项目上的应用

  • Hilight 3: 主动学习在数据标注任务上的应用

借出、催收语音转写文本挖掘
May. 2018 - Oct. 2018

基于讯飞转写后的文本,完成多项任务

  • Hilight 1: 催收语音文本的标签--PU learning

  • Hilight 2: 借出语音文本的非监督短语摘要

  • Hilight 3: 借出语音文本的突发事件检测

立场(stance)检测
Jun. 2017 - Jun. 2018

评价标题与正文之间的关系:agree, disagree, discuss, unrelated

  • Hilight 1: 设计并实现Exp-pseudo-Siamese network进行立场检测

  • Hilight 2: 模型FNC-score达到93%,假新闻检测竞赛第一名仅有82%

  • Hilight 3: 对抗训练:仅需要50%的数据,FNC-Score就能达到89%

虚假新闻检测
Dec. 2016 - May. 2017

构建了行业内的知名数据集,为行业早期的虚假新闻论文

  • Hilight 1: 多分支模型的搭建,同时运用图像和文本信息,F1: 92%

  • Hilight 2: 隐式和显式特征:问号,叹号,第一、二、三人称,情感值

微博寻人公益项目--@寻人微博
Feb. 2016 - Jun. 2017

构建了一个寻人文本数据集,并发表了两篇相关论文

  • Hilight 1: 寻人微博机器人:微博收集,分类,转发,存储,自动问答

  • Hilight 2: 构建文本分类模型:稀疏学习, r-instance learning, 卷积神经网络文本分类模型

  • Hilight 3:微博寻人接入自动问答、信息自动发布

publications (24)

1. Yang Yang, Lei Zheng, Zhoujun Li, and Philip S. Yu, "TI-CNN -- Convolutional neural networks for fake news detection". arXiv preprint arXiv-1806.00749 (2018).
【Citation=240+】
2. Yang Yang, Tingjin Luo, Zhoujun Li, Xiaoming Zhang, Philip S. Yu. "A Robust Method for Inferring Network Structures[J]". Scientific Reports 7 (2017).
【IF=4.996 JCR=Q2】
3. Yang Yang, Peng Gang Sun, Xia Hu, Zhou Jun Li, "Closed walks for community detection[J]". Physica A- Statistical Mechanics and its Applications, Volume 397, Pages 129-143 (2014).
【IF=3.778 JCR=Q2】
4. Yang Yang, Zhoujun Li, Yan Chen, Xiaoming Zhang, and Senzhang Wang. "Improving the robustness of complex networks with preserving community structure". PloS one 10.2 (2015) e0116551.
【IF=5.917 JCR=Q1】
5. Zhibo Zhou, Yang Yang(co-first author), Zhoujun Li. "APSN -- Adversarial pseudo-Siamese network for fake news stance detection". Electronics. Accepted.
【IF=2.690 JCR=Q3】
5. Huang, F., Yang Yang., Zheng, Z., Wu, G., Mumtaz, S. "Recognizing Influential Nodes in Social Networks With Controllability and Observability[J]". IEEE Internet of Things Journal, 8(8), 6197-6204 (2020).
【IF=10.238, JCR=Q1】
6. Tingjin Luo, Yang Yang, Dongyun Yi, Jieping Ye, "Robust Discriminative Feature Learning with Calibrated Data Reconstruction and Sparse Low-Rank Model[J]", Applied Intelligence (2017).
【IF=5.019, JCR=Q2】
7. Peng Gang Sun, and Yang Yang. "Methods to find community based on edge centrality[J]". Physica A- Statistical Mechanics and its Applications 392.9 (2013) 1977-1988.
【IF=3.778 JCR=Q2】
8. Peng Gang Sun, Lin Gao, and Yang Yang. "Maximizing modularity intensity for community partition and evolution[J]". Information Sciences 236 83-92 (2013).
【IF=8.233, JCR=Q2】
9. Zhibo Zhou, Yang Yang, etal. "Image Captioning with Residual Swin Transformer and Actor-Critic[J]". Neural Computing and Applications(Accepted 2022).
【CCF C类期刊, IF=5.102, JCR=Q2】
10. Jiawei Zhang, Chenwei Zhang, Bowen Dong, Yang Yang, and Philip S. Yu, "Missing Entity Synergistic Completion across Multiple Isomeric Online Knowledge Libraries". International Joint Conference on Neural Networks (IJCNN 2019).
【Citation=3】
11. Chaozhuo Li, Senzhang Wang, Dejian Yang, Zhoujun Li, Yang Yang, Xiaoming Zhang, and Jianshe Zhou. "PPNE- Property Preserving Network Embedding". International Conference on Database Systems for Advanced Applications. Springer, Cham, 2017.
【Citation=66】
12. Chaozhuo Li, Zhoujun Li, Senzhang Wang, Yang Yang, Xiaoming Zhang, and Jianshe Zhou. "Semi-Supervised Network Embedding". International Conference on Database Systems for Advanced Applications. Springer, Cham, 2017.
【Citation=29】
13. Chaozhuo Li, Fang Wang, Yang Yang, Zhoujun Li, and Xiaoming Zhang "Exploring Social Network Information for Solving Cold Start in Product Recommendation". International Conference on Web Information Systems Engineering. Springer, Cham, 2015.
【Citation=4】
14. Xiaoming Zhang, Zhoujun Li, Senzhang Wang, Yang Yang, and Xueqiang Lv. "Location Prediction of Social Images via Generative Model". Proceedings of the 5th ACM on International Conference on Multimedia Retrieval. ACM, 2015.
【Citation=2】
15. Tingjin Luo, Weizhong Zhang, Shang Qiu, Yang Yang, Dongyun Yi, Guangtao Wang, Jieping Ye, and Jie Wang. "Functional Annotation of Human Protein Coding Isoforms via Non-convex Multi-Instance Learning". Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.
【Citation=23】
16. Yang Yang, Hu X, Liu H, et al. "Understanding and monitoring human trafficking via social sensors - A sociological approach". arXiv preprint arXiv-1805.10617 (2018).
【Citation=2】
17. Zhibo Zhou, Yang Yang(co-first author), Lei Zheng, Jiawei Zhang, Qingcai Cui, Zhoujun Li, and Philip S. Yu, "ATM-SN -- Adversarial Training Methods on pseudo Siamese Networks for Stance Detection".
【In review】
18. Kefei Liu, Jieping Ye, Yang Yang, Li Shen, Hui Jiang. "A Unified Model for Differential Expression Analysis of RNA-seq Data via L1-Penalized Linear Regression." arXiv:1610.04078 (2016).
19. Y Jia, Z Ou, Yang Yang,SPDB Innovation Lab at SemEval-2022 Task 10 - A Novel End-to-End Structured Sentiment Analysis Model based on the ERNIE-M,Proceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022)
20. Yue Zhou, Bowei Wei, Jianyu Liu, Yang Yang,SPDB Innovation Lab at SemEval-2022 Task 3 - Recognize appropriate taxonomic relations between two nominal arguments with ERNIE-M model,Proceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022)
21. 自然语言处理在银行业的问题及趋势[J] (2022.8) 《金融电子化》
22. 金融智能在银行发展中的研究[J] (2021)《上海支付清算协会会刊》
23. 金融知识服务体系的挑战与探索[J] (2023.5) 《金融电子化》

books

《中国金融科技发展概览2021-2022》
金融科技发展联盟
2022
《中国金融科技发展概览2020-2021》
金融科技发展联盟
2021
《中国金融科技发展报告》
中国金融学会金融科技专业委员会
2021
《中国金融科技发展概览2018-2019》
金融科技发展联盟
2019

Invited_talks

浦发银行知识计算服务能力建设
知识计算白皮书发布会
2022.5

standards

《基于知识的人工智能技术及产品评估方法》信通院行业标准
2022
《智能对话平台开发与服务能力评估方法》信通院行业标准
2022
《智能对话语义评测、构建系列标准》
浦发银行信息科技部
2020

patents

提交第一作者发明专利申请6项,共同作者发明专利23项
2019 - 2023

hornors

数据要素X大赛 宁夏分赛区专家
宁夏数据局、宁夏数据中心
2024
先进工作者
浦发银行
2023
突出贡献个人奖
中国人工智能产业发展联盟&人工智能关键技术和应用评测重点实验室
2023
高级技术专家
北京金融科技产业联盟
2022
Data & Knowledge Engineering 优秀审稿人
Data & Knowledge Engineering
2022
大牛科浦 最受欢迎讲师 Top1
浦发信息科技部综合管理处
2022
浦江国家重点实验室重大任务清单编制研讨交流专家
浦江国家重点实验室
2022
先进工作者(优秀员工)
浦发信息科技部
2022
第十七届中国青年科技奖候选人提名(提名)
2022
金融科技发展奖 二等奖
中国人民银行
2021.12
总行信息科技团委 优秀青年
上海浦东发展银行总行信息科技委员会
2021.5
上海市金融青年联合会第四届委员会委员
上海市金融青年联合会
2021
2020年上海青年金才
中共上海市委组织部等
2020.11
浦发X-tech创意应用大赛 一等奖
上海浦东发展银行股份有限公司总行信息科技部
2020
优秀毕业生
北京航空航天大学
2018.3
2018年度研究生发表优秀论文奖
北京航空航天大学
2018.5
Physica A 优秀审稿人 top 10%
北京航空航天大学
2016
2016年度研究生发表优秀论文奖
北京航空航天大学
2016.1
国家奖学金 top 10
中华人民共和国教育部
2015.12
优秀论文奖 约20/240
北京航空航天大学
2015
出国留学人员培训结业证书
教育部
2015.1
2013-2014年度三好学生 3/53
北京航空航天大学
2014.1
优秀研究生
北京航空航天大学
2014.12
优秀论文奖 约20/240
北京航空航天大学
2014
优秀研究生
西安电子科技大学
2012.1
优秀学生标兵 2/82
西安电子科技大学
2011.1
优秀研究生奖学金 一等
西安电子科技大学软件学院
2011.12
TOEIC 职业英语水平等级证书 Level B
中国人力资源和社会保障部--职业技能鉴定中心
2011
电子设计竞赛选拔赛二等奖
西安电子科技大学
2009.6
院级优秀学生标兵 校级二等奖学金
西安电子科技大学计算机学院
2009.11
星火杯大学生课外学术科技竞赛二等奖
西安电子科技大学
2008.12
院级优秀学生 三等奖学金
西安电子科技大学计算机学院
2007.11

reviewer

《Data & Knowledge Engineering》
《IEEE International Conference on Big Data》
《Frontiers of Computer Science》
《Physica A Statistical Mechanics and its Applications》
《The 33th National Database Conference》
《ACM Intelligent Systems and Technology》
《The Transactions on Knowledge Discovery from Data》
《IEEE Conference on Advances in Social Networks Analysis and Mining》
《IEEE International Conference on Healthcare Informatics》
《The 17th International Conference on Web-Age Information Management》
《International Journal of Data Mining and Bioinformatics》
《The 9th ACM International Conference on Web Search and Data Mining》
《Plos One》