Yang's Homepage


(1)个人在社交媒体上受到新浪微博知名资深算法专家张俊林、京东科技官方账号、paperweekly官方账号、飞桨paddlepaddle官方账号、微软亚洲研究院主管研究员王晋东、AINLP官方账号、《Python3网络爬虫开发实战》作者&微软亚洲研究院工程师崔庆才、华为诺亚方舟实验室首席科学家刘群博士的关注。(2)发表20余篇学术论文,Google Scholar引用累计达到550次以上,虚假新闻检测的论文在行业内具备一定的影响力,影响因子累计达到40以上,曾是13个国际期刊(SCI)和国际会议的审稿人。(3)喜欢的格言--不积跬步,无以至千里;不积小流,无以成江海;日拱一卒,功不唐捐;骐骥一跃,不能十步;驽马十驾,功在不舍;骐骥之跼躅,不如驽马之安步

Skills

自然语言处理

ADVANCED
  • IDP
  • 抽取
  • 匹配
  • 审核
  • 比对

复杂网络

ADVANCED
  • 社团挖掘
  • 中心性
  • 鲁棒性

人工智能架构

INTERMEDIATE
  • KaaS
  • LMaaS
  • AIaaS

学术能力

ADVANCED
  • 发表文章20余篇
  • H-index:9
  • Citation:486
  • 累计影响因子40+

技术影响力

ADVANCED
  • Github 44k 收藏 1598 关注者
  • Zhihu阅读量133万 获3.7万收藏
  • 公益“寻人微博”转发万余条
  • 曾获Github Trending Top30

团队管理

INTERMEDIATE
  • nlp方向规划
  • 课题管理
  • 日常管理

Work Experience (2)

自然语言处理方向牵头人
上海浦东发展银行股份有限公司.
Apr 2019 - Now
https://www.spdb.com.cn/

全面负责浦发银行创新实验室的NLP招聘、团队方向规划、团队日常管理、相关课题管理工作。

  • Hilight 1: 组建了一支NLP团队,具备IDP、会话、图谱的自主研发能力,支撑公司200个以上场景,每年至少节省800人年以上工作量,相当于1500万人民币的成本节省

  • Hilight 2: 发表两篇期刊论文,发表会议workshop论文4篇,发表SCI论文2-3篇,形成至少46项发明专利申请,参与并主导4本“金融科技”图书的撰写工作,参与4项信通院行业标准的编写工作 Hilight 3: 探索大模型、prompt等技术在集团业务中的应用

资深数据挖掘工程师
信也科技股份有限公司.
May 2018 - Apr 2019
https://www.xinye.com/

主导了会话机器人文本纠错、主动学习风控、图风险模型探索工作,参与客服对话数据分析与运用(客服、催收)、短文本挖掘项目。

  • Hilight 1: 对用户输入的文本信息进行纠错,使得意图识别模型在96%效果的基础上再提升0.3%,编写的技术文章成为“文本纠错”入门热门文章

  • Hilight 2: 为加快公司业务在印尼业务中的“冷启动”,探索了主动学习相关技术,使得在较少用户数据的情况下,快速得到一个不错的风控模型

  • Hilight 3: 探索GNN系列技术在风控模型中的应用

Education

北京航空航天大学
自然语言处理,机器学习,人工智能
Sep 2013 - Apr 2018
Beijing
伊利诺伊大学芝加哥分校
自然语言处理,机器学习--国家公派联合培养
Sep 2016 - Aug 2017
US, IL Chicago
密歇根大学安娜堡分校
自然语言处理,机器学习--国家公派联合培养
Sep 2015 - Aug 2016
US, MI Annarbor
西安电子科技大学
复杂网络,统计机器学习
Sep 2010 - Apr 2013
Shanxi, Xi'an
西安电子科技大学
数据结构,算法,单片机等
Sep 2006 - Jun 2010
Shanxi, Xi'an

projects (6)

知识中台建设
Dec. 2021 - Present

通过“知识即服务”的理念,形成知识中台初步规划,推动浦发银行AI架构建设

  • Hilight 1: 梳理NLP相关系统、服务,形成整体规划方案

  • Hilight 2: 形成知识接入、分析、处理、管理、分享、运用的知识体系

  • Hilight 3: 推动相关平台系统的建设工作

智能文档处理(IDP)
Apr. 2019 - Present

构建智能文本审核平台系统,形成抽取、比对、审核能力,支撑公司上百个场景的应用

  • Hilight 1: 项目管理工作,系统技术方案设计与研讨

  • Hilight 2: 业务场景横向拓展,支撑76%的主要业务部门,立项业务价值达到400+人年

  • Hilight 3: 核心算法的自主掌控

任务型客服聊天机器人
May. 2018 - July. 2018

基于知识库的客服聊天机器人

  • Hilight 1: 客服机器人中的QA算法

  • Hilight 2: 魔镜杯比赛出题

  • Hilight 3: 文本纠错算法

基于主动学习的风控、数据标注项目
Aug. 2018 - Oct. 2018

Active Learning在印尼风控、数据标注项目中的探索

  • Hilight 1: 探索主动学习的应用场景

  • Hilight 2: 主动学习在印尼风控项目上的应用

  • Hilight 3: 主动学习在数据标注任务上的应用

立场(stance)检测
Jun. 2017 - Jun. 2018

评价标题与正文之间的关系:agree, disagree, discuss, unrelated

  • Hilight 1: 设计并实现Exp-pseudo-Siamese network进行立场检测

  • Hilight 2: 模型FNC-score达到93%,假新闻检测竞赛第一名仅有82%

  • Hilight 3: 对抗训练:仅需要50%的数据,FNC-Score就能达到89%

虚假新闻检测
Dec. 2016 - May. 2017

构建了行业内的知名数据集,为行业早期的虚假新闻论文

  • Hilight 1: 多分支模型的搭建,同时运用图像和文本信息,F1: 92%

  • Hilight 2: 隐式和显式特征:问号,叹号,第一、二、三人称,情感值

publications (24)

1. Yang Yang, Lei Zheng, Zhoujun Li, and Philip S. Yu, "TI-CNN -- Convolutional neural networks for fake news detection". arXiv preprint arXiv-1806.00749 (2018).
【Citation=200+】
2. Yang Yang, Tingjin Luo, Zhoujun Li, Xiaoming Zhang, Philip S. Yu. "A Robust Method for Inferring Network Structures[J]". Scientific Reports 7 (2017).
【IF=4.996 JCR=Q2 Citation=9】
3. Yang Yang, Peng Gang Sun, Xia Hu, Zhou Jun Li, "Closed walks for community detection[J]". Physica A- Statistical Mechanics and its Applications, Volume 397, Pages 129-143 (2014).
【IF=3.778 JCR=Q2 Citation=20】
4. Yang Yang, Zhoujun Li, Yan Chen, Xiaoming Zhang, and Senzhang Wang. "Improving the robustness of complex networks with preserving community structure". PloS one 10.2 (2015) e0116551.
【IF=5.917 JCR=Q1 Citation=40】
5. Zhibo Zhou, Yang Yang(co-first author), Zhoujun Li. "APSN -- Adversarial pseudo-Siamese network for fake news stance detection". Electronics. Accepted.
【IF=2.690 JCR=Q3 Citation=0】
5. Huang, F., Yang Yang., Zheng, Z., Wu, G., Mumtaz, S. "Recognizing Influential Nodes in Social Networks With Controllability and Observability[J]". IEEE Internet of Things Journal, 8(8), 6197-6204 (2020).
【IF=10.238, JCR=Q1, Citation=1】
6. Tingjin Luo, Yang Yang, Dongyun Yi, Jieping Ye, "Robust Discriminative Feature Learning with Calibrated Data Reconstruction and Sparse Low-Rank Model[J]", Applied Intelligence (2017).
【IF=5.019, JCR=Q2, Citation=6】
7. Peng Gang Sun, and Yang Yang. "Methods to find community based on edge centrality[J]". Physica A- Statistical Mechanics and its Applications 392.9 (2013) 1977-1988.
【IF=3.778 JCR=Q2, Citation=32】
8. Peng Gang Sun, Lin Gao, and Yang Yang. "Maximizing modularity intensity for community partition and evolution[J]". Information Sciences 236 83-92 (2013).
【IF=8.233, JCR=Q2, Citation=41】
9. Zhibo Zhou, Yang Yang, etal. "Image Captioning with Residual Swin Transformer and Actor-Critic[J]". Neural Computing and Applications(Accepted 2022).
【CCF C类期刊, IF=5.102, JCR=Q2】
10. Jiawei Zhang, Chenwei Zhang, Bowen Dong, Yang Yang, and Philip S. Yu, "Missing Entity Synergistic Completion across Multiple Isomeric Online Knowledge Libraries". International Joint Conference on Neural Networks (IJCNN 2019).
【Citation=3】
11. Chaozhuo Li, Senzhang Wang, Dejian Yang, Zhoujun Li, Yang Yang, Xiaoming Zhang, and Jianshe Zhou. "PPNE- Property Preserving Network Embedding". International Conference on Database Systems for Advanced Applications. Springer, Cham, 2017.
【Citation=66】
12. Chaozhuo Li, Zhoujun Li, Senzhang Wang, Yang Yang, Xiaoming Zhang, and Jianshe Zhou. "Semi-Supervised Network Embedding". International Conference on Database Systems for Advanced Applications. Springer, Cham, 2017.
【Citation=29】
13. Chaozhuo Li, Fang Wang, Yang Yang, Zhoujun Li, and Xiaoming Zhang "Exploring Social Network Information for Solving Cold Start in Product Recommendation". International Conference on Web Information Systems Engineering. Springer, Cham, 2015.
【Citation=4】
14. Xiaoming Zhang, Zhoujun Li, Senzhang Wang, Yang Yang, and Xueqiang Lv. "Location Prediction of Social Images via Generative Model". Proceedings of the 5th ACM on International Conference on Multimedia Retrieval. ACM, 2015.
【Citation=2】
15. Tingjin Luo, Weizhong Zhang, Shang Qiu, Yang Yang, Dongyun Yi, Guangtao Wang, Jieping Ye, and Jie Wang. "Functional Annotation of Human Protein Coding Isoforms via Non-convex Multi-Instance Learning". Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.
【Citation=23】
16. Yang Yang, Hu X, Liu H, et al. "Understanding and monitoring human trafficking via social sensors - A sociological approach". arXiv preprint arXiv-1805.10617 (2018).
【Citation=2】
17. Zhibo Zhou, Yang Yang(co-first author), Zhoujun Li, "APSN--Adversarial Pseudo-Siamese Network for Fake News Stance Detection". Electronics Volume 12 Issue 4 10.3390/electronics12041043. 2023.
18. Kefei Liu, Jieping Ye, Yang Yang, Li Shen, Hui Jiang. "A Unified Model for Differential Expression Analysis of RNA-seq Data via L1-Penalized Linear Regression." arXiv:1610.04078 (2016).
19. Y Jia, Z Ou, Yang Yang,SPDB Innovation Lab at SemEval-2022 Task 10 - A Novel End-to-End Structured Sentiment Analysis Model based on the ERNIE-M,Proceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022)
20. Yue Zhou, Bowei Wei, Jianyu Liu, Yang Yang,SPDB Innovation Lab at SemEval-2022 Task 3 - Recognize appropriate taxonomic relations between two nominal arguments with ERNIE-M model,Proceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022)
21. 自然语言处理在银行业的问题及趋势[J] (2022.8) 《金融电子化》
22. 金融智能在银行发展中的研究[J] (2021)《上海支付清算协会会刊》
23. 金融知识服务体系的挑战与探索[J] (2023.5) 《金融电子化》

books

《中国金融科技发展概览2021-2022》
金融科技发展联盟
2022
《中国金融科技发展概览2020-2021》
金融科技发展联盟
2021
《中国金融科技发展报告》
中国金融学会金融科技专业委员会
2021
《中国金融科技发展概览2018-2019》
金融科技发展联盟
2019

Invited_talks

浦发银行知识计算服务能力建设
知识计算白皮书发布会
2022.5

standards

《基于知识的人工智能技术及产品评估方法》信通院行业标准
2022
《智能对话平台开发与服务能力评估方法》信通院行业标准
2022
《智能对话语义评测、构建系列标准》
浦发银行信息科技部
2020

patents

第一作者发明专利申请至少3项,共同作者发明专利申请23项
2019 - 2024

hornors

先进工作者
浦发银行
2023
突出贡献个人奖
中国人工智能产业发展联盟&人工智能关键技术和应用评测重点实验室
2023
高级技术专家
北京金融科技产业联盟
2022
SCI期刊《Data & Knowledge Engineering》 优秀审稿人
Data & Knowledge Engineering
2022
大牛科浦 最受欢迎讲师 Top1
浦发信息科技部综合管理处
2022
浦江国家重点实验室重大任务清单编制研讨交流专家
浦江国家重点实验室
2022
先进工作者
浦发信息科技部
2022
第十七届中国青年科技奖候选人提名(提名)
2022
金融科技发展奖 二等奖
中国人民银行
2021.12
总行信息科技团委 优秀青年
上海浦东发展银行总行信息科技委员会
2021.5
上海市金融青年联合会第四届委员会委员
上海市金融青年联合会
2021
2020年上海青年金才
中共上海市委组织部等
2020.11
浦发X-tech创意应用大赛 一等奖
上海浦东发展银行股份有限公司总行信息科技部
2020
优秀毕业生
北京航空航天大学
2018.3
2018年度研究生发表优秀论文奖
北京航空航天大学
2018.5
SCI期刊《Physica A》 优秀审稿人
Physica A
2016
2016年度研究生发表优秀论文奖
北京航空航天大学
2016.1
国家奖学金 top 10
中华人民共和国教育部
2015.12
优秀论文奖 约20/240
北京航空航天大学
2015
出国留学人员培训结业证书
教育部
2015.1
2013-2014年度三好学生 3/53
北京航空航天大学
2014.1
优秀研究生
北京航空航天大学
2014.12
优秀论文奖 约20/240
北京航空航天大学
2014
优秀研究生
西安电子科技大学
2012.1
优秀学生标兵 2/82
西安电子科技大学
2011.1
优秀研究生奖学金 一等
西安电子科技大学软件学院
2011.12
TOEIC 职业英语水平等级证书 Level B
中国人力资源和社会保障部--职业技能鉴定中心
2011
电子设计竞赛选拔赛二等奖
西安电子科技大学
2009.6
院级优秀学生标兵 校级二等奖学金
西安电子科技大学计算机学院
2009.11
星火杯大学生课外学术科技竞赛二等奖
西安电子科技大学
2008.12
院级优秀学生 三等奖学金
西安电子科技大学计算机学院
2007.11