Jing Liu - Baidu

Selected Publications (2023–present)

2026

BEE-RAG: Balanced Entropy Engineering for Retrieval-Augmented Generation

AAAI 2026

Yuhao Wang, Ruiyang Ren, Yucheng Wang, Jing Liu, Wayne Xin Zhao, Hua Wu, Haifeng Wang

[arXiv]

2025

Reinforced Informativeness Optimization for Long-Form Retrieval-Augmented Generation

Preprint

Yuhao Wang, Ruiyang Ren, Yucheng Wang, Wayne Xin Zhao, Jing Liu, Hua Wu, Haifeng Wang

[arXiv]

Unveiling Knowledge Utilization Mechanisms in LLM-based Retrieval-Augmented Generation

SIGIR 2025

Yuhao Wang, Ruiyang Ren, Yucheng Wang, Wayne Xin Zhao, Jing Liu, Hua Wu, Haifeng Wang

[arXiv]

Self-Calibrated Listwise Reranking with Large Language Models

WWW 2025

Ruiyang Ren, Yuhao Wang, Kun Zhou, Wayne Xin Zhao, Wenjie Wang, Jing Liu, Ji-Rong Wen, Tat-Seng Chua

[arXiv]

Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation

COLING 2025

Ruiyang Ren, Yuhao Wang, Yingqi Qu, Wayne Xin Zhao, Jing Liu, Hao Tian, Hua Wu, Ji-Rong Wen, Haifeng Wang

[arXiv]

2024

REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering

EMNLP 2024

Yuhao Wang, Ruiyang Ren, Junyi Li, Wayne Xin Zhao, Jing Liu, Ji-Rong Wen

[arXiv]

BASES: Large-scale Web Search User Simulation with Large Language Model based Agents

EMNLP 2024

Ruiyang Ren, Peng Qiu, Yingqi Qu, Jing Liu, Wayne Xin Zhao, Hua Wu, Ji-Rong Wen, Haifeng Wang

[arXiv]

Dense Text Retrieval based on Pretrained Language Models: A Survey

ACM TOIS 2024

Wayne Xin Zhao, Jing Liu, Ruiyang Ren, Ji-Rong Wen

[arXiv]

2023

TOME: A Two-stage Approach for Model-based Retrieval

ACL 2023

Ruiyang Ren, Wayne Xin Zhao, Jing Liu, Hua Wu, Ji-Rong Wen, Haifeng Wang

[arXiv]

SMoA: Sparse Mixture of Adapters to Mitigate Multiple Dataset Biases

ACL 2023 Workshop (TrustNLP)

Yanchen Liu, Jing Yan, Yan Chen, Jing Liu, Hua Wu

2022

DuReader_retrieval: A Large-scale Chinese Benchmark for Passage Retrieval from Web Search Engine

EMNLP 2022

Yifu Qiu, Hongyu Li, Yingqi Qu, Ying Chen, Qiaoqiao She, Jing Liu, Hua Wu, Haifeng Wang

[data] [code]

DuReader_vis: A Chinese Dataset for Open-domain Document Visual Question Answering

Findings of ACL 2022

Le Qi, Shangwen Lv, Hongyu Li, Jing Liu, Yu Zhang, Qiaoqiao She, Hua Wu, Haifeng Wang, Ting Liu

[data]

DuQM: A Chinese Dataset of Linguistically Perturbed Natural Questions for Evaluating the Robustness of Question Matching Models

EMNLP 2022

Hongyu Zhu, Yan Chen, Jing Yan, Jing Liu, Yu Hong, Ying Chen, Hua Wu, Haifeng Wang

[data] [code]

2021

RocketQAv2: A Joint Training Method for Dense Passage Retrieval and Passage Re-ranking

EMNLP 2021

Ruiyang Ren, Yingqi Qu, Jing Liu, Wayne Xin Zhao, Qiaoqiao She, Hua Wu, Haifeng Wang, Ji-Rong Wen

[code]

PAIR: Leveraging Passage-Centric Similarity Relation for Improving Dense Passage Retrieval

Findings of ACL 2021

Ruiyang Ren, Shangwen Lv, Yingqi Qu, Jing Liu, Wayne Xin Zhao, Qiaoqiao She, Hua Wu, Haifeng Wang, Ji-Rong Wen

[code]

RocketQA: An Optimized Training Approach to Dense Passage Retrieval for Open-Domain Question Answering

NAACL 2021

Yingqi Qu, Yuchen Ding, Jing Liu, Kai Liu, Ruiyang Ren, Wayne Xin Zhao, Daxiang Dong, Hua Wu, Haifeng Wang

[code]

DuReader_robust: A Chinese Dataset Towards Evaluating Robustness and Generalization of Machine Reading Comprehension in Real-World Applications

ACL 2021

Hongxuan Tang, Hongyu Li, Jing Liu, Yu Hong, Hua Wu, Haifeng Wang

[code] [data]

2020

A Robust Adversarial Training Approach to Machine Reading Comprehension

AAAI 2020

Kai Liu, Xin Liu, An Yang, Jing Liu, Jinsong Su, Sujian Li, Qiaoqiao She

2019

CoKE: Contextualized Knowledge Graph Embedding

Preprint

Quan Wang, Pingping Huang, Haifeng Wang, Songtai Dai, Wenbin Jiang, Jing Liu, Yajuan Lyu, Yong Zhu, Hua Wu

[code]

D-NET: A Simple Framework for Improving the Generalization of Machine Reading Comprehension

EMNLP 2019 Workshop (MRQA)

Hongyu Li, Xiyuan Zhang, Yibing Liu, Yiming Zhang, Quan Wang, Xiangyang Zhou, Jing Liu, Hua Wu, Haifeng Wang

[code]

Enhancing Pre-trained Language Representations with Rich Knowledge for Machine Reading Comprehension

ACL 2019

An Yang, Quan Wang, Jing Liu, Kai Liu, Yajuan Lyu, Hua Wu, Qiaoqiao She, Sujian Li

[code]

Towards Robust Neural Machine Reading Comprehension via Question Paraphrases

IALP 2019

Ying Li, Hongyu Li, Jing Liu

Towards Time-Aware Distant Supervision for Relation Extraction

Preprint

Tianwen Jiang, Sendong Zhao, Jing Liu, Jin-Ge Yao, Ming Liu, Bing Qin, Ting Liu, Chin-Yew Lin

2018

Answer-focused and Position-aware Neural Question Generation

EMNLP 2018

Xingwu Sun, Jing Liu, Yajuan Lyu, Yanjun Ma, Shi Wang

Aggregated Semantic Matching for Short Text Entity Linking

CoNLL 2018

Feng Nie, Shuyan Zhou, Jing Liu, Jinpeng Wang, Chin-Yew Lin, Rong Pan

Neural Math Word Problem Solver with Reinforcement Learning

COLING 2018

Danqing Huang, Jing Liu, Chin-Yew Lin, Jian Yin

DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications

ACL 2018 Workshop (MRQA)

Wei He, Kai Liu, Jing Liu, Yajuan Lyu, Shiqi Zhao, Xinyan Xiao, Yuan Liu, Yizhong Wang, Hua Wu, Qiaoqiao She, Xuan Liu, Tian Wu, Haifeng Wang

[code]

Adaptations of ROUGE and BLEU to Better Evaluate Machine Reading Comprehension Task

ACL 2018 Workshop (MRQA)

An Yang, Kai Liu, Jing Liu, Yajuan Lyu, Sujian Li

Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification

ACL 2018

Yizhong Wang, Kai Liu, Jing Liu, Wei He, Yajuan Lyu, Hua Wu, Sujian Li, Haifeng Wang

Revisiting Distant Supervision for Relation Extraction

LREC 2018

Tingsong Jiang, Jing Liu, Chin-Yew Lin

[data]

2017

A Statistical Framework for Product Description Generation

IJCNLP 2017

Jinpeng Wang, Yutai Hou, Jing Liu, Yunbo Cao, Chin-Yew Lin

2016

News Citation Recommendation with Implicit and Explicit Semantics

ACL 2016

Hao Peng, Jing Liu, Chin-Yew Lin

Knowledge Base Completion via Coupled Path Ranking

ACL 2016

Quan Wang, Jing Liu, Yuanfei Luo, Bin Wang, Chin-Yew Lin

RBPB: Regularization-Based Pattern Balancing Method for Event Extraction

ACL 2016

Lei Sha, Jing Liu, Chin-Yew Lin, Sujian Li, Baobao Chang, Zhifang Sui

2015

Improving Ranking Consistency for Web Search by Leveraging Knowledge Base and Search Logs

CIKM 2015

Jyun-Yu Jiang, Jing Liu, Chin-Yew Lin, Pu-Jen Cheng

2014

A Regularized Competition Model for Question Difficulty Estimation in Community Question Answering Services

EMNLP 2014

Quan Wang, Jing Liu, Bin Wang, Li Guo

A Computational Approach to Measuring the Correlation between Expertise and Social Media Influence for Celebrities on Microblogs

ASONAM 2014

Xin Zhao, Jing Liu, Yulan He, Chin-Yew Lin, Ji-Rong Wen

2013

Question Difficulty Estimation in Community Question Answering Services

EMNLP 2013

Jing Liu, Quan Wang, Chin-Yew Lin, Hsiao-Wuen Hon

A Hierarchical Entity-based Approach to Structuralize User Generated Content in Social Media: A Case of Yahoo! Answers

EMNLP 2013

Baichuan Li, Jing Liu, Chin-Yew Lin, Irwin King, Michael R. Lyu

What's in a Name? An Unsupervised Approach to Link Users across Communities

WSDM 2013

Jing Liu, Fan Zhang, Xinying Song, Young-In Song, Chin-Yew Lin, Hsiao-Wuen Hon

2012

An Unsupervised Method for Author Extraction from Web Pages Containing User-Generated Content

CIKM 2012

Jing Liu, Xinying Song, Jingtian Jiang, Chin-Yew Lin

2011

Competition-based User Expertise Score Estimation

SIGIR 2011

Jing Liu, Young-In Song, Chin-Yew Lin

2010

Automatic Extraction of Web Data Records Containing User-Generated Content

CIKM 2010

Xinying Song, Jing Liu, Yunbo Cao, Chin-Yew Lin, Hsiao-Wuen Hon

Microsoft Research Asia with Redmond at the NTCIR-8 Community QA Pilot Task

NTCIR 2010

Young-In Song, Jing Liu, Tetsuya Sakai, Xinjing Wang, Guwen Feng, Yunbo Cao, Hisami Suzuki, Chin-Yew Lin

Jing Liu（刘璟）

About

We Are Hiring

Post-Training

Coding Agent

General Agent

Deep Search

Selected Publications (2023–present)

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

Experience

Education

Professional Activities

Datasets

LUGE [portal]

DuReader_retrieval [paper] [data] [code]

DuQM [paper] [data] [code]

DuReader_checklist [data] [code]

DuReader_robust [paper] [data] [code]

About

We Are Hiring

Post-Training

Coding Agent

General Agent

Deep Search

Selected Publications (2023–present)

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

Experience

Education

Professional Activities

Datasets

LUGE [portal]

DuReaderretrieval [paper] [data] [code]

DuQM [paper] [data] [code]

DuReaderchecklist [data] [code]

DuReaderrobust [paper] [data] [code]

DuReader_retrieval [paper] [data] [code]

DuReader_checklist [data] [code]

DuReader_robust [paper] [data] [code]