Where to Place the Query? Unveiling and Mitigating Positional… | AI Deep Signal

Where to Place the Query? Unveiling and Mitigating Positional Bias in In-Context Learning for Diffusion LLMs via Decoding Dynamics

arXiv cs.CL·Zhengheng Li, Panrui Li, Xuyang Liu, Puzhi Xia

6/19/2026

·~2 min·6/19/2026·en·2

Quick Answer

This paper reveals that query position is a critical variable in diffusion large language models (dLLMs), impacting generation quality significantly.

Quick Take

It introduces Average Confidence ($\overline{C}$) as a new metric for iterative decoding and proposes Auto-ICL, an adaptive routing strategy that optimizes query placement, achieving near-oracle performance across various tasks.

Key Points

Positional variance in dLLMs affects generation quality comparably to semantic quality.
Traditional single-step confidence metrics are ineffective in dLLMs.
Average Confidence ($\overline{C}$) tracks iterative decoding for better performance.
Auto-ICL dynamically optimizes query placement without requiring training.
The study highlights the importance of bidirectional attention in dLLMs.

Paper Resources

Read Paperarxiv.org View PDFarxiv.org

Source Excerpt

While In-Context Learning (ICL) is extensively studied in Autoregressive (AR) , its mechanism within Diffusion Large Language Models (dLLMs) remains largely unexplored. Unlike AR models restricted by unidirectional causal masking, dLLMs intrinsically utilize bidirectional attention, offering extensive spatial flexibility for query placement. Unfortunately, current practices conventionally inherit AR-style trailing-query templates, often overlooking the structural paradigm shift. This paper p

Read the full article on arxiv.org

Want this in your inbox every morning?

Daily brief at your local 8am — bilingual EN/中文, free.

Subscribe — it's free

More from arXiv cs.CL

See more →

arXiv cs.CL·Isabel Xu (The Overlake School), Cynthia Xu (The Overlake School), Rachel Ren (Edwards Vacuum Inc.), Cong Guo (The University of Memphis), Jiacheng Ding (The University of Memphis)

1w ago

FeaturedOriginal

TriAgent: Divergence-Aware Committees for Cost-Efficient Financial Sentiment Analysis

AI Summary

TriAgent introduces a cost-efficient multi-agent system for financial sentiment analysis, combining VADER, FinBERT, and Qwen2.5. It achieves an F1 score of ~0.87 with significant savings of $9.3M/year at a 10M-user scale compared to GPT-4o-mini, while also detecting hallucinations with an AUC of 0.90.

#LLM #Agent #AI Startup #Enterprise AI

Where to Place the Query? Unveiling and Mitigating Positional Bias in In-Context Learning for Diffusion LLMs via Decoding Dynamics

Quick Answer

Quick Take

Key Points

Paper Resources

Source Excerpt

Want this in your inbox every morning?

More from arXiv cs.CL

TriAgent: Divergence-Aware Committees for Cost-Efficient Financial Sentiment Analysis

RF-Agent: A Practical Framework for Building Language Agents for RFIC Design

Letting the Data Speak: Extracting Keywords from Crowdsourced Collections with AI

Quick Answer

Quick Take

Key Points

Paper Resources

Source Excerpt

Want this in your inbox every morning?

More from arXiv cs.CL

TriAgent: Divergence-Aware Multi-Agent Committees for Cost-Efficient Financial Sentiment Analysis

RF-Agent: A Practical Framework for Building Language Agents for RFIC Design

Letting the Data Speak: Extracting Keywords from Crowdsourced Collections with AI

TriAgent: Divergence-Aware Committees for Cost-Efficient Financial Sentiment Analysis