Multilingual Coreference Resolution via Cycle-Consistent Machine… | AI Deep Signal

Multilingual Coreference Resolution via Cycle-Consistent Machine Translation

arXiv cs.CL·Adriana-Valentina Costache, Eduard Poesina, Silviu-Florin Gheorghe, Paul Irofti, Radu Tudor Ionescu

6/5/2026

·~1 min·6/5/2026·en·5

Quick Answer

This study introduces a novel coreference resolution pipeline utilizing machine translation to enhance training data for low-resource languages.

Quick Take

By employing back-translation and cosine similarity with BERT, the method significantly improves coreference resolution performance, demonstrating effectiveness in languages lacking prior corpora.

Key Points

Proposed pipeline uses machine translation to generate training data for low-resource languages.
Back-translation assesses quality via cosine similarity in BERT's latent space.
Significant performance gains observed in coreference resolution across four low-resource languages.
Pipeline enables accurate resolution in languages without existing corpora.

Paper Resources

Read Paperarxiv.org View PDFarxiv.org

Source Excerpt

arXiv:2606. 05444v1 Announce Type: new Abstract: Coreference resolution is a core NLP task, having a broad range of downstream applications, e. g. ~machine translation, question answering, document summarization, etc. While the task is well-studied in English, comparatively less attention is dedicated to coreference resolution in other languages, especially low-resource ones.

To mitigate this gap, we propose a novel coreference resolution pipeline that harnesses machine translation (MT) from English to a target low-resource language, to generate or expand training data. …

Read on arxiv.org

Want this in your inbox every morning?

Daily brief at your local 8am — bilingual EN/中文, free.

Subscribe — it's free

More from arXiv cs.CL

See more →

arXiv cs.CL·Yueqi Xing, Houbo He, Jolie Wang, Erin Ni, Shikai Wang, Qiufeng Li, Weidong Cao, Taiyun Chi

6h ago

FeaturedOriginal

RF-Agent: A Practical Framework for Building Language Agents for RFIC Design

AI Summary

RF-Agent introduces a novel framework for RF circuit design using , creating a unique RF-domain reasoning dataset with over 11,000 samples. The study reveals that domain-specific supervised fine-tuning and semantic retrieval strategies significantly enhance RF reasoning performance, particularly for smaller models.

#LLM #Agent #AI Coding #AI Startup

Multilingual Coreference Resolution via Cycle-Consistent Machine Translation

Quick Answer

Quick Take

Key Points

Paper Resources

Source Excerpt

Want this in your inbox every morning?

More from arXiv cs.CL

RF-Agent: A Practical Framework for Building Language Agents for RFIC Design

Letting the Data Speak: Extracting Keywords from Crowdsourced Collections with AI

Quantifying Prior Dominance in Systems

Quick Answer

Quick Take

Key Points

Paper Resources

Source Excerpt

Want this in your inbox every morning?

More from arXiv cs.CL

RF-Agent: A Practical Framework for Building Language Agents for RFIC Design

Letting the Data Speak: Extracting Keywords from Crowdsourced Collections with AI

Quantifying Prior Dominance in RAG Systems

Quantifying Prior Dominance in Systems