All
Featured
Latest
Daily
Saved
Subscribe
Sources
Feedback

All
Featured
Daily
Saved
Feedback

Stable-Video-3D: Text-to-video at 1080p with consistent physics · DeepSignal

Stable-Video-3D: Text-to-video at 1080p with consistent physics

arXiv cs.CV·Stability AI

5d ago

·~3 min·5/11/2026·en·1

Quick Take

Stable-Video-3D generates 8s 1080p text-to-video with physically plausible motion via a learned dynamics prior.

Key Points

8-second clips at 1080p.
Physically plausible motion.
Trained with a learned dynamics prior.

Reader Mode is being prepared.

Read on arxiv.org

More from arXiv cs.CV

arXiv cs.CV

arXiv cs.CV·Zhuojin Li, Hsin-Pai Cheng, Hong Cai, Shizhong Han, Fatih Porikli

2d ago

FeaturedOriginal

CoReDiT: Spatial Coherence-Guided Token Pruning and Reconstruction for Efficient Diffusion Transformers

AI Summary

CoReDiT enhances Diffusion Transformers by optimizing token pruning for efficiency and quality.

#LLM #AI Coding #Inference

1

📰 Read Original

35signal

Signal Score

Low signal — niche or repeat coverage.

WeightScore

Source authority20%78

Community heat20%0

Technical impact30%

📰 Read Original

arXiv cs.CV

arXiv cs.CV·Alvaro Lopez Pellicer, Plamen Angelov, Marwan Bukhari, Yi Li, Eduardo Soares, Jemma Kerns

2d ago

FeaturedOriginal

ProtoMedAgent: Multimodal Clinical Interpretability via Privacy-Aware Agentic Workflows

AI Summary

ProtoMedAgent enhances clinical interpretability by integrating multimodal reporting with privacy-aware workflows.

#Agent #Robotics #AI Assistant #Policy

2

arXiv cs.CV

arXiv cs.CV·Kanghyun Baek, Jaihyun Lew, Chaehun Shin, Jungbeom Lee, Sungroh Yoon

2d ago

FeaturedOriginal

Diagnosing and Correcting Concept Omission in Multimodal Diffusion Transformers

AI Summary

The study addresses concept omission in MM-DiTs by introducing Omission Signal Intervention to enhance image generation.

#Inference #Open Source #AI Image

2

Related in this space

arXiv cs.AI

arXiv cs.AI·Hiroki Fukui

2d ago

FeaturedOriginal

Invisible Orchestrators Suppress Protective Behavior and Dissociate Power-Holders: Safety Risks in Multi-Agent LLM Systems

AI Summary

Invisible orchestrators in multi-agent LLM systems pose significant safety risks and affect behavior dynamics.

#LLM #Agent #Security

2

arXiv cs.AI

arXiv cs.AI·Leslie G. Valiant

2d ago

FeaturedOriginal

Enhanced and Efficient Reasoning in Large Learning Models

AI Summary

The paper proposes an efficient reasoning method for large language models, enhancing trust in generated content.

#LLM #Inference #Open Source

3

arXiv cs.CL

arXiv cs.CL·Mokshit Surana, Archit Rathod, Akshaj Satishkumar

2d ago

FeaturedOriginal

Measuring and Mitigating Toxicity in Large Language Models: A Comprehensive Replication Study

AI Summary

This study evaluates DExperts for mitigating toxicity in LLMs, revealing strengths and weaknesses in safety and latency.

#LLM #Open Source #Security

1

33

Business impact20%0

Novelty (recency)10%9

≥75 high · 50–74 medium · <50 low

Why Featured

Physics consistency was the visible weakness in AI video; closing that gap brings consumer use cases within reach.

Tags

#Open Source #AI Video

Reactions