อัปเดตโมเดล Qwen3-Next

โพสต์เหล่านี้กล่าวถึงการเปิดตัว Qwen3-Next ซึ่งเป็นชุดแบบจำลองภาษาขนาดใหญ่ (LLM) ที่มีประสิทธิภาพชุดใหม่ พร้อมพารามิเตอร์ 80B ซึ่งมอบประสิทธิภาพและประสิทธิผลที่ดีขึ้น แบบจำลองนี้ประกอบด้วยสถาปัตยกรรมแบบไฮบริด ความสนใจแบบเกต และการผสมผสานผู้เชี่ยวชาญแบบเบาบาง

Qwen

Qwen

@@Alibaba_Qwen

6h

ขอแนะนำ Qwen3-Next-80B-A3B — อนาคตของ LLM ที่มีประสิทธิภาพมาถึงแล้ว! พารามิเตอร์ 80B แต่เปิดใช้งานเพียง 3B ต่อโทเค็น → การฝึกอบรมราคาถูกกว่า 10 เท่า การอนุมานเร็วกว่า Qwen3-32B ถึง 10 เท่า (โดยเฉพาะอย่างยิ่งเมื่อรองรับบริบท 32K+!) สถาปัตยกรรมไฮบริด: Gated DeltaNet + Gated Attention → ความเร็วที่ดีที่สุด &

Post image 1
5:50 PM·Sep 11, 2025·2.9K Views
96
408
1.6K
Qwen

Qwen

@@Alibaba_Qwen

9h

เปิดม่านแล้ว พบกับ Qwen3-Next — ฉลาดกว่า น่ารักกว่า และพร้อมขึ้นเวทีแล้ว

Post image 1
2:45 PM·Sep 11, 2025·1.5K Views
74
141
1.1K
Thomas Wolf

Thomas Wolf

@@Thom_Wolf

2d

โอ้พระเจ้า นี่มันบ้าไปแล้วเพื่อนๆ

Post image 1
4:37 PM·Sep 9, 2025·1.4K Views
35
154
1.8K
Qwen

Qwen

@@Alibaba_Qwen

19h

ความฝันของคุณคือ LLM อะไร? Qwen3-Next กำลังจะมาเร็วๆ นี้ หวังว่าคุณจะชอบนะ!

Post image 1
4:14 AM·Sep 11, 2025·1.3K Views
74
79
1.2K
Vivek Galatage

Vivek Galatage

@@vivekgalatage

2d

กำลังเรียนรู้คอมไพเลอร์อยู่ใช่ไหม? ลองดู "A Compiler Writing Journey" สิ https:// github.com/DoctorWkt/acwj การสร้างคอมไพเลอร์ตั้งแต่พื้นฐาน พร้อมเอกสารประกอบแต่ละขั้นตอนอย่างละเอียด

Post image 1
11:30 PM·Sep 9, 2025·677.2328264904068 Views
6
101
774
AiBattle

AiBattle

@@AiBattle_

2d

โมเดล Qwen-3-Next-80B-A3B ใหม่กำลังจะมาถึง "เราสร้างโมเดล Qwen3-Next-80B-A3B ขึ้นมาโดยใช้สถาปัตยกรรมนี้ โดยเราได้ฝึกฝนและโอเพนซอร์สพารามิเตอร์ทั้งหมด 80B พารามิเตอร์ มีเพียง 3B พารามิเตอร์ที่ทำงานอยู่ ซึ่งทำให้เกิดความเบาบางและประสิทธิภาพสูงสุด แม้จะมีประสิทธิภาพสูงสุด แต่ก็มีประสิทธิภาพเหนือกว่า Qwen3-32B ในงานดาวน์สตรีม —

Post image 1Post image 2
2:40 PM·Sep 9, 2025·604.0494270813772 Views
9
90
773