Alibaba Cloud Open Sources its AI Models for Video Generation

Alibaba Cloud Launches Carbon Management Solution

Alibaba Cloud Open Sources its AI Models for Video Generation

Alibaba Cloud, the digital technology and intelligence backbone of Alibaba Group, recently made its AI models for video generation freely available as part of its latest efforts to contribute to the open-source community.

It is open sourcing four models of its 14 – billion(B)-parameter and 1.3 – billion(B)-parameter versions of Wan2.1 series, the latest iteration of its video foundation model Tongyi Wanxiang (Wan).

The four models, including T2V-14B, T2V-1.3B, I2V-14B-720P, and I2V-14B-480P, are designed to generate high-quality images and videos from text and image inputs. They are available for download on Alibaba Cloud’s AI model community, Model Scope, and the collaborative AI platform Hugging Face, accessible to academics, researchers, and commercial institutions worldwide. Within a week of their launch, the combined downloads of the four Wan2.1 open-source models on ModelScope and Hugging Face exceeded 1 million.

Unveiled earlier this year, Wan2.1 series is the first video generation model to support text effects in both Chinese and English. It excels at generating realistic visuals by accurately handling complex movements, enhancing pixel quality, adhering to physical principles, and optimizing the precision of instruction execution. Its precision in following instructions has propelled Wan2.1 to the top of the VBench leaderboard, a comprehensive benchmark suite for video generative models.

According to VBench, the Wan2.1 series, with an overall score of 86.22%, leads in key dimensions such as dynamic degree, spatial relationships, color, and multi-object interactions

Training video foundation models requires immense computing resources and vast amounts of high-quality training data. Open access helps lower the barrier for more businesses to leverage AI, enabling them to create high-quality visual content tailored to their needs in a cost-effective way.

The T2V-14B model is better suited for creating high-quality visuals with substantial motion dynamics, while the T2V-1.3B model strikes a balance between generation quality and computational power, making it ideal for a broad range of developers conducting secondary development and academic research. For example, the T2V-1.3B model allows users with standard personal laptops to generate a 5-second-long video at 480p resolution in as little as around 4 minutes.

In addition to supporting text-to-video generation, the I2V-14B-720P and I2V-14B-480P models also offer image-to-video capabilities. Users simply need to input a single image along with a brief text description to generate dynamic video content. The platform supports normal-sized image inputs of any dimensions.

Alibaba Cloud was one of the first major global tech companies to make its self-developed large-scale AI model open-source, releasing its first open-model Qwen (Qwen-7B) in August 2023. Qwen open-models have consistently topped the Hugging Face Open LLM Leaderboards, with performances matching that of leading global AI models across various benchmarks.

As of now, more than 100,000 derivative models based on the Qwen family of models have been developed on Hugging Face, making it one of the largest AI model families worldwide.

อาลีบาบา คลาวด์ เปิดโอเพ่นซอร์ส โมเดล AI สำหรับการสร้างวิดีโอ

Alibaba Cloud Launches Carbon Management Solution

อาลีบาบา คลาวด์ เปิดโอเพ่นซอร์ส โมเดล AI สำหรับการสร้างวิดีโอ

อาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัลและหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป เปิดให้ใช้งานโมเดล AI สำหรับการสร้างวิดีโอโดยไม่มีค่าใช้จ่าย นับเป็นหนึ่งในความมุ่งมั่นครั้งล่าสุด ของบริษัทฯ ในการสนับสนุนชุมชนโอเพ่นซอร์ส

โมเดลโอเพ่นซอร์สมีสี่โมเดลที่อยู่ในกลุ่ม Wan2.1 series ประกอบด้วยเวอร์ชันขนาด 14-พันล้านพารามิเตอร์ และ 1.3-พันล้านพารามิเตอร์ ทั้งนี้ Wan2.1 series เป็นรุ่นล่าสุดของ Tongyi Wanxiang (Wan) ซึ่งเป็นโมเดลวิดีโอพื้นฐานของบริษัทฯ

โมเดลทั้ง 4 ประกอบด้วย T2V-14B, T2V-1.3B, I2V-14B-720P และ I2V-14B-480P ออกแบบมาเพื่อสร้างภาพและวิดีโอคุณภาพสูงจากการอินพุทข้อความและรูปภาพ เปิดให้ดาวน์โหลดได้บน Model Scope ซึ่งเป็นชุมชนด้านโมเดล AI ของอาลีบาบา คลาวด์ และบนแพลตฟอร์ม Hugging Face ซึ่งเป็นแพลตฟอร์มการทำงานด้าน AI ที่เปิดให้นักวิชาการ นักวิจัย และสถาบันเชิงพาณิชย์ทั่วโลกทำงานร่วมกัน ทั้งนี้ภายในสัปดาห์แรกที่เปิดตัว โมเดล Wan2.1 ทั้งสี่รุ่น มียอดดาวน์โหลดรวมบน ModelScope และ Hugging Face ทะลุเกิน 1 ล้านครั้งแล้ว

Wan2.1 เป็นโมเดลสร้างวิดีโอรุ่นแรกที่รองรับการปรับเปลี่ยนข้อความทั้งภาษาจีนและภาษาอังกฤษที่เปิดตัวเมื่อต้นปี 2568 มีความสามารถเป็นเลิศในการสร้างภาพที่สมจริง โดยสามารถจัดการการเคลื่อนไหวที่ซับซ้อนได้อย่างแม่นยำ เพิ่มคุณภาพพิกเซล ดำเนินการตามหลักการทางกายภาพ และปรับความแม่นยำของการทำตามคำสั่งให้เหมาะสม ความแม่นยำในการทำตามคำสั่งต่าง ๆ ทำให้ Wan2.1 ก้าวขึ้นไปอยู่ในลำดับต้น ๆ ของ VBench leaderboard ซึ่งเป็นชุดเกณฑ์มาตรฐานด้านโมเดลการสร้างวิดีโอที่ครอบคลุม

คะแนนรวมของ Wan2.1 บน VBench อยู่ที่ 86.22% เป็นผู้นำในมิติสำคัญต่าง ๆ เช่น ระดับความเคลื่อนไหว ความสัมพันธ์เชิงพื้นที่ ความถูกต้องของสี และการจัดความสัมพันธ์ของอ็อบเจกต์หลายรายการ

การเทรนโมเดลพื้นฐานที่ใช้สร้างวิดีโอต่าง ๆ ต้องใช้ทรัพยากรการประมวลผลจำนวนมหาศาล และต้องมีข้อมูลที่จะใช้เทรนที่มีคุณภาพสูงจำนวนมาก การเปิดให้เข้าใช้งานได้โดยไม่มีค่าใช้จ่ายช่วยลดอุปสรรค และทำให้ธุรกิจต่าง ๆ ใช้ประโยชน์จาก AI ได้มากขึ้น สามารถสร้างภาพที่มีคุณภาพสูงและปรับให้ตรงกับความต้องการของตนได้ด้วยค่าใช้จ่ายที่เหมาะสม

โมเดล T2V-14B เหมาะกับการสร้างภาพคุณภาพสูงที่มีไดนามิกของการเคลื่อนไหวสูง ในขณะที่โมเดล T2V-1.3B มีความสมดุลระหว่างคุณภาพในการสร้างภาพและพลังการประมวลผล จึงเหมาะสำหรับนักพัฒนาในวงกว้างที่ทำการพัฒนาต่อยอดจากของเดิม (secondary development) และการวิจัยทางวิชาการ เช่น โมเดล T2V-1.3B ช่วยให้ผู้ใช้งานใช้แล็ปท็อปส่วนตัวสร้างวิดีโอความยาว 5 วินาที ด้วยความละเอียดที่ 489p ได้ในเวลาเพียงประมาณ 4 นาที

นอกจากรองรับการแปลงข้อความเป็นวิดีโอแล้ว โมเดล I2V-14B-720P และ I2V-14B-480P ยังสามารถแปลงภาพเป็นวิดีโอได้ด้วย โดยผู้ใช้เพียงอินพุตภาพหนึ่งภาพพร้อมคำอธิบายเป็นข้อความสั้น ๆ เพื่อสร้างเนื้อหาวิดีโอเคลื่อนไหวได้ แพลตฟอร์มนี้รองรับการอินพุตภาพขนาดปกติได้ทุกมิติ

อาลีบาบา คลาวด์ เป็นหนึ่งในบริษัทด้านเทคโนโลยีรายใหญ่ของโลกรายแรก ๆ ที่เปิดโอเพ่นซอร์สโมเดล AI ขนาดใหญ่ที่บริษัทฯ พัฒนาขึ้นเอง โดยเปิดโอเพ่นโมเดล Qwen (Qwen-7B) เป็นครั้งแรกในเดือนสิงหาคม 2566 ทั้งนี้ Hugging Face Open LLM Leaderboards จัดให้โมเดลแบบเปิดของ Qwen อยู่ในอันดับสูงในเกณฑ์มาตรฐานการวัดประสิทธิภาพด้านต่าง ๆ มาโดยตลอด ด้วยประสิทธิภาพที่เทียบเท่ากับโมเดล AI ชั้นนำของโลก

ปัจจุบัน มีการพัฒนาโมเดลอนุพันธ์มากกว่า 100,000 รายการจากโมเดลในตระกูล Qwen บน Hugging Face ทำให้ Qwen เป็นหนึ่งในตระกูลโมเดล AI ที่ใหญ่ที่สุดในโลก

Alibaba Chairman Joe Tsai on AI Development

โจ ไช่ ประธานของอาลีบาบา กับ มุมมองด้านการพัฒนา AI

Alibaba Chairman Joe Tsai on AI Development

Joe Tsai, Chairman of Alibaba Group, shared Alibaba’s view on the future of AI during a fireside chat at the recent World Government Summit. He further elaborated in an op-ed published concurrently (attached) on the importance of open-source models in democratizing AI and forecasting a pivot towards commercialized applications in AI development. Below are some of the highlights:

  • Developers will think about real-world applications that drive economic impact. This will accelerate the proliferation of task-specific and specialist AI models and agents.
  • Capital will go to companies that innovate with lower cost of training and deploying AI. 
  • Open-source models will lead to the democratization of AI. The result is that smaller companies can access open-source frontier models and develop useful applications on top of them.
  • AI applications based on smaller parameter models will proliferate, making AI accessible to a lot more people.
  • Making AI less costly and more accessible means more companies and developers can participate in the upside of AI development, and more consumers will benefit from the proliferation of useful and cool applications.

Tsai’s advocacy for open innovation reflects Alibaba’s ongoing initiatives, including the release of cutting-edge, open-source large language models from its Qwen family testament to the company’s long-term commitment to fostering inclusive, accessible, and affordable AI advancements:

  • Alibaba was one of the earliest major global tech companies to make its self-developed large-scale AI model in open source, with the launch of ModelScope, its open-source community, in the end of 2022. It released its first open-source model (Qwen-7B) in August 2023, with subsequent iterations encompassing language, multi-modal, mathematical, and code models.
  • Last month, Alibaba released its next-generation multi-modal model5-VL and the latest large language model Qwen2.5-1M in open-source format, both delivering top results across globally recognized benchmarks.
  • As of February 2025, over 90,000 Qwen-based derivative models have been developed in the global open-source community Hugging Face. This reflects Qwen’s popularity as one of the world’s most widely adopted open-source models.

โจ ไช่ ประธานของอาลีบาบา กับ มุมมองด้านการพัฒนา AI

โจ ไช่ ประธานของอาลีบาบา กับ มุมมองด้านการพัฒนา AI

โจ ไช่ ประธานของอาลีบาบา กับ มุมมองด้านการพัฒนา AI

นายโจ ไช่ ประธานของอาลีบาบา กรุ๊ป แลกเปลี่ยนมุมมองของอาลีบาบาเกี่ยวกับอนาคตของ AI ในระหว่างการประชุมสุดยอด World Government Summit เมื่อเร็ว ๆ นี้ โดยโจได้อธิบายรายละเอียดเพิ่มเติมจากบทบรรณาธิการที่ตีพิมพ์ในโอกาสเดียวกัน เกี่ยวกับความสำคัญของโมเดลโอเพ่นซอร์สต่าง ๆ ที่สามารถมอบ AI ที่ทุกคนใช้ได้โดยไม่จำเป็นต้องมีความรู้เฉพาะทางหรือความรู้ทางเทคนิคใด ๆ และการคาดการณ์ทิศทางที่จะทำให้การพัฒนา AI ก้าวสู่การนำไปใช้งานเชิงพาณิชย์ โดยมีมุมมองสำคัญดังนี้                                          

  • นักพัฒนาซอฟต์แวรจะคิดถึงแอปพลิเคชันที่นำไปใช้งานได้จริง และส่งผลกระทบทางเศรษฐกิจ ส่งผลให้โมเดลและเอเจนต์ AI เฉพาะทาง และ เจาะจงเฉพาะงาน ขยายตัวเร็วขึ้น
  • เงินทุนจะไปยังบริษัทต่าง ๆ ที่สร้างนวัตกรรมด้วยการเทรนและการนำ AI ไปใช้ได้ด้วยต้นทุนที่ต่ำกว่า
  • โมเดลโอเพ่นซอร์สต่าง ๆ จะทำให้เกิด AI ที่ใครก็ใช้ได้ ซึ่งจะส่งผลให้บริษัทที่มีขนาดเล็กสามารถเข้าถึงโมเดลโอเพ่นซอร์ส และต่อยอดพัฒนาแอปพลิเคชันที่นำไปใช้ประโยชน์ได้อย่างมีประสิทธิภาพ
  • แอปพลิเคชัน AI ที่ใช้โมเดลที่มีพารามิเตอร์เล็กกว่าจะมีจำนวนเพิ่มขึ้นอย่างรวดเร็ว ทำให้ผู้คนจำนวนมากขึ้นสามารถเข้าถึง AI ได้
  • การทำให้ค่าใช้จ่ายด้าน AI ลดลง และการเข้าถึงได้มากขึ้นนั้น หมายถึง จะมีบริษัทและนักพัฒนาซอฟต์แวร์เข้าไปมีส่วนร่วมในการพัฒนา AI เพิ่มมากขึ้น และจะมีผู้บริโภคที่ได้รับประโยชน์จากสุดยอดแอปพลิเคชันที่มีคุณประโยชน์เหล่านี้เพิ่มจำนวนมากขึ้นเช่นกัน

การที่นายโจ ไช่ ให้การสนับสนุนนวัตกรรมแบบเปิด สะท้อนให้เห็นการพัฒนาเทคโนโลยีอย่างต่อเนื่องของอาลีบาบา ซึ่งรวมถึง การเปิดตัว Qwen ซึ่งเป็นตระกูลโมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์สที่ล้ำสมัย  ของบริษัทฯ ที่นับเป็นหนึ่งในข้อพิสูจน์ถึงความมุ่งมั่นระยะยาวของบริษัทฯ ในการส่งเสริมความก้าวหน้าด้านAI ที่ครอบคลุม เข้าถึงได้ ในราคาที่เหมาะสม

  • อาลีบาบา เป็นหนึ่งในบริษัทเทคโนโลยีรายใหญ่ของโลกรายแรก ๆ ที่สร้างโมเดล AI ขนาดใหญ่ที่เป็นโอเพ่นซอร์สด้วยตัวเองจากการเปิดตัว ModelScope ซึ่งเป็นคอมมิวนิตี้ด้านโอเพ่นซอร์สของ บริษัทฯ เมื่อปลายปี พ.ศ. 2565 บริษัทฯ ได้เปิดตัวโมเดลโอเพ่นซอร์สรุ่นแรก (Qwen-7B) เมื่อเดือนสิงหาคม พ.ศ. 2566 โดยมีการพัฒนาต่อยอดอย่างต่อเนื่อง ครอบคลุมทั้งโมเดลภาษา, มัลติโมดัล, โมเดลด้านคณิตศาสตร์ และโค้ด
  • เมื่อเดือนมกราคม พ.ศ. 2568 อาลีบาบา ได้เปิดตัว 5-VL ซึ่งเป็นโมเดลมัลติโมดัลเจเนอเรชันถัดไป และ Qwen2.5-1M โมเดลด้านภาษาขนาดใหญ่ที่อยู่ในรูปแบบโอเพ่นซอร์ส โดยประสิทธิภาพของทั้งสองโมเดลนี้มีผลลัพธ์อยู่ในอันดับต้น ๆ จากเกณฑ์มาตรฐานต่าง ๆ ที่เป็นที่ยอมรับทั่วโลก
  • ในเดือนกุมภาพันธ์ พ.ศ. 2568 มีการพัฒนาโมเดลอนุพันธ์ที่ใช้ Qwen มากกว่า 90,000 โมเดล บน Hugging Face ซึ่งเป็นคอมมิวนิตี้โอเพ่นซอร์สระดับโลก สะท้อนให้เห็นว่า Qwen ได้รับความนิยมและเป็นหนึ่งในโมเดลโอเพ่นซอร์สที่มีการใช้งานอย่างกว้างขวางมากที่สุดในโลก

Alibaba Cloud Establishes Second Data Center in Thailand with Richer Product Portfolio for Generative AI and Industry-specific Solutions

อาลีบาบา คลาวด์ เปิด ดาต้าเซ็นเตอร์ แห่งที่สองในประเทศไทย มาพร้อมกลุ่มผลิตภัณฑ์หลากหลายเพื่อรองรับ Generative AI และโซลูชันเฉพาะทางสำหรับแต่ละอุตสาหกรรม

Alibaba Cloud Establishes Second Data Center in Thailand with Richer Product Portfolio for Generative AI and Industry-specific Solutions

Enhanced operational efficiency achieved for local customers in the technology, media, fintech, and retail sectors

– Alibaba Cloud, the digital technology and intelligence backbone of Alibaba Group, today announced the launch of its second data center in Thailand. The addition aims to increase local capacity in response to the rising demand for cloud computing services, particularly in supporting generative AI applications, while supporting the government’s initiatives for fostering digital innovation and sustainable technology development.

“Our latest data center strengthens our commitment to providing reliable, secure, and high-performance cloud services tailored to the needs of local businesses,” said Sean Yuan, Vice President of International Business, General Manager of Thailand, Indonesia, Japan, the Philippines, and South Pacific Region, Alibaba Cloud Intelligence, “With enhanced local infrastructure, we aim to empower enterprises to leverage the full potential of cloud technology, especially in generative AI applications.”

Following the inauguration of this new data center, Alibaba Cloud now operates 86 availability zones across 28 regions globally, solidifying its position as a leading cloud service provider in Southeast Asia. Alibaba Cloud launched its first data center in Thailand in 2022.

Alibaba Cloud has over 140 security and compliance accreditations worldwide, ensuring top-tier protection and resilience for its cloud offerings. With two data centers, it will facilitate Alibaba Cloud’s provision of scalable, elastic, and highly available cloud computing products with enhanced disaster recovery capabilities tailored to the nation’s dynamic digital landscape while adhering to stringent security and regulatory standards. 

Innovative Solutions for Local Businesses

Alibaba Cloud is enhancing its diverse portfolio of services aimed at empowering businesses in Thailand. This portfolio includes elastic computing, storage, database, security, network products, data analytics and AI services and solutions can address vertical industry challenges. 

Leveraging AnalyticDB’s cloud-native vector engine, Thai businesses especially from fintech and retail sectors can create enterprise-grade retrieval-augmented generation (RAG) solutions that improve customer interactions via customized large language model (LLM) applications. This allows companies to build a dedicated knowledge base, efficiently managing structured and unstructured data as vectors. Consequently, businesses can rapidly develop tailored chatbots and intelligent engagement tools featuring intelligent Q&A and personalized product recommendations, elevating the customer experience.

In addition, the newly introduced Alibaba Cloud Container Compute Service (ACS) simplifies and optimizes workload deployment using Kubernetes as its interface, offering a serverless container environment. ACS enables businesses to scale their operations efficiently by minimizing the complexities associated with infrastructure management, allowing them to focus on innovation while effectively managing costs.

Alibaba Cloud offers a range of industry-specific solutions tailored to the needs of digital-native clients in sectors such as fintech, retail, and public services. These solutions include the Workspace Elastic Desktop Service (EDS), eKYC solutions, SuperApp development capabilities, and AI-driven sustainability solutions.

Supporting Diverse Clients in Thailand

Alibaba Cloud has been instrumental in supporting Thai businesses across a diverse array of sectors, including technology, media, retail, fintech, and public sectors. By offering scalable, secure, and innovative cloud solutions, Alibaba Cloud empowers organizations to enhance operational efficiency, accelerate digital transformation, and better serve their customers.

True Digital Group, a core business of True Corporation Plc., one of Thailand’s leading Telecom-Tech companies, has leveraged Alibaba Cloud’s proven and trustworthy cloud computing products particularly in database and container technologies to enhance the efficiency, stability, and scalability of its energy platform.

Yell Group, a leading creative digital company headquartered in Thailand, has formed a transformative partnership with Alibaba Cloud to enhance its storyboard AI platform, AI-Deate. This collaboration seeks to revolutionize creative workflows using generative AI technologies, empowering creators in 102 countries to develop innovative applications while addressing work-life balance challenges in the digital age.

“This strategic partnership with Alibaba Cloud allows us to harness advanced AI capabilities, transforming how we empower creatives,” said Dissara Udomdej, CEO of Yell Group, “Together, we are set to redefine the creative landscape across Asia and beyond.”

Codium, a prominent software company in Thailand specializing in digital workplace solutions, has partnered with Alibaba Cloud to utilize its scalable infrastructure. This collaboration aims to establish a strong digital foundation for businesses in Thailand and improve the local cloud market ecosystem through accessible cloud services and comprehensive support for Thai clients.

“Collaborating with Alibaba Cloud has allowed us to provide our customers with flexible and scalable digital workplace solutions,” said Sivabudh Umpudh, CEO of Codium, “Their infrastructure not only supports our growth, but also enhances our ability to serve the unique needs of Thai businesses.”

White Channel, a well-known television broadcasting and OTT service provider in Thailand, has optimized its video-on-demand platform by implementing Alibaba Cloud’s end-to-end video streaming service, ApsaraVideo VOD. This partnership enables White Channel to deliver high-quality video playback without latency, utilizing a global CDN and scalable storage solutions to manage its extensive content library effectively, even during surge traffic periods.

“Working with Alibaba Cloud has significantly improved our ability to deliver seamless video services to our audience,” said Chawalit Ueaferua, Head of IT Department of White Channel, “Their cutting-edge technology ensures that our viewers receive high-quality content, anytime and anywhere.”

Fostering Local Ecosystem and Digital Talent

Alibaba Cloud is actively nurturing the local ecosystem by partnering with approximately 70 local partners, including Cloud HM, Kaopanwa, Softdebut, Thai Data Cloud, and True IDC, to empower the digital transformation of businesses across Thailand.

Alibaba Cloud is also committed to fostering digital talent through collaborations with local universities including Chulalongkorn University, King Mongkut’s University of Technology Thonburi, Prince of Songkla University and Bangkok University, offering workshops and certified courses in cloud computing and generative AI. In late 2023, Alibaba Cloud launched its first global skills center at Chulalongkorn University, which provides free training courses, boot camps, AI competitions, and leadership development programs. These initiatives are part of Alibaba Cloud’s ongoing efforts to enhance educational resources and promote a thriving digital landscape through further collaborations with local institutions.