Gemini
การพัฒนาโมเดล Generative AI ของ Google ได้เริ่มต้นขึ้นตั้งแต่ปี 2012 โดยเริ่มจากการวิจัยและพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) ที่ซึ่งโมเดล AI สามารถเรียนรู้ภาษามนุษย์และสร้างข้อความที่เหมือนกับมนุษย์ได้อย่างน่าเหลือเชื่อ ล่าสุดในปี 2023 ที่ผ่านมา Google ได้เปิดตัว Gemini ซึ่งเป็นแพลตฟอร์ม Generative AI ที่รวมเอาโมเดล Generative AI ต่างๆ ของ Google มาไว้ในที่เดียว ในบทความนี้ Cloud Ace Thailand ขอพาทุกท่านไปรู้จักกับโมเดล Gemini กัน!
Gemini หรือ ‘เจมินาย’ เป็น AI แบบ Multimodal Transformer ของ Google ที่สามารถทำความเข้าใจข้อมูลได้หลากหลายประเภท ทั้งข้อความ รูปภาพ เสียง วิดีโอและโค้ด สามารถทำงานที่ซับซ้อนได้อย่างมีประสิทธิภาพ ซึ่งโมเดล AI เจนเนอเรชันก่อนหน้านี้ยังไม่สามารถทำได้
ในยุคที่ข้อมูลมีมากมายมหาศาลและหลากหลายรูปแบบ ความสามารถในการเข้าใจและจัดการข้อมูลได้อย่างมีประสิทธิภาพจึงเป็นสิ่งสำคัญ ความสามารถแบบ Multimodal คือ ความสามารถของ AI ในการเข้าใจและจัดการข้อมูลได้หลากหลายประเภทพร้อมกัน ซึ่ง Gemini เรียนรู้ข้อมูลเหล่านี้ตั้งแต่เริ่มต้นและเปิดใช้งานการสร้างสรรค์ที่ซับซ้อนมากขึ้นโดยใช้ข้อมูลหลายรูปแบบ
นอกจากนี้ Gemini ยังได้รับการปรับให้เหมาะสมสำหรับงานบนอุปกรณ์เคลื่อนที่ ซึ่งจะช่วยปรับปรุงประสิทธิภาพของแอปพลิเคชันในชีวิตประจำวัน เช่น การจดจำเสียงและการประมวลผลภาพ ทำให้ชีวิตของเราสะดวกและมีประสิทธิภาพมากขึ้น
เพื่อพิสูจน์ประสิทธิภาพของ Gemini ขอเชิญไปชมผลทดสอบเปรียบเทียบระหว่าง Gemini กับ GPT-4 ในด้านงาน Multimidal และงานประมวลผลข้อความ ซึ่ง Google DeepMind ศูนย์วิจัยปัญญาประดิษฐ์ของ Google แสดงไว้บนเว็บไซต์อย่างเป็นทางการ