Dall-E เป็นโปรแกรมปัญญาประดิษฐ์ (AI) ที่สร้างภาพตามข้อความแจ้ง ซึ่งหมายความว่าสิ่งที่คุณต้องการในการสร้างภาพคุณภาพสูงผ่าน AI ก็คือการให้คำแนะนำที่ชัดเจนในภาษาธรรมชาติแก่ Dall-E
ในขณะที่เขียน เครื่องมือที่ใช้ AI ทำงานในรูปแบบของ ดัล-อี 2ซึ่งเป็นเวอร์ชันล่าสุดของโปรแกรม Dall-E 2 มีจำหน่ายในเชิงพาณิชย์ผ่าน OpenAI ของผู้พัฒนา ซึ่งนำเสนอโปรแกรมผ่านทางเว็บอินเตอร์เฟส เช่นเดียวกับ Application Programming Interface (API)
เพื่อเรียนรู้ว่า Dall-E คืออะไรและทำงานอย่างไร ต่อไปนี้เป็นคำแนะนำโดยย่อเกี่ยวกับโปรแกรมสร้างภาพที่ทันสมัยนี้
ประเด็นสำคัญ
- Dall-E เป็นเครื่องมือสร้างภาพที่ใช้ AI ที่สร้างภาพผ่านคำสั่งข้อความ
- Dall-E ใช้การเรียนรู้เชิงลึกเพื่อเลียนแบบข้อความแจ้งและสัญญาณภาพ และเปลี่ยนสื่อภาพที่เกี่ยวข้องให้เป็นภาพที่เชื่อมโยงกัน
- Dall-E ยังมีโปรแกรมแก้ไขภาพเพื่อปรับปรุงภาพที่มีอยู่ผ่านความสามารถในการแก้ไขโดยใช้ AI
- Dall-E มีให้ใช้งานทั้งแบบส่วนติดต่อผู้ใช้แบบกราฟิก (GUI) และ API
- คุณยังคงรักษาสิทธิ์ความเป็นเจ้าของโดยสมบูรณ์สำหรับรูปภาพใดๆ ที่คุณสร้างผ่าน Dall-E
คุณสร้างภาพ AI ผ่านข้อความได้อย่างไร
Dall-E เป็นเครื่องมือสร้างรูปภาพที่ทำงานผ่าน AI เพื่อรวบรวมคำสั่งที่เป็นข้อความและเปลี่ยนให้เป็นรูปภาพต้นฉบับ เพื่อให้บรรลุผลสำเร็จ Dall-E ใช้การเรียนรู้เชิงลึกเพื่อทำความเข้าใจชุดรูปภาพและข้อมูลอ้างอิงจำนวนมาก
เมื่อได้รับข้อความแจ้ง Dall-E จะใช้การฝึกอบรมจากชุดข้อมูลเหล่านั้นเพื่อสร้างภาพที่ตรงกับคำแนะนำที่ให้ไว้ สิ่งนี้ทำให้ทุกคนสามารถใช้ AI ในการสร้างภาพได้โดยไม่ต้องใช้การเข้ารหัสหรือคำแนะนำทางเทคนิคมากมาย
ฟังก์ชันนี้เป็นหนึ่งในหลายเหตุผลที่ทำให้ Dall-E ได้รับความนิยมอย่างมากตั้งแต่เปิดตัวในปี 2020 ในการทำซ้ำล่าสุด Dall-E 2 โปรแกรมนี้ยังมีความสามารถเพิ่มเติมอีกด้วย ซึ่งรวมถึงตัวเลือกในการแก้ไขภาพที่มีอยู่โดยการเพิ่มองค์ประกอบภาพใหม่ หรือความสามารถในการขยายผ้าใบโดยการสร้างภาพที่เกี่ยวข้องสำหรับภาพต้นฉบับ
หากต้องการใช้ Dall-E 2 คุณสามารถไปที่เว็บไซต์ของ OpenAI และใช้เครื่องมือผ่าน GUI บนเว็บ แม้ว่าคุณจะไม่เคยใช้โปรแกรม AI มาก่อน อินเทอร์เฟซที่เรียบง่ายช่วยให้คุณป้อนข้อความแจ้งและรับภาพที่ต้องการเป็นการตอบแทนได้อย่างง่ายดาย
อินเทอร์เฟซการแก้ไขที่เปิดตัวในช่วงปลายปี 2022 ทำงานด้วยวิธีเดียวกันเพื่อความเรียบง่าย ด้วยเครื่องมือยางลบที่ใช้งานง่าย คุณสามารถลบส่วนต่างๆ ของภาพที่คุณต้องการแก้ไขหรือปรับปรุงด้วย Dall-E จากตรงนั้น คุณสามารถเพิ่มข้อความแจ้งเพื่อเพิ่มองค์ประกอบใหม่ให้กับรูปภาพของคุณได้
คุณยังสามารถใช้เครื่องมือ “Generation Frame” เพื่อขยายผืนผ้าใบและขนาดของรูปภาพที่มีอยู่ คุณสามารถเพิ่มเฟรมรุ่นนี้ไปที่ด้านบน ด้านล่าง หรือด้านใดก็ได้ คุณยังสามารถปรับขนาดของกรอบนี้ เมื่อคุณได้กำหนดกรอบการสร้างและให้ Dall-E แจ้งแล้ว คุณจะเห็นภาพของคุณขยายเป็นขนาดที่คุณต้องการในขณะที่สอดคล้องกับภาพ ธีม และสไตล์ศิลปะที่เหลือ
การแนะนำอย่างรวดเร็วนี้ช่วยให้คุณเข้าใจว่า Dall-E คืออะไรและใช้งานอย่างไร แต่หากคุณมีคำถามเพิ่มเติมว่าเครื่องมือนี้ใช้เวทมนตร์อย่างไร คุณสามารถเดินหน้าต่อไปโดยทำความเข้าใจกับกลไกที่อยู่เบื้องหลัง
Dall-E ใช้เทคนิคต่างๆ ที่ใช้ AI เพื่อเพิ่มความสามารถในการมองเห็น
ในขณะที่ Dall-E เชี่ยวชาญอย่างเหลือเชื่อในการระบุรูปภาพและจำลองสไตล์ของพวกเขา ความสามารถนี้ไม่ได้เกิดขึ้นจากที่ไหนเลย แต่ Dall-E AI ได้รับการฝึกโดยใช้โครงข่ายประสาทเทียมที่รวมการอ้างอิงภาพเข้ากับการควบคุมด้วยภาษาธรรมชาติ
โครงข่ายประสาทเทียมนี้ใช้การเรียนรู้เชิงลึก ซึ่งเป็นส่วนย่อยของ AI ที่ประมวลผลชุดข้อมูลขนาดใหญ่เพื่อเรียนรู้เกี่ยวกับเรื่องที่อยู่ในมือ การเรียนรู้เชิงลึกผ่านโครงข่ายประสาทเทียมยังสามารถจัดหมวดหมู่รูปแบบต่างๆ และระบุความสัมพันธ์ระหว่างส่วนต่างๆ ของข้อมูลได้ด้วย
โครงข่ายประสาทเทียมที่ใช้สำหรับการฝึกอบรม Dall-E เรียกว่า CLIP (การฝึกล่วงหน้าภาษา-รูปภาพที่ขัดแย้งกัน)CLIP ใช้การตั้งค่าการเรียนรู้แบบ Zero-Shot (ZSL) ซึ่งทำให้สามารถประเมินตัวอย่างภาพและการอ้างอิงข้อความได้ แม้ว่าจะไม่เคยพบมาก่อนก็ตาม ซึ่งทำได้ด้วยชุดข้อมูลจำนวนมากที่ CLIP ได้รับการฝึกอบรมมาเพื่อจับคู่ข้อมูลชุดหนึ่งกับอีกชุดหนึ่ง
เพื่อเรียนรู้การอ้างอิงภาพและข้อความเหล่านี้ Dall-E ได้รับการฝึกอบรมไม่น้อยกว่า 12 พันล้านพารามิเตอร์. พารามิเตอร์เหล่านี้ติดป้ายกำกับภาพต่างๆ ด้วยการอ้างอิงข้อความ และทำให้ Dall-E เข้าใจสิ่งที่คาดว่าจะได้รับเมื่อผู้ใช้ขอให้สร้างภาพเฉพาะ นอกเหนือจากการเปิดใช้งานการสร้างภาพสำหรับแนวคิดที่ตรงไปตรงมาแล้ว ความสามารถนี้ยังส่องผ่านแนวคิดนามธรรม เช่น การวาดตัวละครมนุษย์จากวัตถุที่ไม่มีชีวิต
นี่คือจุดที่โมเดล AI ของ Dall-E ใกล้เคียงกับผลิตภัณฑ์อื่นโดยนักพัฒนา OpenAI อย่างใกล้ชิด การแข่งขันนี้มาในรูปแบบของ Generative Pre-trained Transformer 3 (GPT-3) ในขณะที่ GPT-3 สร้างข้อความโดยการคาดคะเนว่าคำถัดไปควรเป็นอย่างไรในข้อความที่กำลังสร้าง Dall-E สร้างรูปภาพโดยพิจารณาว่าควรสร้างรูปภาพที่สมบูรณ์ตามองค์ประกอบที่สร้างขึ้นในชุดข้อมูลอย่างไร
เมื่อคุณเข้าใจว่า Dall-E คืออะไร คุณจะเห็นว่าวิธีการนี้ทำงานได้อย่างมหัศจรรย์สำหรับการสร้างภาพคุณภาพสูงตั้งแต่เริ่มต้นได้อย่างไร นอกจากนี้ยังทำให้ชัดเจนว่าโปรแกรมสร้างภาพขยายและแก้ไขภาพที่มีอยู่ได้อย่างไร
ด้วยการใช้พารามิเตอร์ที่น่าประทับใจ โครงข่ายประสาทเทียมที่ออกแบบมาโดยเฉพาะ และ GUI ที่ใช้งานง่าย Dall-E ช่วยให้ทุกคนได้รับประโยชน์จากเทคโนโลยี AI กำเนิดที่พัฒนาอย่างรวดเร็วสำหรับการผลิตภาพ
รีวิว Dall-E: Dall-E ราคาเท่าไหร่?
ดัล-อี มีให้บริการผ่านผู้พัฒนา OpenAI ซึ่งเสนอเครดิตเพื่อแลกกับราคาที่กำหนด เครดิตแต่ละรายการเท่ากับคำขอสร้างภาพเดียว
ซึ่งหมายความว่าคุณจะใช้เครดิตเดียวในการสร้างรูปภาพจากข้อความแจ้ง แก้ไขรูปภาพที่มีอยู่เพื่อทำการแก้ไข หรือขยายผืนผ้าใบสำหรับรูปภาพที่มีอยู่ ทุกคำขอสร้างภาพยังมีสี่รูปแบบ แต่หากคุณขอรูปแบบอื่นๆ เพิ่มเติม จะมีค่าใช้จ่ายหนึ่งเครดิตต่อหนึ่งคำขอ
ในขณะที่เขียน Dall-E มีจำหน่ายในราคา 115 เครดิตในราคา 15 ดอลลาร์ เครดิตที่คุณซื้อจะหมดอายุภายใน 12 เดือน คุณสามารถใช้เครดิตเหล่านี้ผ่านเว็บอินเตอร์เฟสหรือผ่าน Dall-E API
โดยรวมแล้ว แผนการกำหนดราคาของ Dall-E นั้นแพงกว่าคู่แข่งที่ใกล้เคียงที่สุด กลางการเดินทาง และ การแพร่กระจายที่เสถียร. ในขณะที่เขียน ราคาของ Midjourney เริ่มต้นที่ $10 สำหรับคำขอสร้างภาพ 200 รายการ นอกจากนี้ยังมีแผน $ 30 สำหรับคำขอสร้างผู้ใช้ไม่จำกัด ในขณะที่ Stable Diffusion คิดค่าบริการ $100 สำหรับเครดิตภาพ 100 ภาพ
แต่เนื่องจาก AI ของ Dall-E ได้รับการฝึกฝนอย่างครอบคลุมมากกว่าและมีเครื่องมือขยายภาพที่ Midjourney และ Stable Diffusion ไม่มี จึงมีเหตุผลเพียงพอที่จะตั้งราคาผลิตภัณฑ์ในระดับที่สูงขึ้น นอกจากนี้ Midjourney ต้องการให้คุณเข้าถึงโปรแกรมผ่าน Discord ในขณะที่ Dall-E มีให้บริการผ่านเว็บ GUI และ API ของตัวเอง
หลังจากเรียนรู้ว่า Dall-E คืออะไรและค่าธรรมเนียมประเภทใดที่นำมาสู่ตาราง คุณจะตัดสินใจได้ง่ายขึ้นว่าควรชำระค่าบริการหรือไม่ ในขณะที่คุณดำเนินการดังกล่าว คุณสามารถสมัครใช้งานโซลูชันและรับเครดิตฟรี 50 เครดิตได้ทันที หลังจากนั้นคุณจะได้รับ 15 เครดิตฟรีในแต่ละเดือน อย่างไรก็ตาม เครดิตฟรีเหล่านี้จะหมดอายุภายในหนึ่งเดือน ซึ่งตรงข้ามกับวันหมดอายุของเครดิตที่จ่ายไปตลอดทั้งปี
ข้อดีและข้อเสียของ Dall-E
Dall-E 2 ซึ่งเปิดตัวในเดือนเมษายน พ.ศ. 2022 มีความสามารถมากกว่ารุ่นก่อน ด้วยการใช้รูปภาพและการอ้างอิงจากโครงข่ายประสาทเทียม โปรแกรมสามารถสร้างภาพที่น่าประทับใจที่เหมาะกับพรอมต์ของคุณบ่อยกว่าไม่ นอกจากนี้ คุณสมบัติ GUI และ API ที่ใช้งานง่ายยังช่วยให้คุณสร้างภาพได้ง่ายขึ้นโดยไม่ต้องใช้เครื่องมือแก้ไขภาพที่ซับซ้อน
จากที่กล่าวมา Dall-E ยังคงอยู่ในช่วงเริ่มต้นซึ่งคุณไม่สามารถคาดหวังความสมบูรณ์แบบในทุกภาพที่สร้างขึ้นได้ แม้ว่าโปรแกรมจะพยายามอย่างดีที่สุดเพื่อเติมคำในช่องว่างที่เป็นสุภาษิตหรือตามตัวอักษรผ่านภาพที่มันสร้างขึ้น แต่ก็ยังมีข้อจำกัดเนื่องจากต้องดีพอๆ กับข้อมูลที่ได้รับการฝึกอบรมเท่านั้น
ตัวอย่างเช่น หากคุณแจ้ง Dall-E อย่างที่ไม่เคยมีมาก่อนในโครงข่ายประสาทเทียม ระบบจะสร้างภาพที่ใกล้เคียงที่สุดเท่าที่จะเป็นไปได้กับข้อความแจ้งของคุณ ซึ่งอาจตรงกับคำสั่งของคุณในภาษาธรรมชาติหรือไม่ก็ได้ ตัวอย่างเช่น ลองนึกถึงการให้คำสั่งแก่โปรแกรมเพื่อสร้าง “ทะเลสาบสวอนเลคบนเวที” อาจหมายถึงบัลเลต์ยอดนิยมหรือทะเลสาบที่มีหงส์อยู่บนเวทีได้เป็นอย่างดี
เมื่อสร้างภาพเหมือนจริง คุณยังสามารถสังเกตเห็นปัญหาต่อเนื่องเกี่ยวกับการแสดงภาพใบหน้า มือ เท้า และรายละเอียดทางกายวิภาคอื่นๆ บางครั้ง AI จะสร้างคุณลักษณะที่ไม่ค่อยมีในแง่ของความแม่นยำของภาพหรือความสมจริง แต่นี่เป็นปัญหาที่มีอยู่ทั่วกระดานสำหรับเครื่องมือ AI อื่นๆ เช่นกัน
Dall-E คุ้มค่าหรือไม่?
หากคุณสนุกกับการเป็นส่วนหนึ่งของเทคโนโลยีใหม่ๆ เล่นกับฟีเจอร์สนุกๆ และอดทนต่อปัญหาการทำงานเล็กน้อยในนามของความคืบหน้า Dall-E อาจคุ้มค่ากับเวลาและเงินของคุณ โดยเฉพาะอย่างยิ่งถ้าคุณเข้าใจว่า Dall-E ทำงานอย่างไรในแง่ของข้อจำกัด และไม่รู้สึกหงุดหงิดเมื่อคุณต้องเผชิญกับความท้าทายเหล่านี้โดยตรง
แต่นั่นคือที่ที่คุณมีตัวเลือกที่ดีในรูปแบบของเครดิตฟรีของ Dall-E เพื่อให้แน่ใจว่าคุณพอใจกับโปรแกรมก่อนที่จะชำระเงิน คุณสามารถดำเนินการต่อโดยสมัครใช้งานแพลตฟอร์มและทดลองใช้งานผ่านเครดิตฟรี หากคุณพอใจกับประสิทธิภาพของ Dall-E คุณสามารถลงทะเบียนเพื่อรับเครดิตแบบชำระเงินที่มีให้ผ่านแพลตฟอร์มของ OpenAI
ความคิดเห็น 0 คำตอบ