รีวิว Dall-E: เรียนรู้เพิ่มเติมเกี่ยวกับเครื่องมือสร้างภาพ AI ยอดนิยม

หากคุณสมัครใช้บริการจากลิงก์ในหน้านี้ Reeves and Sons Limited อาจได้รับค่าคอมมิชชั่น ดูของเรา คำสั่งจริยธรรม.

Dall-E เป็นโปรแกรมปัญญาประดิษฐ์ (AI) ที่สร้างภาพตามข้อความแจ้ง ซึ่งหมายความว่าสิ่งที่คุณต้องการในการสร้างภาพคุณภาพสูงผ่าน AI ก็คือการให้คำแนะนำที่ชัดเจนในภาษาธรรมชาติแก่ Dall-E

ในขณะที่เขียน เครื่องมือที่ใช้ AI ทำงานในรูปแบบของ ดัล-อี 2ซึ่งเป็นเวอร์ชันล่าสุดของโปรแกรม Dall-E 2 มีจำหน่ายในเชิงพาณิชย์ผ่าน OpenAI ของผู้พัฒนา ซึ่งนำเสนอโปรแกรมผ่านทางเว็บอินเตอร์เฟส เช่นเดียวกับ Application Programming Interface (API)

เพื่อเรียนรู้ว่า Dall-E คืออะไรและทำงานอย่างไร ต่อไปนี้เป็นคำแนะนำโดยย่อเกี่ยวกับโปรแกรมสร้างภาพที่ทันสมัยนี้

ประเด็นสำคัญ

  • Dall-E เป็นเครื่องมือสร้างภาพที่ใช้ AI ที่สร้างภาพผ่านคำสั่งข้อความ
  • Dall-E ใช้การเรียนรู้เชิงลึกเพื่อเลียนแบบข้อความแจ้งและสัญญาณภาพ และเปลี่ยนสื่อภาพที่เกี่ยวข้องให้เป็นภาพที่เชื่อมโยงกัน
  • Dall-E ยังมีโปรแกรมแก้ไขภาพเพื่อปรับปรุงภาพที่มีอยู่ผ่านความสามารถในการแก้ไขโดยใช้ AI
  • Dall-E มีให้ใช้งานทั้งแบบส่วนติดต่อผู้ใช้แบบกราฟิก (GUI) และ API
  • คุณยังคงรักษาสิทธิ์ความเป็นเจ้าของโดยสมบูรณ์สำหรับรูปภาพใดๆ ที่คุณสร้างผ่าน Dall-E

คุณสร้างภาพ AI ผ่านข้อความได้อย่างไร

ภาพข้อความขนาดเล็ก

Dall-E เป็นเครื่องมือสร้างรูปภาพที่ทำงานผ่าน AI เพื่อรวบรวมคำสั่งที่เป็นข้อความและเปลี่ยนให้เป็นรูปภาพต้นฉบับ เพื่อให้บรรลุผลสำเร็จ Dall-E ใช้การเรียนรู้เชิงลึกเพื่อทำความเข้าใจชุดรูปภาพและข้อมูลอ้างอิงจำนวนมาก

เมื่อได้รับข้อความแจ้ง Dall-E จะใช้การฝึกอบรมจากชุดข้อมูลเหล่านั้นเพื่อสร้างภาพที่ตรงกับคำแนะนำที่ให้ไว้ สิ่งนี้ทำให้ทุกคนสามารถใช้ AI ในการสร้างภาพได้โดยไม่ต้องใช้การเข้ารหัสหรือคำแนะนำทางเทคนิคมากมาย

ฟังก์ชันนี้เป็นหนึ่งในหลายเหตุผลที่ทำให้ Dall-E ได้รับความนิยมอย่างมากตั้งแต่เปิดตัวในปี 2020 ในการทำซ้ำล่าสุด Dall-E 2 โปรแกรมนี้ยังมีความสามารถเพิ่มเติมอีกด้วย ซึ่งรวมถึงตัวเลือกในการแก้ไขภาพที่มีอยู่โดยการเพิ่มองค์ประกอบภาพใหม่ หรือความสามารถในการขยายผ้าใบโดยการสร้างภาพที่เกี่ยวข้องสำหรับภาพต้นฉบับ

หากต้องการใช้ Dall-E 2 คุณสามารถไปที่เว็บไซต์ของ OpenAI และใช้เครื่องมือผ่าน GUI บนเว็บ แม้ว่าคุณจะไม่เคยใช้โปรแกรม AI มาก่อน อินเทอร์เฟซที่เรียบง่ายช่วยให้คุณป้อนข้อความแจ้งและรับภาพที่ต้องการเป็นการตอบแทนได้อย่างง่ายดาย

อินเทอร์เฟซการแก้ไขที่เปิดตัวในช่วงปลายปี 2022 ทำงานด้วยวิธีเดียวกันเพื่อความเรียบง่าย ด้วยเครื่องมือยางลบที่ใช้งานง่าย คุณสามารถลบส่วนต่างๆ ของภาพที่คุณต้องการแก้ไขหรือปรับปรุงด้วย Dall-E จากตรงนั้น คุณสามารถเพิ่มข้อความแจ้งเพื่อเพิ่มองค์ประกอบใหม่ให้กับรูปภาพของคุณได้

คุณยังสามารถใช้เครื่องมือ “Generation Frame” เพื่อขยายผืนผ้าใบและขนาดของรูปภาพที่มีอยู่ คุณสามารถเพิ่มเฟรมรุ่นนี้ไปที่ด้านบน ด้านล่าง หรือด้านใดก็ได้ คุณยังสามารถปรับขนาดของกรอบนี้ เมื่อคุณได้กำหนดกรอบการสร้างและให้ Dall-E แจ้งแล้ว คุณจะเห็นภาพของคุณขยายเป็นขนาดที่คุณต้องการในขณะที่สอดคล้องกับภาพ ธีม และสไตล์ศิลปะที่เหลือ

การออกแบบภาพ Dalle ใหม่

การแนะนำอย่างรวดเร็วนี้ช่วยให้คุณเข้าใจว่า Dall-E คืออะไรและใช้งานอย่างไร แต่หากคุณมีคำถามเพิ่มเติมว่าเครื่องมือนี้ใช้เวทมนตร์อย่างไร คุณสามารถเดินหน้าต่อไปโดยทำความเข้าใจกับกลไกที่อยู่เบื้องหลัง

Dall-E ใช้เทคนิคต่างๆ ที่ใช้ AI เพื่อเพิ่มความสามารถในการมองเห็น

ในขณะที่ Dall-E เชี่ยวชาญอย่างเหลือเชื่อในการระบุรูปภาพและจำลองสไตล์ของพวกเขา ความสามารถนี้ไม่ได้เกิดขึ้นจากที่ไหนเลย แต่ Dall-E AI ได้รับการฝึกโดยใช้โครงข่ายประสาทเทียมที่รวมการอ้างอิงภาพเข้ากับการควบคุมด้วยภาษาธรรมชาติ

โครงข่ายประสาทเทียมนี้ใช้การเรียนรู้เชิงลึก ซึ่งเป็นส่วนย่อยของ AI ที่ประมวลผลชุดข้อมูลขนาดใหญ่เพื่อเรียนรู้เกี่ยวกับเรื่องที่อยู่ในมือ การเรียนรู้เชิงลึกผ่านโครงข่ายประสาทเทียมยังสามารถจัดหมวดหมู่รูปแบบต่างๆ และระบุความสัมพันธ์ระหว่างส่วนต่างๆ ของข้อมูลได้ด้วย

โครงข่ายประสาทเทียมที่ใช้สำหรับการฝึกอบรม Dall-E เรียกว่า CLIP (การฝึกล่วงหน้าภาษา-รูปภาพที่ขัดแย้งกัน). CLIP ใช้การตั้งค่าการเรียนรู้แบบ Zero-shot (ZSL) ซึ่งช่วยให้สามารถประเมินตัวอย่างภาพและการอ้างอิงข้อความได้แม้ว่าจะไม่เคยพบมาก่อนก็ตาม สิ่งนี้เป็นไปได้ผ่านชุดข้อมูลที่กว้างขวางซึ่ง CLIP ได้รับการฝึกอบรมเพื่อให้ตรงกับชุดข้อมูลหนึ่งชุดformatไอออนกับคนอื่น ๆ

เพื่อเรียนรู้การอ้างอิงภาพและข้อความเหล่านี้ Dall-E ได้รับการฝึกอบรมไม่น้อยกว่า 12 พันล้านพารามิเตอร์. พารามิเตอร์เหล่านี้ติดป้ายกำกับภาพต่างๆ ด้วยการอ้างอิงข้อความ และทำให้ Dall-E เข้าใจสิ่งที่คาดว่าจะได้รับเมื่อผู้ใช้ขอให้สร้างภาพเฉพาะ นอกเหนือจากการเปิดใช้งานการสร้างภาพสำหรับแนวคิดที่ตรงไปตรงมาแล้ว ความสามารถนี้ยังส่องผ่านแนวคิดนามธรรม เช่น การวาดตัวละครมนุษย์จากวัตถุที่ไม่มีชีวิต

นี่คือจุดที่โมเดล AI ของ Dall-E ใกล้เคียงกับผลิตภัณฑ์อื่นโดยนักพัฒนา OpenAI อย่างใกล้ชิด การแข่งขันนี้มาในรูปแบบของ Generative Pre-trained Transformer 3 (GPT-3) ในขณะที่ GPT-3 สร้างข้อความโดยการคาดคะเนว่าคำถัดไปควรเป็นอย่างไรในข้อความที่กำลังสร้าง Dall-E สร้างรูปภาพโดยพิจารณาว่าควรสร้างรูปภาพที่สมบูรณ์ตามองค์ประกอบที่สร้างขึ้นในชุดข้อมูลอย่างไร

เมื่อคุณเข้าใจว่า Dall-E คืออะไร คุณจะเห็นว่าวิธีการนี้ทำงานได้อย่างมหัศจรรย์สำหรับการสร้างภาพคุณภาพสูงตั้งแต่เริ่มต้นได้อย่างไร นอกจากนี้ยังทำให้ชัดเจนว่าโปรแกรมสร้างภาพขยายและแก้ไขภาพที่มีอยู่ได้อย่างไร

ด้วยการใช้พารามิเตอร์ที่น่าประทับใจ โครงข่ายประสาทเทียมที่ออกแบบมาโดยเฉพาะ และ GUI ที่ใช้งานง่าย Dall-E ช่วยให้ทุกคนได้รับประโยชน์จากเทคโนโลยี AI กำเนิดที่พัฒนาอย่างรวดเร็วสำหรับการผลิตภาพ

รีวิว Dall-E: Dall-E ราคาเท่าไหร่?

ดัล-อี มีให้บริการผ่านผู้พัฒนา OpenAI ซึ่งเสนอเครดิตเพื่อแลกกับราคาที่กำหนด เครดิตแต่ละรายการเท่ากับคำขอสร้างภาพเดียว

ซึ่งหมายความว่าคุณจะใช้เครดิตเดียวในการสร้างรูปภาพจากข้อความแจ้ง แก้ไขรูปภาพที่มีอยู่เพื่อทำการแก้ไข หรือขยายผืนผ้าใบสำหรับรูปภาพที่มีอยู่ ทุกคำขอสร้างภาพยังมีสี่รูปแบบ แต่หากคุณขอรูปแบบอื่นๆ เพิ่มเติม จะมีค่าใช้จ่ายหนึ่งเครดิตต่อหนึ่งคำขอ

ในขณะที่เขียน Dall-E มีจำหน่ายในราคา 115 เครดิตในราคา 15 ดอลลาร์ เครดิตที่คุณซื้อจะหมดอายุภายใน 12 เดือน คุณสามารถใช้เครดิตเหล่านี้ผ่านเว็บอินเตอร์เฟสหรือผ่าน Dall-E API

โดยรวมแล้ว แผนการกำหนดราคาของ Dall-E นั้นแพงกว่าคู่แข่งที่ใกล้เคียงที่สุด กลางการเดินทาง และ การแพร่กระจายที่เสถียร. ในขณะที่เขียน ราคาของ Midjourney เริ่มต้นที่ $10 สำหรับคำขอสร้างภาพ 200 รายการ นอกจากนี้ยังมีแผน $ 30 สำหรับคำขอสร้างผู้ใช้ไม่จำกัด ในขณะที่ Stable Diffusion คิดค่าบริการ $100 สำหรับเครดิตภาพ 100 ภาพ

แต่เนื่องจาก AI ของ Dall-E ได้รับการฝึกฝนอย่างครอบคลุมมากกว่าและมีเครื่องมือขยายภาพที่ Midjourney และ Stable Diffusion ไม่มี จึงมีเหตุผลเพียงพอที่จะตั้งราคาผลิตภัณฑ์ในระดับที่สูงขึ้น นอกจากนี้ Midjourney ต้องการให้คุณเข้าถึงโปรแกรมผ่าน Discord ในขณะที่ Dall-E มีให้บริการผ่านเว็บ GUI และ API ของตัวเอง

หลังจากเรียนรู้ว่า Dall-E คืออะไรและค่าธรรมเนียมประเภทใดที่นำมาสู่ตาราง คุณจะตัดสินใจได้ง่ายขึ้นว่าควรชำระค่าบริการหรือไม่ ในขณะที่คุณดำเนินการดังกล่าว คุณสามารถสมัครใช้งานโซลูชันและรับเครดิตฟรี 50 เครดิตได้ทันที หลังจากนั้นคุณจะได้รับ 15 เครดิตฟรีในแต่ละเดือน อย่างไรก็ตาม เครดิตฟรีเหล่านี้จะหมดอายุภายในหนึ่งเดือน ซึ่งตรงข้ามกับวันหมดอายุของเครดิตที่จ่ายไปตลอดทั้งปี

ข้อดีและข้อเสียของ Dall-E

Dall-E 2 ซึ่งเปิดตัวในเดือนเมษายน พ.ศ. 2022 มีความสามารถมากกว่ารุ่นก่อน ด้วยการใช้รูปภาพและการอ้างอิงจากโครงข่ายประสาทเทียม โปรแกรมสามารถสร้างภาพที่น่าประทับใจที่เหมาะกับพรอมต์ของคุณบ่อยกว่าไม่ นอกจากนี้ คุณสมบัติ GUI และ API ที่ใช้งานง่ายยังช่วยให้คุณสร้างภาพได้ง่ายขึ้นโดยไม่ต้องใช้เครื่องมือแก้ไขภาพที่ซับซ้อน

จากที่กล่าวมา Dall-E ยังคงอยู่ในช่วงเริ่มต้นซึ่งคุณไม่สามารถคาดหวังความสมบูรณ์แบบในทุกภาพที่สร้างขึ้นได้ แม้ว่าโปรแกรมจะพยายามอย่างดีที่สุดเพื่อเติมคำในช่องว่างที่เป็นสุภาษิตหรือตามตัวอักษรผ่านภาพที่มันสร้างขึ้น แต่ก็ยังมีข้อจำกัดเนื่องจากต้องดีพอๆ กับข้อมูลที่ได้รับการฝึกอบรมเท่านั้น

ตัวอย่างเช่น หากคุณแจ้ง Dall-E อย่างที่ไม่เคยมีมาก่อนในโครงข่ายประสาทเทียม ระบบจะสร้างภาพที่ใกล้เคียงที่สุดเท่าที่จะเป็นไปได้กับข้อความแจ้งของคุณ ซึ่งอาจตรงกับคำสั่งของคุณในภาษาธรรมชาติหรือไม่ก็ได้ ตัวอย่างเช่น ลองนึกถึงการให้คำสั่งแก่โปรแกรมเพื่อสร้าง “ทะเลสาบสวอนเลคบนเวที” อาจหมายถึงบัลเลต์ยอดนิยมหรือทะเลสาบที่มีหงส์อยู่บนเวทีได้เป็นอย่างดี

เมื่อสร้างภาพเหมือนจริง คุณยังสามารถสังเกตเห็นปัญหาต่อเนื่องเกี่ยวกับการแสดงภาพใบหน้า มือ เท้า และรายละเอียดทางกายวิภาคอื่นๆ บางครั้ง AI จะสร้างคุณลักษณะที่ไม่ค่อยมีในแง่ของความแม่นยำของภาพหรือความสมจริง แต่นี่เป็นปัญหาที่มีอยู่ทั่วกระดานสำหรับเครื่องมือ AI อื่นๆ เช่นกัน

Dall-E คุ้มค่าหรือไม่?

หากคุณสนุกกับการเป็นส่วนหนึ่งของเทคโนโลยีใหม่ๆ เล่นกับฟีเจอร์สนุกๆ และอดทนต่อปัญหาการทำงานเล็กน้อยในนามของความคืบหน้า Dall-E อาจคุ้มค่ากับเวลาและเงินของคุณ โดยเฉพาะอย่างยิ่งถ้าคุณเข้าใจว่า Dall-E ทำงานอย่างไรในแง่ของข้อจำกัด และไม่รู้สึกหงุดหงิดเมื่อคุณต้องเผชิญกับความท้าทายเหล่านี้โดยตรง

แต่นั่นคือที่ที่คุณมีตัวเลือกที่ดีในรูปแบบของเครดิตฟรีของ Dall-E เพื่อให้แน่ใจว่าคุณพอใจกับโปรแกรมก่อนที่จะชำระเงิน คุณสามารถดำเนินการต่อโดยสมัครใช้งานแพลตฟอร์มและทดลองใช้งานผ่านเครดิตฟรี หากคุณพอใจกับประสิทธิภาพของ Dall-E คุณสามารถลงทะเบียนเพื่อรับเครดิตแบบชำระเงินที่มีให้ผ่านแพลตฟอร์มของ OpenAI

เซร์คิโอ คอสตา (ปริญญาเอก)

Sergio สอนการเป็นผู้ประกอบการและนวัตกรรมในระดับต่างๆ (BSc, MSc, MBA, PhD) ส่วนใหญ่ที่ University of Bath, Imperial College London, Warwick Business School เขาได้เผยแพร่งานวิจัยใน Journal of Business Ventures และการประชุมการจัดการชั้นนำ (AOM, SMS, Babson, BAM)

ความคิดเห็น 0 คำตอบ

เขียนความเห็น

ที่อยู่อีเมลของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมาย *

อันดับ *

ไซต์นี้ใช้ Akismet เพื่อลดสแปม เรียนรู้วิธีการประมวลผลข้อมูลความคิดเห็นของคุณ.