Kajian Dall-E: Ketahui Lebih Lanjut Mengenai Alat Penjanaan Imej AI Popular

Jika anda melanggan perkhidmatan daripada pautan di halaman ini, Reeves and Sons Limited mungkin mendapat komisen. Lihat kami pernyataan etika.

Dall-E ialah program kecerdasan buatan (AI) yang menjana imej berdasarkan gesaan teks. Ini bermakna bahawa semua yang anda perlukan untuk menghasilkan imej berkualiti tinggi melalui AI adalah untuk menyediakan Dall-E arahan yang jelas dalam bahasa semula jadi.

Pada masa penulisan, alat berasaskan AI beroperasi dalam bentuk Dall-E 2, yang merupakan versi terkini program. Dall-E 2 tersedia secara komersial melalui pembangunnya OpenAI, yang menawarkan program itu melalui antara muka webnya serta antara muka pengaturcaraan aplikasi (API).

Untuk mengetahui apa itu Dall-E dan cara ia berfungsi, berikut ialah panduan ringkas untuk program penjanaan imej terkini ini.

Perkara utama

  • Dall-E ialah alat penjanaan imej berasaskan AI yang menghasilkan imej melalui arahan teks.
  • Dall-E menggunakan pembelajaran mendalam untuk mengasimilasikan gesaan teks serta isyarat visual, dan menukar bahan visual yang berkaitan kepada imej yang koheren.
  • Dall-E juga menawarkan editor imej untuk meningkatkan imej sedia ada melalui keupayaan penyuntingan berasaskan AI.
  • Dall-E tersedia sebagai antara muka pengguna grafik (GUI) dan API.
  • Anda mengekalkan hak pemilikan lengkap untuk mana-mana imej yang anda hasilkan melalui Dall-E.

Bagaimana Anda Menjana Imej AI Melalui Teks?

imej teks dalle

Dall-E ialah alat penjanaan imej yang berfungsi melalui AI untuk mengasimilasikan arahan teks dan mengubahnya menjadi imej asal. Untuk mencapai kejayaan ini, Dall-E menggunakan pembelajaran mendalam untuk memahami set imej dan rujukan yang luas.

Apabila ia diberi gesaan teks, Dall-E menggunakan latihannya daripada set data tersebut untuk menghasilkan imej yang sepadan dengan arahan yang diberikan. Ini membolehkan sesiapa sahaja menggunakan AI untuk penjanaan imej, tanpa perlu menggunakan pengekodan atau arahan teknikal yang meluas.

Fungsi ini merupakan salah satu daripada banyak sebab mengapa Dall-E menjadi begitu popular sejak penampilan sulungnya pada tahun 2020. Dalam lelaran terbarunya, Dall-E 2, program ini turut menawarkan keupayaan tambahan. Ini termasuk pilihan untuk mengedit imej sedia ada dengan menambahkan elemen visual baharu atau keupayaan untuk mengembangkan kanvas dengan mencipta visual berkaitan untuk imej asal.

Untuk menggunakan Dall-E 2, anda boleh pergi ke tapak web OpenAI dan menggunakan alat tersebut melalui GUI berasaskan web. Walaupun anda tidak pernah menggunakan program AI sebelum ini, antara muka yang mudah memudahkan anda memasukkan gesaan teks anda dan mendapatkan imej yang anda inginkan sebagai balasan.

Antara muka pengeditan yang telah diumumkan pada akhir 2022 berfungsi dengan pendekatan yang sama terhadap kesederhanaan. Dengan alat pemadam yang mudah digunakan, anda boleh mengalih keluar bahagian imej anda yang anda ingin diedit atau dipertingkatkan dengan Dall-E. Dari sana, anda boleh menambah gesaan teks untuk menambah elemen baharu pada imej anda.

Anda juga boleh menggunakan alat "Kerangka Penjanaan" untuk memanjangkan kanvas dan saiz imej sedia ada. Anda boleh menambah bingkai generasi ini ke arah atas, bawah atau mana-mana sisi. Anda juga boleh melaraskan saiz bingkai ini. Sebaik sahaja anda telah menyelesaikan bingkai penjanaan dan memberikan gesaan kepada Dall-E, anda boleh melihat imej anda memanjang ke saiz yang anda inginkan sambil selaras dengan visual, tema dan gaya seni yang lain.

reka bentuk semula imej dalle

Pengenalan pantas ini membolehkan anda memahami apa itu Dall-E dan cara mengendalikannya. Tetapi jika anda mempunyai soalan lanjut tentang bagaimana alat itu berfungsi dengan betul, anda boleh bergerak ke hadapan dengan memahami mekanik di belakangnya.

Dall-E Menggunakan Pelbagai Teknik Berasaskan AI untuk Meningkatkan Kehebatan Visualnya

Walaupun Dall-E sangat mahir dalam mengenal pasti imej dan meniru gaya mereka, kemahiran itu tidak lahir entah dari mana. Sebaliknya, AI Dall-E telah dilatih dengan menggunakan rangkaian saraf yang menggabungkan rujukan visual dengan penyeliaan bahasa semula jadi.

Rangkaian saraf ini menggunakan pembelajaran mendalam, yang merupakan subset AI yang memproses set data yang besar untuk mempelajari tentang perkara yang ada. Dengan itu, pembelajaran mendalam melalui rangkaian saraf juga boleh mengkategorikan corak yang berbeza dan mengenal pasti hubungan antara pelbagai segmen data.

Rangkaian saraf yang digunakan untuk latihan Dall-E dipanggil CLIP (Pralatihan Bahasa-Imej Kontrastif). CLIP menggunakan persediaan pembelajaran sifar pukulan (ZSL), yang membolehkannya menilai sampel visual dan rujukan teks walaupun ia tidak pernah menemuinya sebelum ini. Ini boleh dilakukan melalui set data yang luas yang CLIP telah dilatih untuk memadankan satu set dalamformation dengan yang lain.

Untuk mempelajari rujukan visual dan teks ini, Dall-E telah dilatih tidak kurang daripada 12 bilion parameter. Parameter ini melabelkan imej yang berbeza dengan rujukan teks dan membolehkan Dall-E memahami perkara yang diharapkan daripadanya apabila pengguna meminta imej tertentu dijana. Selain membolehkan penjanaan imej untuk konsep mudah, keupayaan ini juga menyerlah dalam konsep abstrak seperti melukis watak antropomorfik daripada objek tidak bernyawa.

Di sinilah model AI Dall-E sepadan dengan produk lain oleh pembangunnya OpenAI. Perlawanan ini datang dalam bentuk Generative Pre-trained Transformer 3 (GPT-3). Walaupun GPT-3 menjana teks dengan meramalkan perkataan seterusnya yang sepatutnya ada dalam teks yang dijananya, Dall-E menghasilkan imej dengan menentukan cara ia harus mencipta imej lengkap mengikut unsur yang dijananya dalam satu siri.

Sebaik sahaja anda memahami apa itu Dall-E, anda boleh melihat cara pendekatan ini berfungsi dengan baik untuk penjanaan imej berkualiti tinggi dari awal. Dengan itu, ia juga menjelaskan cara program mencipta imej lanjutan dan mengedit imej sedia ada.

Dengan menggunakan pemilihan parameter yang mengagumkan, rangkaian neural yang direka dengan sengaja, dan GUI intuitif, Dall-E memudahkan semua orang mendapat manfaat daripada teknologi AI generatif yang berkembang pesat untuk penghasilan imej.

Kajian Dall-E: Berapakah Kos Dall-E?

Papak tersedia melalui pembangunnya OpenAI, yang menawarkan kredit sebagai pertukaran untuk harga yang ditetapkan. Setiap kredit sama dengan permintaan penjanaan imej tunggal.

Ini bermakna anda akan menggunakan kredit tunggal untuk menghasilkan imej daripada gesaan teks, mengedit imej sedia ada untuk membuat pengubahsuaian atau memanjangkan kanvas untuk imej sedia ada. Setiap permintaan penjanaan imej juga memberikan anda empat variasi. Tetapi jika anda meminta lebih banyak variasi, kosnya adalah satu kredit bagi setiap permintaan.

Pada masa penulisan, Dall-E tersedia pada harga 115 kredit untuk $15. Kredit yang anda beli akan tamat tempoh dalam tempoh 12 bulan. Anda boleh menggunakan kredit ini melalui antara muka web atau melalui API Dall-E.

Secara keseluruhan, pelan harga Dall-E lebih mahal daripada pesaing terdekatnya, Pertengahan perjalanan and Resapan Stabil. Pada masa penulisan, harga Midjourney bermula pada $10 untuk 200 permintaan penjanaan imej. Ia juga menawarkan pelan $30 untuk permintaan penjanaan pengguna tanpa had. Manakala, Stable Diffusion mengenakan bayaran $100 untuk 100 kredit imej.

Tetapi memandangkan AI Dall-E lebih terlatih dan menawarkan alat sambungan imej yang Midjourney dan Stable Diffusion tidak mempunyai, ia mempunyai sebab yang mencukupi untuk menetapkan harga produknya pada peringkat yang lebih tinggi. Selain itu, Midjourney memerlukan anda mengakses program melalui Discord. Manakala, Dall-E tersedia melalui GUI webnya sendiri serta API.

Selepas mengetahui apa itu Dall-E dan jenis yuran yang dibawa ke meja, menjadi lebih mudah bagi anda untuk menentukan sama ada anda perlu membayar perkhidmatannya atau tidak. Semasa anda berbuat demikian, anda boleh mendaftar untuk penyelesaian itu dan dapatkan 50 kredit percuma serta-merta. Selepas itu, anda boleh mendapat 15 kredit percuma setiap bulan. Walau bagaimanapun, kredit percuma ini tamat tempoh dalam masa sebulan berbanding tarikh tamat tempoh setahun kredit berbayar.

Kebaikan dan Keburukan Dall-E

Dall-E 2, yang diperkenalkan pada April 2022, mempunyai lebih banyak keupayaan berbanding pendahulunya. Dengan menggunakan imej dan rujukan daripada rangkaian sarafnya, program ini boleh menghasilkan imej yang mengagumkan yang lebih kerap sesuai dengan gesaan anda. Selain itu, ciri GUI dan API intuitifnya memudahkan anda menghasilkan imej tanpa perlu menggunakan alat penyuntingan imej yang berbelit-belit.

Dengan itu dikatakan, Dall-E masih melalui fasa permulaannya di mana anda tidak boleh mengharapkan kesempurnaan pada setiap satu imej yang dihasilkannya. Walaupun program ini melakukan yang terbaik untuk mengisi kekosongan peribahasa atau literal melalui imej yang dijananya, ia masih mempunyai hadnya kerana hanya sebaik data yang sedang dilatih.

Sebagai contoh, jika anda memberi Dall-E gesaan bahawa ia tidak mempunyai preseden dalam rangkaian sarafnya, ia akan menjana imej yang paling hampir dengan gesaan anda yang mungkin sesuai atau tidak sesuai dengan arahan anda dalam bahasa semula jadinya. Sebagai contoh, fikirkan tentang memberi program arahan untuk menjana "tasik angsa di atas pentas." Ia boleh merujuk kepada balet yang popular atau tasik literal dengan angsa diletakkan di atas pentas.

Apabila menjana imej fotorealistik, anda juga boleh melihat masalah berterusan dengan gambaran muka, tangan, kaki dan butiran anatomi yang lain. Kadangkala, AI menjana ciri yang tidak begitu ada dari segi ketepatan visual atau realisme. Tetapi ini adalah isu yang wujud di seluruh papan untuk alat AI lain juga.

Adakah Dall-E Berbaloi?

Jika anda gemar menjadi sebahagian daripada teknologi baharu, bermain dengan ciri yang menyeronokkan dan bertolak ansur dengan sedikit isu fungsi atas nama kemajuan, Dall-E mungkin berbaloi dengan masa dan dana anda. Ini benar terutamanya jika anda memahami apa yang Dall-E bekerja dari segi batasan dan tidak berasa kecewa apabila anda terpaksa menghadapi cabaran ini secara langsung.

Tetapi di situlah anda mempunyai pilihan yang baik dalam bentuk kredit percuma Dall-E. Untuk memastikan bahawa anda berpuas hati dengan program ini sebelum anda membayarnya, anda boleh bergerak ke hadapan dengan mendaftar untuk platform dan mencubanya melalui kredit percuma. Jika anda berpuas hati dengan prestasi Dall-E, anda boleh mendaftar untuk kredit berbayar yang ditawarkan melalui platform OpenAI.

Sergio Costa (PhD)

Sergio mengajar keusahawanan dan inovasi di pelbagai peringkat (BSc, MSc, MBA, PhD) terutamanya di University of Bath, Imperial College London, Warwick Business School. Beliau telah menerbitkan penyelidikan mengenai Journal of Business Venturing dan persidangan pengurusan terkemuka (AOM, SMS, Babson, BAM).

Komen-komen Responses 0

Sila tinggalkan balasan anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda *

Kedudukan *

Laman web ini menggunakan Akismet untuk mengurangkan spam. Ketahui bagaimana data komen anda diproses.