Langsung menyang Konten
Artikel iki wis diterjemahake saka Basa Jepang nggunakake AI
Waca ing Basa Jepang
Artikel iki ana ing Domain Publik (CC0). Aja ragu-ragu nggunakake kanthi bebas. CC0 1.0 Universal

Otomatisasi Nggawe Video Presentasi saka Kiriman Blog

https://youtu.be/vmt_WVBJMj4?si=OZlzEqfEvWjPakYV

Aku ngembangaké sistem sing nggunakaké AI generatif kanggo kanthi otomatis nggawé vidéo presentasi saka artikel blog lan ngunggah menyang YouTube.

Kanthi sawetara cara, AI generatif ora mung bisa ngrancang alur cerita presentasi nanging uga bisa nggawé materi presentasi.

Salajengipun, kanthi nyuwun AI generatif nggawé skrip kanggo presentasi lan banjur nyuwun AI generatif text-to-speech maca skrip kasebut kanthi banter, data audio uga bisa digawé.

Nggabungaké materi presentasi lan data audio banjur ngasilaké vidéo.

Kanthi ngotomatisasi séri tugas iki, aku wis bisa kanthi otomatis nggawé vidéo presentasi kanthi siji klik.

Mekanisme

Bagéan sing paling wigati ing prosès iki yaiku nggawé materi presentasi.

AI generatif pinter banget nggawé gambar, nanging biasane mung diwatesi ing foto utawa gambar. Nggawé dhokumèn sing fokus ing tèks lan gambar, kaya materi presentasi, iku tantangan kanggo AI sing nggawé gambar.

Mulané, aku nggawé materi sing fokus ing tèks lan gambar ing format basis tèks, padha karo basa pemrograman.

Ana sawetara format sing bisa digunakaké kanggo nggawé materi kaya ngono.

Wiwitané, aku nyoba Marp, format khusus kanggo nggawé presentasi, nanging kemampuané winates. Mula, aku mutusaké nggunakaké format SVG sing luwih umum, yaiku kanggo grafis vektor.

Kanthi format basis tèks kaya SVG, AI generatif basis obrolan standar bisa nggawé materi kasebut yèn dijaluk kanthi panyuwunan kaya, "Tulung gawékaké materi presentasi ing format SVG sing ngenalaké isi artikel blog iki."

Masalah Tèks Kebanjiran

Masalah ing kene yaiku tèks kerep ngluwihi bingkai njaba dhokumèn utawa bingkai gambar ing dhokumèn kasebut.

Manungsa bakal langsung ngerteni tèks kebanjiran nalika ndeleng dhokumèn sing wis rampung. Nanging, ndeteksi tèks kebanjiran ing tahap tèks SVG, tinimbang liwat inspeksi visual dhokumèn sing wis rampung, iku angel.

Akibaté, AI generatif berbasis chat asring ngasilake dhokumèn kanthi tèks kebanjiran sing kerep.

Mesthi, AI ngasilake sebagian besar konten kanthi apik, lan aku bisa wae ngoreksi tèks kebanjiran kasebut kanthi manual. Nanging, iki bakal ngenalake langkah manual saben wektu.

Mula, dadi perlu kanggo nggabungake langkah-langkah kanggo nyegah tèks kebanjiran nalika ngasilake dhokumèn SVG, lan ngembangake mekanisme kanggo kanthi otomatis ndeteksi yen ana tèks kebanjiran ing SVG sing digawe.

Kanggo nyegah tèks kebanjiran, aku nggunakake pendekatan nyedhiyakake AI generatif kanthi aturan dhasar, prosedur operasi, lan cathetan pèngetan nalika nginstruksikake kanggo nggawe materi presentasi.

Minangka aturan, aku nginstruksikake supaya ora nggunakake gambar sing rumit lan kanggo nggarap ukuran font tèks.

Salajengipun, aku nginstruksikake supaya ngetutake prosedur ngitung jumlah karakter ing sawijining ukara ing dhokumèn, banjur ngaliani karo ukuran font kanggo ngira-ngira ambane lan dhuwure, lan banjur konfirmasi sadurunge yen tèks ora ngluwihi bingkai utawa gambar.

Sajrone proses iki, aku nginstruksikake AI kanggo ngrekam proses sing wis dipriksa lan asil minangka komentar pra-pemeriksaan ing file SVG.

Nambahake instruksi kasebut nggawa sawetara perbaikan, nanging akurasi awal ora marem. Dadi, aku bola-bali ngasilake sawetara variasi, nambahake poin kesalahan umum minangka cathetan pèngetan ing instruksi, lan negesake aturan lan instruksi bola-bali ing tèks pituduh yen ora ditindakake.

Kanthi ngulang-ulang perbaikan pituduh kasebut liwat coba-coba, tèks kebanjiran bisa ditekan nganti sawetara.

Nanging, sanajan kanthi kabeh upaya iki, kasempurnaan ora bisa digayuh, mula aku mutusake kanggo ngetrapake pemeriksaan ing tahap sabanjure.

Kanggo pemeriksaan pasca-generasi iki, aku nyoba nggunakake AI generatif sing bisa mriksa gambar kanthi visual, nanging ora bisa ndeteksi tèks kebanjiran kanthi efektif, mula aku ninggalake pendekatan kasebut.

Sabanjure, aku nyoba metode liya: nglebokake tèks SVG maneh menyang AI generatif berbasis chat kanggo dipriksa.

Metode iki luwih apik ing ndeteksi tèks kebanjiran tinimbang AI inspeksi visual, nanging akurasi deteksi isih ora dhuwur banget. Ing kene maneh, kanthi ningkatake instruksi kanggo ndeteksi kebanjiran kanthi bola-bali, aku bisa nggayuh tingkat akurasi tartamtu, nanging ora sing sampurna.

Mula, aku mutusake nggawe program kanggo ndeteksi tèks kebanjiran kanthi luwih ketat. Program iki mriksa apa tèks ngluwihi bingkai dhokumèn utawa gambar internal kanthi ngitung ambane lan dhuwure saka dawa ukara lan ukuran font ing materi presentasi, kaya sing diinstruksikake menyang AI generatif.

Nggawe program iki mbutuhake tenaga kerja, nanging pungkasane bisa ndeteksi kanthi akurat.

Saliyane tèks kebanjiran, ana uga kasus ing ngendi AI nyoba nggawe bagan sing rumit lan ngasilake output sing cacat. Kanggo aspek kasebut, aku tetep nggunakake pendekatan nyuwun AI generatif berbasis chat kanggo nindakake pemeriksaan pelanggaran aturan.

Pemeriksaan iki nemtokake yen AI nggawe gambar sing luwih rumit tinimbang sing ditemtokake ing aturan, kanthi menehi tandha minangka ora bisa ditampa.

Kanthi program iki kanggo pemeriksaan kebanjiran lan AI generatif kanggo pemeriksaan pelanggaran aturan, masalah saiki bisa dideteksi kanthi wiyar.

Pangolahan Sabanjuré

Yen ana penolakan sing dideteksi nalika pemeriksaan iki, materi format SVG sing digawé bakal dibuwang lan digawé maneh. Iki amarga nuduhaké lan mbeneraké area sing bermasalah asring nyebabaké masalah liyane, sing pungkasane mbutuhaké wektu luwih akeh.

Sawisé materi presentasi sing bébas tèks kebanjiran rampung, langkah sabanjuré yaiku nglebokaké materi iki lan artikel blog asli menyang AI generatif kanggo nggawé skrip narasi. Ora ana cara khusus sing dibutuhaké ing kene.

Banjur, skrip narasi diowahi dadi data audio nggunakaké AI generatif text-to-speech. Manèh, ora ana tèknik khusus sing dibutuhaké kanggo iki.

Pungkasan, materi presentasi format SVG diowahi dadi gambar PNG, lan banjur, nggunakaké piranti sing diarani ffmpeg, diowahi dadi vidéo mp4 kanthi audio. Iki ngrampungaké prosès kasebut.

Séri prosès sawisé nggawé slide format SVG bisa kanthi gampang diotomatisasi kanthi nulis program nalika konsultasi karo AI generatif.

Kesimpulan

Sawisé kasil mbangun lan nyampurnakaké sistem otomatisasi nggawe video presentasi iki dhéwé, aku wiwit nerbitaké video ing YouTube minggu kepungkur.

Nanging, ora suwe sawisé sistem iki rampung, NotebookLM Google, sawijining piranti AI, uga nambah fitur sing padha kanggo otomatis nggawe video kanggo njlentrehaké dhokumèn tèks.

Mula, diprediksi ing mangsa ngarep, perusahaan sing nawaraké layanan AI bakal ngetokaké layanan sing padha, ngilangi kabutuhan individu kanggo mbangun sistem kaya ngono saka awal.

Sanadyan mangkono, ngembangaké program praktis kanthi nggunakaké AI generatif kanthi cara sing serius wis dadi prestasi sing signifikan, ngidini aku ngerteni prinsip-prinsip utama nggunakaké AI generatif kanthi efektif.