مواد پر جائیں
یہ مضمون AI کا استعمال کرتے ہوئے جاپانی سے ترجمہ کیا گیا ہے۔
جاپانی میں پڑھیں
یہ مضمون پبلک ڈومین (CC0) میں ہے۔ اسے آزادانہ طور پر استعمال کرنے کے لیے آزاد محسوس کریں۔ CC0 1.0 Universal

بلاگ پوسٹس سے پریزنٹیشن ویڈیو کی خودکار تخلیق

https://youtu.be/vmt_WVBJMj4?si=OZlzEqfEvWjPakYV

میں نے ایک ایسا سسٹم تیار کیا ہے جو جنریٹو AI کا استعمال کرتے ہوئے بلاگ مضامین سے خود بخود پریزنٹیشن ویڈیوز بناتا ہے اور انہیں یوٹیوب پر اپ لوڈ کرتا ہے۔

کچھ مہارت کے ساتھ، جنریٹو AI نہ صرف پریزنٹیشن کی کہانی ترتیب دے سکتا ہے بلکہ پریزنٹیشن کا مواد بھی تیار کر سکتا ہے۔

مزید برآں، جنریٹو AI سے پریزنٹیشن کے لیے اسکرپٹ بنوا کر اور پھر اس اسکرپٹ کو ٹیکسٹ-ٹو-اسپیچ جنریٹو AI سے پڑھوا کر، آڈیو ڈیٹا بھی تیار کیا جا سکتا ہے۔

پریزنٹیشن مواد اور آڈیو ڈیٹا کو ملا کر ایک ویڈیو تیار ہوتی ہے۔

کاموں کے اس سلسلے کو خودکار بنا کر، میں نے ایک کلک کے ساتھ پریزنٹیشن ویڈیوز کو خودکار طریقے سے تیار کرنا ممکن بنا دیا ہے۔

طریقہ کار

اس عمل کا سب سے اہم حصہ پریزنٹیشن مواد کی تیاری ہے۔

جنریٹو AI تصاویر بنانے میں بہترین ہے، لیکن یہ عام طور پر تصاویر یا ڈرائنگ تک محدود ہوتا ہے۔ متن اور اعداد و شمار پر مبنی دستاویزات، جیسے کہ پریزنٹیشن مواد بنانا، تصویر بنانے والے AI کے لیے مشکل ہے۔

لہذا، میں نے متن اور اعداد و شمار پر مبنی مواد کو ٹیکسٹ پر مبنی فارمیٹ میں تیار کیا ہے، جو ایک پروگرامنگ زبان کی طرح ہے۔

ایسا مواد بنانے کے لیے کئی فارمیٹس استعمال کیے جا سکتے ہیں۔

ابتدا میں، میں نے مارپ (Marp) کو آزمایا، جو خاص طور پر پریزنٹیشن بنانے کا ایک فارمیٹ ہے، لیکن اس کی صلاحیتیں محدود تھیں۔ لہذا، میں نے زیادہ عام SVG فارمیٹ استعمال کرنے کا فیصلہ کیا، جو ویکٹر گرافکس کے لیے ہے۔

SVG جیسے ٹیکسٹ پر مبنی فارمیٹ کے ساتھ، ایک معیاری چیٹ پر مبنی جنریٹو AI مواد تیار کر سکتا ہے اگر اسے یہ درخواست دی جائے کہ، "براہ کرم اس بلاگ مضمون کے مواد کو متعارف کرانے والی پریزنٹیشن مواد SVG فارمیٹ میں بنائیں۔"

متن کے بہاؤ کا مسئلہ

یہاں مسئلہ یہ ہے کہ متن اکثر دستاویز کے بیرونی فریم یا دستاویز کے اندر موجود شکلوں کے فریم سے باہر نکل جاتا ہے۔

انسان مکمل شدہ دستاویز کو دیکھ کر فوری طور پر متن کے بہاؤ کو محسوس کر لے گا۔ تاہم، مکمل شدہ دستاویز کا بصری معائنہ کرنے کے بجائے، SVG متن کے مرحلے پر متن کے بہاؤ کا پتہ لگانا مشکل ہے۔

نتیجے کے طور پر، چیٹ پر مبنی جنریٹو AI اکثر ایسی دستاویزات تیار کرتا ہے جس میں متن کا بہاؤ کثرت سے ہوتا ہے۔

یقیناً، AI زیادہ تر مواد کو اچھی طرح تیار کرتا ہے، اور میں صرف متن کے بہاؤ کو دستی طور پر درست کر سکتا ہوں۔ تاہم، اس سے ہر بار ایک دستی قدم شامل ہو جائے گا۔

لہذا، SVG دستاویزات تیار کرتے وقت متن کے بہاؤ کو روکنے کے لیے اقدامات کو شامل کرنا، اور خود بخود یہ پتہ لگانے کے لیے ایک طریقہ کار تیار کرنا ضروری ہو گیا کہ آیا تیار کردہ SVG میں کوئی متن کا بہاؤ موجود ہے۔

متن کے بہاؤ کو روکنے کے لیے، میں نے جنریٹو AI کو پریزنٹیشن مواد بنانے کی ہدایت کرتے وقت بنیادی قواعد، آپریٹنگ طریقہ کار، اور احتیاطی تدابیر فراہم کرنے کا طریقہ اختیار کیا۔

قواعد کے طور پر، میں نے اسے پیچیدہ شکلیں استعمال نہ کرنے اور متن کے فونٹ سائز کو طے کرنے کی ہدایت کی۔

مزید برآں، میں نے اسے دستاویز کے اندر ایک جملے میں حروف کی تعداد شمار کرنے، اسے فونٹ سائز سے ضرب دے کر چوڑائی اور اونچائی کا اندازہ لگانے، اور پھر پہلے سے یہ تصدیق کرنے کا طریقہ کار اختیار کرنے کی ہدایت کی کہ متن فریم یا شکلوں سے باہر نہیں نکلتا۔

اس عمل کے دوران، میں نے AI کو ہدایت کی کہ جانچے گئے عمل اور نتائج کو SVG فائل کے اندر پری-چیک تبصرے کے طور پر ریکارڈ کرے۔

ان ہدایات کو شامل کرنے سے کچھ بہتری آئی، لیکن ابتدائی درستگی اطمینان بخش نہیں تھی۔ لہذا، میں نے بار بار کئی مختلف حالتیں تیار کیں، عام غلطیوں کو ہدایات میں احتیاطی تدابیر کے طور پر شامل کیا، اور قواعد اور ہدایات پر عمل نہ ہونے کی صورت میں فوری متن کے اندر بار بار ان پر زور دیا۔

تجربے اور غلطی کے ذریعے ان فوری بہتریوں کو بار بار دہرانے سے، متن کے بہاؤ کو ایک حد تک روکا جا سکتا ہے۔

تاہم، ان تمام کوششوں کے باوجود، کمال حاصل نہیں کیا جا سکتا، لہذا میں نے بعد کے مرحلے میں ایک چیک نافذ کرنے کا فیصلہ کیا۔

اس پوسٹ جنریشن چیک کے لیے، میں نے تصاویر کا بصری معائنہ کرنے کی صلاحیت رکھنے والے جنریٹو AI کو استعمال کرنے کی کوشش کی، لیکن یہ متن کے بہاؤ کا مؤثر طریقے سے پتہ نہیں لگا سکا، لہذا میں نے یہ طریقہ ترک کر دیا۔

اس کے بعد، میں نے ایک اور طریقہ آزمایا: SVG متن کو دوبارہ چیٹ پر مبنی جنریٹو AI میں داخل کرنا تاکہ جانچ کی جا سکے۔

یہ طریقہ بصری معائنہ AI کے مقابلے میں متن کے بہاؤ کا پتہ لگانے میں بہتر تھا، لیکن اس کی پتہ لگانے کی درستگی اب بھی بہت زیادہ نہیں تھی۔ یہاں بھی، بہاؤ کا پتہ لگانے کے لیے ہدایات کو بار بار بہتر بنا کر، میں ایک خاص سطح کی درستگی حاصل کر سکا، لیکن ایک بہترین سطح نہیں۔

لہذا، میں نے متن کے بہاؤ کا زیادہ سختی سے پتہ لگانے کے لیے ایک پروگرام بنانے کا فیصلہ کیا۔ یہ پروگرام یہ جانچتا ہے کہ آیا متن دستاویز کے فریم یا اندرونی شکلوں سے باہر نکلتا ہے، جملوں کی لمبائی اور پریزنٹیشن مواد میں فونٹ سائز سے چوڑائی اور اونچائی کا حساب لگا کر، جیسا کہ جنریٹو AI کو ہدایت کی گئی تھی۔

اس پروگرام کو بنانا محنت طلب تھا، لیکن آخر کار یہ درست پتہ لگانے کے قابل ہو گیا۔

متن کے بہاؤ کے علاوہ، ایسے معاملات بھی تھے جہاں AI نے پیچیدہ چارٹس بنانے کی کوشش کی اور بگڑی ہوئی آؤٹ پٹ تیار کی۔ ایسے پہلوؤں کے لیے، میں نے چیٹ پر مبنی جنریٹو AI سے قواعد کی خلاف ورزی کی جانچ کروانے کا طریقہ برقرار رکھا۔

یہ چیک یہ طے کرتا ہے کہ آیا AI نے قواعد میں بیان کردہ سے زیادہ پیچیدہ شکلیں بنائی ہیں، انہیں ناقابل قبول قرار دیتے ہوئے نشان زد کرتا ہے۔

اوور فلو کی جانچ کے لیے اس پروگرام اور قواعد کی خلاف ورزی کی جانچ کے لیے جنریٹو AI کے ساتھ، اب مسائل کا بڑے پیمانے پر پتہ لگایا جا سکتا ہے۔

بعد میں کارروائی

اگر ان جانچ پڑتال کے دوران کوئی خرابی پائی جاتی ہے، تو تیار کردہ SVG فارمیٹ کا مواد رد کر دیا جاتا ہے اور دوبارہ تیار کیا جاتا ہے۔ اس کی وجہ یہ ہے کہ مسائل والے علاقوں کی نشاندہی اور ان کی اصلاح اکثر دیگر مسائل کا باعث بنتی ہے، جس سے بالآخر زیادہ وقت لگتا ہے۔

ایک بار جب متن کے بہاؤ سے پاک پریزنٹیشن مواد مکمل ہو جاتا ہے، تو اگلا قدم اس مواد اور اصل بلاگ مضمون کو جنریٹو AI میں ڈالنا ہے تاکہ بیاناتی اسکرپٹ تیار کیا جا سکے۔ یہاں کسی خاص جدت کی ضرورت نہیں تھی۔

پھر، بیاناتی اسکرپٹ کو ٹیکسٹ ٹو اسپیچ جنریٹو AI کا استعمال کرتے ہوئے آڈیو ڈیٹا میں تبدیل کیا جاتا ہے۔ یہاں بھی، اس کے لیے کسی خاص تکنیک کی ضرورت نہیں تھی۔

آخر میں، SVG فارمیٹ کے پریزنٹیشن مواد کو PNG امیجز میں تبدیل کیا جاتا ہے، اور پھر، ffmpeg نامی ایک ٹول کا استعمال کرتے ہوئے، اسے آڈیو کے ساتھ mp4 ویڈیو میں تبدیل کیا جاتا ہے۔ اس سے یہ عمل مکمل ہو جاتا ہے۔

SVG فارمیٹ کی سلائیڈز کی تخلیق کے بعد کے عمل کی سیریز کو جنریٹو AI سے مشورہ کرتے ہوئے پروگرام لکھ کر آسانی سے خودکار بنایا جا سکتا ہے۔

نتیجہ

اس خودکار پریزنٹیشن ویڈیو جنریشن سسٹم کو کامیابی سے بنا کر اور بہتر بنا کر، میں نے گزشتہ ہفتے یوٹیوب پر ویڈیوز شائع کرنا شروع کر دیں۔

تاہم، اس سسٹم کی تکمیل کے فوراً بعد، گوگل کے AI ٹول، NotebookLM میں بھی ٹیکسٹ دستاویزات کی وضاحت کے لیے خودکار طور پر ویڈیوز بنانے کی ایک ایسی ہی خصوصیت شامل کی گئی۔

لہذا، یہ توقع کی جاتی ہے کہ مستقبل میں، AI خدمات فراہم کرنے والی کمپنیاں اسی طرح کی خدمات جاری کریں گی، جس سے افراد کو ایسے سسٹمز کو شروع سے بنانے کی ضرورت ختم ہو جائے گی۔

اس کے باوجود، جنریٹو AI کا فائدہ اٹھاتے ہوئے ایک عملی پروگرام کو اس سنجیدہ طریقے سے تیار کرنا ایک اہم کامیابی رہی ہے، جس سے مجھے جنریٹو AI کو مؤثر طریقے سے استعمال کرنے کے کلیدی اصولوں کو سمجھنے کا موقع ملا ہے۔