با تبلیغات و نگرانیهایی که در مورد تصاویر تولید شده توسط هوش مصنوعی وجود دارد، خوب است که درک درستی از نحوه عملکرد این تصاویر داشته باشیم. در این دوره، مربی Jonathan Fernandes - متخصص در هوش مصنوعی و مدلهای زبان بزرگ - اجزای تولید متن به تصویر را تجزیه میکند: رمزگذارهای متن، شبکه عصبی و رمزگذار خودکار. او نحوه تنظیم دقیق مدلها را بر اساس مجموعه دادههای خود توضیح میدهد و مدلهای محبوب مختلف را با هم مقایسه میکند. او همچنین مدلهای مختلف را مقایسه میکند و به شما کمک میکند تا معیارهای عملکرد، و همچنین سوگیریها، محدودیتها و بحثهای احتمالی را درک کنید.
نمونه ویدیوی آموزشی ( زیرنویسها جدا از ویدیو است و میتوانید آنرا نمایش ندهید ) :
[فارسی]
01 مقدمه
01-01 شروع با تولید متن به تصویر
02 انتشار نهفته
02-01 انتشار چیست؟
02-02 مروری بر سطح بالا
02-03 زمانبندی
02-04 مدل U-Net
02-05 آموزش یک مدل
02-06 ارزیابی تصاویر تولید شده
03 مدل های انتشار شرطی
03-01 مدل های انتشار مشروط
03-02 چالش: CIFAR-10
03-03 راه حل: CIFAR-10
04 رمزگذارها و انتشار پایدار
04-01 مراحل بعدی برای سفر هوش مصنوعی شما
04-02 رمزگذارهای متن در CLIP
04-03 رمزگذار متن در عمل
04-04 قرار دادن همه اینها با Stable Diffusion
04-05 تعصب، محدودیت ها و بحث و جدل
05 نتیجه گیری
05-01 مراحل بعدی برای سفر هوش مصنوعی شما
[ENGLISH]
01 Introduction
01-01 Getting started with text-to-image generation
02 Latent Diffusion
02-01 What is diffusion?
02-02 High-level overview
02-03 Scheduler
02-04 U-Net model
02-05 Train a model
02-06 Evaluating generated images
03 Conditioned Diffusion Models
03-01 Conditioned diffusion models
03-02 Challenge: CIFAR-10
03-03 Solution: CIFAR-10
04 Encoders and Stable Diffusion
04-01 Next steps for your AI journey
04-02 Text encoders in CLIP
04-03 Text encoder in practice
04-04 Putting it all together with Stable Diffusion
04-05 Bias, limitations, and controversy
05 Conclusion
05-01 Next steps for your AI journey
جاناتان فرناندس در صنعت ارتباطات راه دور ، به عنوان یک معمار راه حل ، کار می کند.
چندین سال پیش، در حالی که بر روی یک مجموعه داده بزرگ کار می کرد، جاناتان توانست Excel را شکست دهد. او برای کمک به Python و Pandas برگشت و از آن زمان به بعد هنوز به گذشته اش نگاه نکرده است. او از دانش داده ها لذت میبرد ، که در آن عشق او به اعداد، برنامه نویسی، و آمار را با هم ترکیب می کند و همچنین با مردم کار می کند تا اطلاعات آنها را درک کند. جاناتان دارای مدرک کارشناسی در علوم رایانه و MBA از دانشگاه وارویک است.