स्थिर प्रसार एक हैअव्यक्त प्रसार मॉडल (एलडीएम)डीप लर्निंग टेक्स्ट-टू-इमेज मॉडल। पिक्सेल स्पेस में काम करने वाले पारंपरिक मॉडलों के विपरीत, यह निम्न-आयामी में काम करता हैअव्यक्त स्थानइस प्रक्रिया में डीनोइज़िंग ऑपरेशन किया जाता है, जो कंप्यूटर कंप्यूटिंग शक्ति की मांग को काफी कम कर देता है। इसके मुख्य घटकों में वेरिएबल ऑटोएनकोडर (वीएई), यू-नेट डीनोइज़िंग नेटवर्क और टेक्स्ट एनकोडर (जैसे सीएलआईपी) शामिल हैं।
| संस्करण | फ़ीचर विवरण |
|---|---|
| v1.5 | सबसे लोकप्रिय बुनियादी संस्करण, ओपन सोर्स इकोसिस्टम सबसे परिपक्व है, और इसमें कई तृतीय-पक्ष फ़ाइन-ट्यूनिंग मॉडल हैं। |
| v2.1 | बेहतर छवि रिज़ॉल्यूशन समर्थन और नकारात्मक संकेतों का उन्नत नियंत्रण। |
| SDXL | मापदंडों की संख्या में उल्लेखनीय वृद्धि करता है, इसमें मजबूत संरचना और यथार्थवाद क्षमताएं होती हैं, और मूल 1024x1024 रिज़ॉल्यूशन का समर्थन करता है। |
| SD3 | एक नए वास्तुशिल्प डिजाइन को अपनाने से, यह पाठ प्रतिपादन क्षमताओं और जटिल निर्देशों के अनुपालन में काफी सुधार करता है। |
स्थिर प्रसार को निष्पादित करना मुख्य रूप से ग्राफिक्स कार्ड पर निर्भर करता हैग्राफ़िक्स प्रोसेसिंग यूनिट (जीपीयू)औरवीडियो रैम (वीआरएएम). आमतौर पर बेहतर पीढ़ी की गति और स्थिरता के लिए कम से कम 8 जीबी वीआरएएम वाला एनवीआईडीआईए ग्राफिक्स कार्ड रखने की सिफारिश की जाती है। स्थानीय रूप से निष्पादित करने के लिए, सामान्य ऑपरेशन इंटरफ़ेस शामिल हैंAutomatic1111 (WebUI)、ComfyUIयाForge。
क्लोज्ड सोर्स एआई ड्राइंग टूल्स की तुलना में, स्टेबल डिफ्यूजन का लाभ यह हैअत्यधिक अनुकूलन योग्यऔरपूरी तरह से स्थानीयकृत निष्पादन. उपयोगकर्ता मॉडल को प्रशिक्षित कर सकते हैं और अंतर्निहित मापदंडों को स्वयं समायोजित कर सकते हैं, और उत्पन्न सामग्री क्लाउड प्लेटफ़ॉर्म पर सेंसरशिप प्रतिबंधों के अधीन नहीं है, जिससे यह पेशेवर रचनाकारों और प्रौद्योगिकी डेवलपर्स के लिए पसंदीदा उपकरण बन जाता है।
यह कई प्रजातियों के लिए व्यापक फ़ाइन-ट्यूनिंग के साथ एसडी 1.5 पर आधारित एक मॉडल है। यह सामान्य मॉडलों के साथ चौपाए पैदा करते समय सामान्य संयुक्त त्रुटियों और अंग कनेक्शन तर्क को ठीक करता है, और विशेष रूप से स्तनधारियों में बालों के घनत्व और पक्षी पंखों की परत को बढ़ाता है। अत्यधिक यथार्थवादी जीव उत्पन्न करने के लिए यह पहली पसंद है।
पर आधारितSDXLअत्यधिक उच्च रिज़ॉल्यूशन और पर्यावरण एकीकरण क्षमताओं के साथ वास्तुकला विकास। यह मॉडल जंगली जानवरों और प्राकृतिक पृष्ठभूमि (जैसे वर्षावन, रेगिस्तान और गहरे समुद्र) के बीच बातचीत को संभालने में अच्छा है, और पारिस्थितिक फोटोग्राफी की बनावट के साथ छवियां उत्पन्न कर सकता है। इसका लाभ त्वचा या फर पर प्रकाश और छाया प्रतिबिंब की नाजुक प्रसंस्करण में निहित है, जिससे अत्यधिक कृत्रिम प्लास्टिक महसूस से बचा जा सकता है।
विशिष्ट पालतू जानवरों या दुर्लभ प्राणियों (जैसे कॉर्गिस, ओसेलॉट्स, गिरगिट) के लिए डिज़ाइन किए गए हल्के मॉडल। इस प्रकार के मॉडल को आमतौर पर निर्माता द्वारा विशिष्ट नस्लों की दर्जनों तस्वीरों का उपयोग करके प्रशिक्षित किया जाता है। यह नस्ल के अद्वितीय पैटर्न वितरण, कान के आकार और पुतली की विशेषताओं को सटीक रूप से बहाल कर सकता है। सटीकता में सुधार के लिए इसका उपयोग अक्सर यथार्थवादी बड़े मॉडलों के संयोजन में किया जाता है।
मॉडल विशेष रूप से ड्रेगन, यूनिकॉर्न, ग्रिफिन और अन्य पौराणिक प्राणियों के लिए डिज़ाइन किए गए हैं। इस प्रकार का मॉडल विभिन्न प्रकार के जीवित जानवरों की शारीरिक विशेषताओं को जोड़ता है और उचित संरचना और कलात्मक सुंदरता के साथ काल्पनिक प्राणियों को उत्पन्न कर सकता है। तराजू, हड्डी के उभार और पंख की झिल्ली की बनावट को संभालने में विशेष अनुकूलन हैं।
यह वर्तमान में हैSDXLवास्तुकला में शीर्ष यथार्थवादी मॉडलों में से एक। यह प्रकृति दृश्यों और मैक्रो फोटोग्राफी को संसाधित करने, पौधों की सूक्ष्म बनावट, जैसे पत्तियों पर नसें, पंखुड़ियों की पारदर्शिता और सुबह की ओस को सटीक रूप से प्रस्तुत करने में उत्कृष्टता प्राप्त करता है। इसका लाभ इसकी शक्तिशाली प्रकाश और छाया कैप्चर क्षमताओं में निहित है, जो अंतरिक्ष की मजबूत समझ के साथ जंगल या बगीचे की छवियां उत्पन्न कर सकता है।
प्रथागत उपयोग के लिएSD 1.5उपयोगकर्ताओं के लिए, यह एक क्लासिक यथार्थवादी बड़ा मॉडल है। यह गमले में लगे पौधों, घरेलू पौधों या घरेलू बागवानी की तस्वीरें तैयार करने के लिए बिल्कुल उपयुक्त है। इसके द्वारा उत्पन्न छवि टोन अत्यधिक कृत्रिम संशोधन के बिना अधिक यथार्थवादी है, और एकल-लेंस कैमरे की बनावट का पूरी तरह से अनुकरण कर सकता है।
यह कोई एक बड़ा मॉडल नहीं है, बल्कि विशेष रूप से इसके लिए हैपौधे का चित्रणशैली प्रशिक्षण के लिए वज़न. इसे सामान्य मॉडल के नीचे स्थापित करने से 18वीं या 19वीं शताब्दी की वैज्ञानिक ड्राइंग शैली के समान छवियां उत्पन्न हो सकती हैं। यह पौधों की जैविक संरचनात्मक विशेषताओं पर जोर देता है, अक्सर चर्मपत्र पृष्ठभूमि और एक नाजुक रेखा स्कैन के साथ, और कला डिजाइन या शैक्षिक उद्देश्यों के लिए उपयुक्त है।
यह मॉडल प्राकृतिक रंग पुनरुत्पादन में सर्वोत्तमता पर केंद्रित है। पौधों को पैदा करते समय यह एक बहुत ही संतुलित हरा टोन प्रदान करता है, एआई के साथ आम फ्लोरोसेंट हरे या अतिसंतृप्ति के मुद्दों से बचता है। बाहरी परिदृश्यों, वर्षावनों, या प्राकृतिक पारिस्थितिकी की वृत्तचित्र-शैली की छवियां बनाने के लिए यह एक बहुत ही स्थिर विकल्प है।