DeepSeek: चीन का AI मॉडल जिसने ChatGPT और Claude AI को पीछे छोड़ा
DeepSeek ने मचाई धूम, AI की दुनिया में नई क्रांति
पूरे विश्व में आर्टिफिशियल इंटेलिजेंस (AI) में नई तकनीकों का विकास हो रहा है। अब चीन के नए AI मॉडल DeepSeek ने सबका ध्यान अपनी तरफ खींच लिया है क्योंकि DeepSeek प्रसिद्ध ChatGPT, Gemini और Claude AI के परफॉर्मेंस से कई कदम आगे है। सोशल मीडिया प्लेटफॉर्म और शेयर बाजार में नई AI DeepSeek की लोकप्रियता जारी है। DeepSeek को साधारण भाषा में कहें तो इसका मतलब है कि रिसर्च करना, कठिन क्वेरी का जवाब देना और सुधार करना है।
कौन है DeepSeek के Founder
चर्चित नए AI मॉडल DeepSeek को लियांग वेनफेंग ने हांग्जो में बनाया था। बर्नस्टीन की रिपोर्ट में कहा गया है कि डीपसीक ने AI मॉडल के दो मुख्य मॉडल बनाए हैं। ‘डीपसीक-वी3’ और ‘डीपसीक आर1’ वी3 मॉडल। यह एक बड़ा AI मॉडल है जो मिक्सचर-ऑफ-एक्सपर्ट्स (एमओई) आर्किटेक्चर का उपयोग करता है। यह दृष्टिकोण कई छोटे मॉडलों को एक साथ कार्य करने के लिए जोड़ता है, जिसके परिणामस्वरूप अन्य बड़े मॉडलों की तुलना में काफी कम कंप्यूटिंग संसाधनों का उपयोग करते हुए उच्च प्रदर्शन होता है। V3 मॉडल में कुल 671 बिलियन पैरामीटर हैं।
यह मल्टी-हेड लेटेंट अटेंशन (MHLA) जैसी नवीन तकनीकों को भी शामिल करता है, जो मेमोरी उपयोग को कम करता है, और FP8 कंप्यूटेशन का उपयोग करके मिश्रित-सटीक प्रशिक्षण, जो दक्षता में सुधार करता है।