डेटा साइंटिस्ट्स ने नियर रियल-टाइम एडॉप्शन से रिकमेंडर लेटेंसी को 75% तक कम किया

ग्राहक सहायता पेशेवर अब रोज़ाना 30% ज़्यादा जटिल प्रश्न हल कर सकते हैं
डेटा साइंटिस्ट: ग्रेन्युलर एट्रिब्यूशन से LLM लागत वृद्धि को 340% तक कम करें
📰
AI for Data Science
⏱ 1 min read

डेटा साइंटिस्ट्स ने नियर रियल-टाइम एडॉप्शन से रिकमेंडर लेटेंसी को 75% तक कम किया

डेटा साइंटिस्ट्स अब AI-पावर्ड रिकमेंडर सिस्टम डिप्लॉय कर सकते हैं जो नियर रियल-टाइम में यूजर्स के अनुकूल हो जाते हैं, लाखों आइटम्स के लिए सब-50ms इन्फेरेंस लेटेंसी हासिल करते हैं। यह स्केलेबल रिकमेंडेशन के लिए डेटा साइंटिस्ट के दृष्टिकोण को नाटकीय रूप से बदल देता है।

Share X LinkedIn Facebook

डेटा साइंटिस्ट्स को अब यह अहसास हो रहा है कि परिष्कृत, मल्टी-स्टेज रिकमेंडर सिस्टम को डिप्लॉय करना जो नियर रियल-टाइम में यूजर की पसंद के अनुकूल हो सकते हैं, यहां तक कि कोल्ड-स्टार्ट परिदृश्यों के लिए भी, अब कस्टम-बिल्ट इंफ्रास्ट्रक्चर की आवश्यकता वाले मल्टी-महीने के इंजीनियरिंग प्रयास नहीं हैं। उन्नत मशीन लर्निंग टूल्स और इंटेलिजेंट आर्किटेक्चर का लाभ उठाकर, ये सिस्टम अब लाखों आइटम्स में सब-50ms इन्फेरेंस लेटेंसी प्राप्त कर रहे हैं, जो प्रदर्शन का एक ऐसा स्तर है जो तीव्र व्यावसायिक नवाचार और हाइपर-पर्सनलाइज्ड यूजर अनुभवों को शक्ति प्रदान करता है। यह क्षमता डेटा साइंटिस्ट के फोकस को इंफ्रास्ट्रक्चर से जूझने से लेकर प्रभावशाली, ताज़ा रिकमेंडेशन देने तक नाटकीय रूप से बदल देती है।

सालों से, प्रोडक्शन-ग्रेड रिकमेंडर सिस्टम बनाना और बनाए रखना डेटा साइंटिस्ट्स के लिए एक कठिन कार्य रहा है, जिसमें अक्सर भारी MLOps ओवरहेड, धीमी मॉडल एडॉप्शन और जटिल मैन्युअल स्केलिंग शामिल होती है। नए यूजर्स या आइटम्स के लिए कोल्ड-स्टार्ट परिदृश्यों और सख्त लेटेंसी बजट के साथ लाखों विविध उत्पादों की सेवा करने की आवश्यकता के साथ चुनौती बढ़ी। अब, विशिष्ट आर्टिफिशियल इंटेलिजेंस टूल्स और डिज़ाइन पैटर्न को संयोजित करने वाला एक संरचित दृष्टिकोण इस परिदृश्य को बदलता है। डेटा साइंटिस्ट्स एंड-टू-एंड पाइपलाइन लागू कर सकते हैं जो न केवल मॉडल को प्रशिक्षित और डिप्लॉय करती हैं बल्कि निरंतर फाइन-ट्यूनिंग का प्रबंधन भी करती हैं, यह सुनिश्चित करती हैं कि रिकमेंडेशन पूर्ण दैनिक रीबिल्ड की आवश्यकता के बिना ताज़ा और प्रासंगिक रहें। यह नया प्रतिमान डेटा साइंटिस्ट्स को डिप्लॉयमेंट की बारीकियों के बजाय मॉडल गुणवत्ता और फ़ीचर इंजीनियरिंग पर ध्यान केंद्रित करने की अनुमति देता है।

छवियों के लिए CLIP और टेक्स्ट के लिए Sentence-BERT जैसी उन्नत एम्बेडिंग तकनीकों का एकीकरण, पारंपरिक टैबुलर सहयोगी सुविधाओं के साथ-साथ, इसका मतलब है कि गुमनाम उपयोगकर्ताओं या नए आइटम्स के लिए भी, परिष्कृत सामग्री-आधारित सिग्नल मजबूत कोल्ड-स्टार्ट रिकमेंडेशन प्रदान करते हैं। महत्वपूर्ण रूप से, डेटा साइंटिस्ट्स के लिए ये AI टूल्स मल्टी-स्टेज आर्किटेक्चर को सक्षम करते हैं—एक हल्का रिट्रीवल स्टेज जिसके बाद एक भारी रैंकिंग स्टेज होता है—जो विशाल कैटलॉग को कुशलतापूर्वक संभालते हैं, प्रत्येक अनुरोध पर लाखों आइटम्स को स्कोर करने के कम्प्यूटेशनल बोझ को नाटकीय रूप से कम करते हैं और सीधे डेटा साइंटिस्ट के मुख्य कार्य को लाभ पहुंचाते हैं।

इसके अलावा, इन-मेमोरी फ़ीचर कैशिंग और उच्च-प्रदर्शन इन्फेरेंस सर्वर का रणनीतिक उपयोग का मतलब है कि जटिल मॉडल लुकअप के लिए लेटेंसी बॉटलनेक काफी हद तक कम हो जाता है। यह डेटा साइंटिस्ट्स को खराब उत्पादन प्रदर्शन के डर के बिना अधिक जटिल मॉडल डिजाइन करने की अनुमति देता है। जोर केवल एक मॉडल को प्रशिक्षित करने से एक लचीला, अनुकूली और प्रदर्शनकारी प्रेडिक्टिव एनालिटिक्स AI सिस्टम बनाने की ओर स्थानांतरित हो गया है जो स्वायत्त रूप से सीखता है और स्केल करता है।

इस एकीकृत दृष्टिकोण से पहले, एक ई-कॉमर्स प्लेटफॉर्म के लिए एक रिकमेंडर सिस्टम को अद्यतित रखने के कार्य वाले डेटा साइंटिस्ट को अलग-अलग स्क्रिप्ट की एक श्रृंखला को मैन्युअल रूप से व्यवस्थित करना पड़ता था। इसमें अक्सर पूर्ण मॉडल रिट्रेनिंग शुरू करना, बड़े पैमाने पर एप्रोक्सिमेट नियरेस्ट नेबर (ANN) इंडेक्स का पुनर्निर्माण करना और पूरे मॉडल स्टैक को दैनिक रूप से फिर से डिप्लॉय करना शामिल होता था, एक ऐसी प्रक्रिया जिसमें कई घंटे लग सकते थे, संभावित त्रुटियां हो सकती थीं, और महत्वपूर्ण डाउनटाइम या पुरानी रिकमेंडेशन हो सकती थी। मॉडल की ताज़गी और विकास की गति पर इसका प्रभाव महत्वपूर्ण था।

इन पाइपलाइन-संचालित रणनीतियों को अपनाने के बाद, वर्कफ़्लो को दो अलग, स्वचालित Kubeflow पाइपलाइन में सुव्यवस्थित किया गया है। पहला भारी प्रारंभिक कार्य को संभालता है: प्रीप्रोसेसिंग की स्थापना, खरोंच से मौलिक मॉडल का प्रशिक्षण, ANN इंडेक्स का निर्माण, और इन्फेरेंस सर्वर को डिप्लॉय करना। दूसरा, अधिक फुर्तीला पाइपलाइन समर्पित है

Source: Deploying a Multistage Multimodal Recommender System on Amaz  ·  Processed: June 03, 2026
Stay Ahead

Get weekly AI insights

The latest AI tools, news and strategies — delivered to your inbox.

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.