Zubnet AIसीखेंWiki › API
बुनियादी ढांचा

API

इसे भी कहा जाता है: एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस

एक संरचित तरीका जिससे सॉफ्टवेयर अन्य सॉफ्टवेयर से बात कर सके। AI में, यह आमतौर पर एक अनुरोध (आपका प्रॉम्प्ट) को एक प्रदाता के सर्वर पर भेजना और एक प्रतिक्रिया (मॉडल के आउटपुट) प्राप्त करना मतलब होता है। HTTPS पर REST APIs मानक हैं।

यह क्यों मायने रखता है

प्रत्येक AI प्रदाता — Anthropic, Google, Mistral — अपने मॉडलों को APIs के माध्यम से प्रदान करते हैं। अगर आप AI के साथ कोई भी चीज बना रहे हैं जो चैट विंडो से बाहर है, तो आप एक API का उपयोग कर रहे हैं।

गहन अध्ययन

मैकेनिकल स्तर पर, एक एआई एपीआई कॉल केवल एक HTTP अनुरोध होता है — लगभग हमेशा एक HTTPS एंडपॉइंट पर POST के साथ जो एक JSON बॉडी होता है। आप अपना प्रॉम्प्ट, सिस्टम निर्देश, मॉडल पैरामीटर्स जैसे तापमान और मैक्स टोकन भेजते हैं, और प्रदाता एक JSON प्रतिक्रिया वापस भेजता है जिसमें मॉडल के आउटपुट शामिल होता है। आजकल अधिकांश प्रदाता ओपनएआई द्वारा स्थापित पैटर्न का पालन करते हैं: एक /v1/chat/completions शैली के एंडपॉइंट जो भूमिका/सामग्री जोड़े वाले संदेशों के एरे को स्वीकार करता है। एंथ्रोपिक के मैसेज एपीआई संरचना में थोड़ा अलग है लेकिन एक ही दिशा में बरता जाता है। समझने की कुंजी बात यह है कि ये अवस्था रहित कॉल हैं — सर्वर आपके पिछले अनुरोध को याद नहीं रखता अगर आप प्रत्येक बार बातचीत के इतिहास को विशेष रूप से फिर से भेजते नहीं हैं।

स्ट्रीमिंग और वास्तविक समय डिलीवरी

स्ट्रीमिंग जहां बातें दिलचस्प हो जाती हैं। अपने पूरे प्रतिक्रिया के उत्पन्न होने के लिए मॉडल के इंतजार के बजाय (जो एक लंबे उत्तर के लिए 10-30 सेकंड ले सकता है), अधिकांश एआई एपीआई सर्वर-सेंट ईवेंट (SSE) का समर्थन करते हैं। सर्वर उत्पन्न होने पर प्रतिक्रिया के टोकन एक-एक करके भेजता है, इसलिए आपके उपयोगकर्ता तुरंत टेक्स्ट देखना शुरू कर देते हैं। यही कारण है कि चैटजीपीटी और क्लॉउड जवाब के पूरा होने में कुछ समय लेते हैं लेकिन अभी भी जवाबदेह लगते हैं — आप मॉडल के "सोचने" को वास्तविक समय में देख रहे हैं। स्ट्रीमिंग को सही तरीके से लागू करना आंशिक JSON चूनके के संचालन, कनेक्शन टाइमआउट के प्रबंधन और जब स्ट्रीम जवाब के बीच में गिर जाता है तो सुगम रूप से बरामद करना होता है।

प्रदाताओं के बीच प्रमाणीकरण

प्रमाणीकरण प्रदाताओं के बीच अलग-अलग होता है लेकिन आमतौर पर दो पैटर्न में से एक में आता है: एक साधारण API की जो अधिकार प्रमाण के रूप में अधिकार प्रमाण के शीर्षक में एक Bearer टोकन के रूप में पारित की जाती है, या एक अधिक जटिल OAuth प्रवाह उद्यम सेटअप के लिए। एंथ्रोपिक एक x-api-key हेडर का उपयोग करता है, ओपनएआई Authorization: Bearer sk-... का उपयोग करता है, और गूगल क्लाउड सेवा खाता प्रमाण की आवश्यकता होती है। अगर आप कई प्रदाताओं के साथ काम कर रहे हैं — जो अधिकांश उत्पादन प्रणालियां करती हैं — आप जल्दी ही खोजते हैं कि "ओपनएआई-संगत" एक स्पेक्ट्रम है। टोगेदर एआई, ग्रोक, और मिस्ट्रल जैसे प्रदाता ओपनएआई के स्कीमा का अधिकांश अनुसरण करते हैं, लेकिन त्रुटि प्रबंधन, पैरामीटर समर्थन, और प्रतिक्रिया फॉर्मेटिंग में किनारे के मामले जहां एकीकरण काम वास्तव में रहता है।

रेस्ट के बाहर

एक गलत धारणा जो स्पष्ट करने योग्य है: रेस्ट एपीआई केवल एक खेल नहीं हैं, भले ही वे शायद ही अधिकांश हों। कुछ प्रदाता निम्न-भार आयोजन के लिए gRPC एंडपॉइंट प्रदान करते हैं, और वेबसॉकेट आधारित एपीआई वास्तविक समय ध्वनि और स्ट्रीमिंग उपयोग मामलों के लिए अधिक सामान्य हो रहे हैं। एलेवेनलैब्स के ध्वनि एपीआई के उदाहरण के रूप में, वेबसॉकेट्स बाइडिरेक्शनल ध्वनि स्ट्रीमिंग के लिए उपयोग किए जाते हैं। लेकिन पाठ-इन-पाठ-आउट एलईएम अनुमान के लिए, रेस्ट के साथ सीईई स्ट्रीमिंग अभी भी मानक है, और यह जल्दी ही बदलने की संभावना नहीं है — HTTP के ओवरहेड एक मॉडल द्वारा टोकन उत्पन्न करने में लगे समय की तुलना में नगण्य है।

संबंधित अवधारणाएँ

← सभी शब्द
← AI सुरक्षा ASI →
ESC