एक संरचित तरीका जिससे सॉफ्टवेयर अन्य सॉफ्टवेयर से बात कर सके। AI में, यह आमतौर पर एक अनुरोध (आपका प्रॉम्प्ट) को एक प्रदाता के सर्वर पर भेजना और एक प्रतिक्रिया (मॉडल के आउटपुट) प्राप्त करना मतलब होता है। HTTPS पर REST APIs मानक हैं।
मैकेनिकल स्तर पर, एक एआई एपीआई कॉल केवल एक HTTP अनुरोध होता है — लगभग हमेशा एक HTTPS एंडपॉइंट पर POST के साथ जो एक JSON बॉडी होता है। आप अपना प्रॉम्प्ट, सिस्टम निर्देश, मॉडल पैरामीटर्स जैसे तापमान और मैक्स टोकन भेजते हैं, और प्रदाता एक JSON प्रतिक्रिया वापस भेजता है जिसमें मॉडल के आउटपुट शामिल होता है। आजकल अधिकांश प्रदाता ओपनएआई द्वारा स्थापित पैटर्न का पालन करते हैं: एक /v1/chat/completions शैली के एंडपॉइंट जो भूमिका/सामग्री जोड़े वाले संदेशों के एरे को स्वीकार करता है। एंथ्रोपिक के मैसेज एपीआई संरचना में थोड़ा अलग है लेकिन एक ही दिशा में बरता जाता है। समझने की कुंजी बात यह है कि ये अवस्था रहित कॉल हैं — सर्वर आपके पिछले अनुरोध को याद नहीं रखता अगर आप प्रत्येक बार बातचीत के इतिहास को विशेष रूप से फिर से भेजते नहीं हैं।
स्ट्रीमिंग जहां बातें दिलचस्प हो जाती हैं। अपने पूरे प्रतिक्रिया के उत्पन्न होने के लिए मॉडल के इंतजार के बजाय (जो एक लंबे उत्तर के लिए 10-30 सेकंड ले सकता है), अधिकांश एआई एपीआई सर्वर-सेंट ईवेंट (SSE) का समर्थन करते हैं। सर्वर उत्पन्न होने पर प्रतिक्रिया के टोकन एक-एक करके भेजता है, इसलिए आपके उपयोगकर्ता तुरंत टेक्स्ट देखना शुरू कर देते हैं। यही कारण है कि चैटजीपीटी और क्लॉउड जवाब के पूरा होने में कुछ समय लेते हैं लेकिन अभी भी जवाबदेह लगते हैं — आप मॉडल के "सोचने" को वास्तविक समय में देख रहे हैं। स्ट्रीमिंग को सही तरीके से लागू करना आंशिक JSON चूनके के संचालन, कनेक्शन टाइमआउट के प्रबंधन और जब स्ट्रीम जवाब के बीच में गिर जाता है तो सुगम रूप से बरामद करना होता है।
प्रमाणीकरण प्रदाताओं के बीच अलग-अलग होता है लेकिन आमतौर पर दो पैटर्न में से एक में आता है: एक साधारण API की जो अधिकार प्रमाण के रूप में अधिकार प्रमाण के शीर्षक में एक Bearer टोकन के रूप में पारित की जाती है, या एक अधिक जटिल OAuth प्रवाह उद्यम सेटअप के लिए। एंथ्रोपिक एक x-api-key हेडर का उपयोग करता है, ओपनएआई Authorization: Bearer sk-... का उपयोग करता है, और गूगल क्लाउड सेवा खाता प्रमाण की आवश्यकता होती है। अगर आप कई प्रदाताओं के साथ काम कर रहे हैं — जो अधिकांश उत्पादन प्रणालियां करती हैं — आप जल्दी ही खोजते हैं कि "ओपनएआई-संगत" एक स्पेक्ट्रम है। टोगेदर एआई, ग्रोक, और मिस्ट्रल जैसे प्रदाता ओपनएआई के स्कीमा का अधिकांश अनुसरण करते हैं, लेकिन त्रुटि प्रबंधन, पैरामीटर समर्थन, और प्रतिक्रिया फॉर्मेटिंग में किनारे के मामले जहां एकीकरण काम वास्तव में रहता है।
एक गलत धारणा जो स्पष्ट करने योग्य है: रेस्ट एपीआई केवल एक खेल नहीं हैं, भले ही वे शायद ही अधिकांश हों। कुछ प्रदाता निम्न-भार आयोजन के लिए gRPC एंडपॉइंट प्रदान करते हैं, और वेबसॉकेट आधारित एपीआई वास्तविक समय ध्वनि और स्ट्रीमिंग उपयोग मामलों के लिए अधिक सामान्य हो रहे हैं। एलेवेनलैब्स के ध्वनि एपीआई के उदाहरण के रूप में, वेबसॉकेट्स बाइडिरेक्शनल ध्वनि स्ट्रीमिंग के लिए उपयोग किए जाते हैं। लेकिन पाठ-इन-पाठ-आउट एलईएम अनुमान के लिए, रेस्ट के साथ सीईई स्ट्रीमिंग अभी भी मानक है, और यह जल्दी ही बदलने की संभावना नहीं है — HTTP के ओवरहेड एक मॉडल द्वारा टोकन उत्पन्न करने में लगे समय की तुलना में नगण्य है।