एक कम्युनिटी डेवलपर (Claudio Drews) ने आज Memory OS जारी किया, एक MIT-लाइसेंस्ड 6-लेयर मेमोरी स्टैक जो NousResearch के Hermes Agent फ्रेमवर्क के ऊपर बैठता है। लेयर्स अलग-अलग मेमोरी उद्देश्यों पर मैप करती हैं: workspace फाइल्स (MEMORY.md, USER.md, CREATIVE.md system prompt में इंजेक्टेड), सेशन हिस्ट्री (SQLite + FTS5 फुल-टेक्स्ट सर्च), स्ट्रक्चर्ड फैक्ट्स (SQLite + HRR + फीडबैक लूप्स के साथ ट्रस्ट स्कोरिंग), Fabric (LLM-पावर्ड सेशन एक्सट्रैक्शन, Icarus Plugin से फोर्क्ड), वेक्टर डेटाबेस (Qdrant 4096-डायमेंशनल कोसाइन वेक्टर्स प्लस BM25 स्पार्स सर्च के साथ), और एक ऑटो-क्यूरेटेड LLM विकी जो Qdrant में फिर से इंजेस्ट होती है। सब कुछ Docker के माध्यम से लोकली चलता है (Qdrant + Redis + ARQ Worker + Python 3.11+); LLM कॉल्स अभी भी Hermes जिस भी प्रोवाइडर को सपोर्ट करता है उसी पर जाती हैं (OpenRouter, OpenAI, Anthropic, Ollama)।
आर्किटेक्चर एक कैस्केडिंग रिट्रीवल सिस्टम है। pre_llm_call पर, चार सोर्सेज (Fabric, Qdrant, Sessions, Facts) पहले हाइब्रिड सर्च के साथ क्वेरी की जाती हैं, फिर डेंस वेक्टर्स, फिर लेक्सिकल, फिर SQLite फॉलबैक के रूप में। प्रति-सेशन डीडुप्लिकेशन एक ही कॉन्टेक्स्ट को एक विंडो में दो बार दिखाई देने से रोकता है, और एक रेलेवेंस थ्रेशोल्ड फिल्टर करता है पहले कि कुछ भी मॉडल तक पहुंचे। post_llm_call और on_session_end पर, कैप्चर वापस लेयर्स में लिखता है। भूलना स्पष्ट है: एक साप्ताहिक डीके स्कैनर बासी एंट्रीज़ को बूढ़ा करता है, और सेमांटिक डीडुप कोसाइन समानता 0.92 से अधिक होने पर लगभग-समान मेमोरीज़ को मर्ज करता है। ट्रस्ट स्कोरिंग (लेयर 3) एक फीडबैक लूप बनाए रखता है जो समय के साथ सोर्स-क्रेडिबिलिटी को एडजस्ट करता है। जो गायब है वो मायने रखता है: रिकॉल क्वालिटी, लेटेंसी या टोकन बचत पर कोई प्रकाशित बेंचमार्क नहीं, और मल्टी-एजेंट कन्सिस्टेंसी के लिए कोई औपचारिक राइट-कन्फ्लिक्ट रिज़ॉल्यूशन नहीं। रिपो github.com/ClaudioDrews/memory-os पर है, ब्रांड न्यू कुछ कमिट्स के साथ, सिंगल डेवलपर। लेयर्ड आइडिया के लिए अर्ली-स्टेज स्कैफोल्डिंग के रूप में ट्रीट करें, अभी प्रोडक्शन-हार्डन्ड कॉम्पोनेंट के रूप में नहीं।
दो इकोसिस्टम थ्रेड्स। पहला, आर्किटेक्चर एक कम्युनिटी-बिल्ट स्पष्ट अभिव्यक्ति है उस चीज़ की जिसे अधिकांश एजेंट builders अंत में एड-हॉक असेंबल करते हैं: एक लेयर्ड मेमोरी पाइपलाइन जहां अलग-अलग उद्देश्य (सिस्टम कॉन्टेक्स्ट, सेशन रिकॉल, फैक्ट स्टोरेज, सेमांटिक सर्च, स्ट्रक्चर्ड एक्सट्रैक्शन, नॉलेज एक्युमुलेशन) एक ही "वेक्टर DB और प्रार्थना" पैटर्न में कोलैप्स होने के बजाय अलग-अलग मैकेनिज्म पाते हैं। वह लेयरिंग डिज़ाइन सबक है जो साथ ले जाने लायक है भले ही आप Memory OS को सीधे कभी नहीं छूएं। दूसरा, पोजिशनिंग: Memory OS खुद को mem0, Zep और Letta जैसी क्लाउड सेवाओं के साथ स्पष्ट रूप से कंट्रास्ट करता है पूरी तरह से लोकल होकर। यह "मैं अपने एजेंट की मेमोरी अपनी डिस्क पर चाहता हूं, किसी और के डेटाबेस में नहीं," वाली व्यापक लहर में फिट होता है, जो प्राइवेसी-सेंसिटिव या एयर-गैप्ड बिल्ड्स के लिए वैध रुख है। ट्रेड-ऑफ ऑपरेशनल है: Qdrant + Redis + ARQ Worker के साथ एक Docker स्टैक API के माध्यम से mem0 कॉल करने से ज़्यादा इन्फ्रास्ट्रक्चर है। क्लाउड-मैनेज्ड और सेल्फ-होस्टेड मेमोरी के बीच निर्णय लेने वाले builders के लिए, यह लेजर के लोकल साइड पर एक वास्तविक विकल्प रखता है, हालांकि Hermes से फ्रेमवर्क-बाउंड।
सोमवार सुबह, अगर आप पहले से Hermes Agent पर बना रहे हैं: Memory OS Hermes की नेटिव मेमोरी से ड्रॉप-इन अपग्रेड के रूप में प्रयास करने लायक है, खासकर अगर आपके एजेंट को लंबे इतिहास में सेमांटिक रिकॉल से लाभ होता है। दांव लगाने से पहले रिकॉल क्वालिटी और टोकन उपयोग पर अपना खुद का मूल्यांकन चलाएं; कोई प्रकाशित बेंचमार्क नहीं का मतलब है कि आप ही बेंचमार्क हैं। अगर आप Hermes पर नहीं हैं, 6-लेयर डीकंपोजिशन ही टेकअवे है, कोड नहीं: workspace + सेशन्स + फैक्ट्स + एक्सट्रैक्शन + वेक्टर्स + क्यूरेटेड विकी अलग-अलग उद्देश्यों पर मैप होते हैं जिनकी आपको शायद पहले से ज़रूरत है, अलग-अलग, आप जिस भी स्टैक पर हैं। अगर आप एक प्राइवेसी-सेंसिटिव या एयर-गैप्ड एजेंट डिप्लॉय करते हैं और क्लाउड मेमोरी प्रोवाइडर नहीं चाहते, यह स्थापित विकल्पों के मुकाबले मूल्यांकन के लिए एक नया विकल्प है। सिंगल-डेवलपर प्लस few-commits-old का मतलब है इस पर सावधानी से झुकें; अभी मूल्य है डॉक्यूमेंटेशन के रूप में आर्किटेक्चर, बैटल-टेस्टेड डिपेंडेंसी के रूप में कोड नहीं।
