आइडिओग्राम की स्थापना 2022 में मोहम्मद नोरूज़ी द्वारा की गई थी, जो गूगल ब्रेन में पूर्व वरिष्ठ अनुसंधान वैज्ञानिक थे, और उसी लैब से कई सहयोगियों के साथ। टोरंटो आधारित टीम उस समूह से आई थी जिसने गूगल पर छवि उत्पादन के मूल कार्यों में योगदान दिया था, जिसमें इमेजन मॉडल के योगदान भी शामिल थे। मिडजर्नी और डैल-ई के साथ सीधे प्रतिस्पर्धा करने के बजाय, उन्होंने बाजार में हर मॉडल को प्रभावित करने वाली एक विशिष्ट, चिंताजनक कमजोरी को निशाना बनाया: पाठ रेंडरिंग। यदि आप 2023 में डैल-ई या स्टेबल डिफ्यूज़न से "फ्रेश कॉफ़ी" लिखे गए एक दुकान के बोर्ड के लिए छवि उत्पन्न करने के लिए पूछते हैं, तो आपको "फ्रेश कॉफ़ी" के बजाय "फ्रेश कॉफ़ी" जैसा कुछ मिलता है — जो अजीब लगता है लेकिन उपयोगी नहीं। आइडिओग्राम ने इसे ठीक करने के लिए निर्णय लिया।
एआई छवियों में पाठ रेंडरिंग बहुत कठिन होता है। डिफ्यूज़न मॉडल लैटेंट स्पेस में काम करते हैं, जहां पिक्सल स्तरीय तीव्रता अनिवार्य रूप से नुकसानदायक होती है, और एक पढ़े जा सकने वाला "R" और एक गुंडा बॉब के बीच केवल कुछ मानों का सही स्थान होता है। आइडिओग्राम के दृष्टिकोण में पाठ के स्तरीय संरचना और पाठ में स्थानीय संबंधों के बारे में मॉडल के बेहतर अनुभूति के लिए प्रशिक्षण समय नवाचार शामिल थे। जब आइडिओग्राम 1.0 लॉन्च किया गया, तो परिणाम खुद बोलते थे: पोस्टर, पुस्तक कवर, उत्पाद चिह्न और चिह्न जिनमें वास्तव में पढ़े जा सकने वाला पाठ था। यह पूर्ण रूप से अच्छा नहीं था — असामान्य फॉन्ट और लंबे अनुच्छेद अभी भी इसे बाधित करते थे — लेकिन यह उपलब्ध कोई भी अन्य चीज़ से बहुत बेहतर था। ग्राफिक डिज़ाइनर और मार्केटर जिन्हें वास्तविक पाठ के साथ त्वरित मॉकअप की आवश्यकता थी, इसके लिए बदलाव आवश्यक था। एक ऐसा उपकरण जो केवल लगभग लिख सकता है एक खिलौना है; एक जो वास्तव में लिख सकता है एक उत्पाद संसाधन है।
आइडिओग्राम केवल "पाठ रेंडरिंग कंपनी" रह सकता था, लेकिन उनके बड़े उद्देश्य थे। मध्य 2024 में जारी आइडिओग्राम 2.0 एक वास्तविक कदम था समग्र छवि गुणवत्ता में — न केवल पाठ के लिए, बल्कि फोटोरियलिस्टिक सीन, चित्रण शैलियों और डिज़ाइन संरचनाओं के लिए भी। मॉडल में मजबूत प्रम्प्ट अनुसरण और एस्टीटिक संवेदन थी जो इसे मिडजर्नी v6 और डैल-ई 3 के सीधे प्रतियोगिता में रखती थी। आइडिओग्राम 2.0 के आने तक, कंपनी ने 80 मिलियन डॉलर से अधिक के निवेश एकत्र कर लिए थे, जिसमें एंड्रिसन होरोविट्ज़ द्वारा नेतृत्व वाला एक महत्वपूर्ण श्रेणी A शामिल था। उत्पाद एक विशेष उपकरण से एक सामान्य उद्देश्य वाले रचनात्मक प्लेटफॉर्म में बदल गया, जिसमें वेब आधारित संपादक, शैली समायोजन और डिज़ाइन टीमों के लिए सहयोगी विशेषताएं शामिल थीं।