क्या आप विभिन्न प्रारूपों के असंरचित दस्तावेजों को संभालने के लिए परेशान हैं? Fireworks AI ने हाल ही में "Document Inlining" नामक एक नवाचार सुविधा लॉन्च की है, जो PDF, स्क्रीनशॉट, चित्र आदि असंरचित दस्तावेजों को बड़े भाषा मॉडल (LLM) द्वारा समझे जाने योग्य संरचित पाठ में बदल देती है, जिससे चैटबॉट और AI मॉडल के लिए सीधे उपयोग योग्य पाठ सामग्री प्रदान की जाती है, जिससे AI द्वारा दस्तावेज़ों को संभालने की दक्षता और सटीकता में काफी वृद्धि होती है।

image.png

Document Inlining का मुख्य आकर्षण इसके शक्तिशाली समग्र AI प्रणाली में है, जो स्वचालित रूप से दस्तावेज़ में विभिन्न सामग्री जैसे पाठ, तालिकाएँ, ग्राफ़ और जटिल तत्वों जैसे नेस्टेड लेआउट को पहचान और解析 करती है, जिससे AI सामान्य पाठ की तरह इन फ़ाइलों को समझ सके।

image.png

यह उपकरण बेहद सरल है, जिसमें कोई जटिल सेटिंग्स की आवश्यकता नहीं है। और सबसे आश्चर्यजनक बात यह है कि यह OpenAI API के साथ संगत है, उपयोगकर्ताओं को केवल मौजूदा API में एक लाइन कोड जोड़ने की आवश्यकता है, जिससे वे Fireworks में Document Inlining सुविधा का उपयोग कर सकें, बिना किसी अतिरिक्त अध्ययन लागत के।

Document Inlining के लाभ मुख्य रूप से निम्नलिखित पहलुओं में देखे जा सकते हैं:

उच्च गुणवत्ता आउटपुट:

Document Inlining द्वारा प्रदान की गई पाठ की गुणवत्ता पारंपरिक पाठ आधारित LLM आउटपुट के बराबर या उससे बेहतर हो सकती है, विशेष रूप से तर्क और उत्पन्न कार्यों में उत्कृष्ट प्रदर्शन करती है। दृश्य भाषा मॉडल (VLMs) की तुलना में, LLM Document Inlining द्वारा परिवर्तित पाठ का उपयोग करने के बाद अधिक सटीक और पेशेवर परिणाम उत्पन्न कर सकता है। यह दर्शाता है कि संरचित पाठ LLM द्वारा समझने और उपयोग करने में अधिक आसान होता है।

विभिन्न दस्तावेज़ प्रारूपों का समर्थन:

Document Inlining ने PDF, चित्र आदि सहित कई दस्तावेज़ प्रारूपों का सफलतापूर्वक समर्थन किया है। उदाहरण के लिए, परीक्षण के माध्यम से, यह उपकरण PDF दस्तावेज़ (जैसे रिज्यूमे) से उम्मीदवार के GPA जैसे शैक्षणिक जानकारी को सटीक रूप से निकालने में सक्षम था, परिणाम स्पष्ट और सटीक दिखाते हैं, जो इसके शक्तिशाली दस्तावेज़解析 क्षमताओं को साबित करता है।

जटिल दस्तावेज़解析 क्षमता:

Document Inlining में जटिल दस्तावेज़解析 करने की शक्तिशाली क्षमता है। परीक्षण के माध्यम से, यह तालिकाओं, ग्राफ़ और कई पैरा पाठ वाले जटिल दस्तावेज़ों को解析 करने और इसे LLM द्वारा समझे जाने योग्य पाठ में सफलतापूर्वक परिवर्तित करने में सक्षम है। यह कई सूचना तत्वों वाले जटिल दस्तावेज़ों को संभालने के लिए एक शक्तिशाली उपकरण है।

वेबसाइट: https://fireworks.ai/blog/document-inlining-launch#quality-evaluation