பல்வேறு கோப்பு வகைகளை LLM-க்கு ஏற்ற மார்க் டவுனாக மாற்றுவதற்கான ஒரு திறந்த மூல பைதான் பயன்பாடான மைக்ரோசாப்டின் பல்துறை MarkItDown கருவி, இப்போது மாதிரி சூழல் நெறிமுறையுடன் (MCP) ஒட்டியிருக்கும் ஒரு சேவையக கூறுகளை உள்ளடக்கியது.
markitdown-mcp துணை தொகுப்பில் உள்ள திட்டத்தின் களஞ்சியத்தில் அமைந்துள்ள இந்த கூடுதலாக, MCP உடன் இணக்கமான AI முகவர்கள் மற்றும் பயன்பாடுகள் கருவியின் மாற்ற திறன்களை நிரல் ரீதியாகவும் தரப்படுத்தப்பட்ட முறையிலும் அணுக அனுமதிக்கிறது.
ஒருங்கிணைப்பு 2024 ஆம் ஆண்டின் பிற்பகுதியில் ஆந்த்ரோபிக்கிலிருந்து உருவான ஒரு திறந்த தரநிலையான மாதிரி சூழல் நெறிமுறையைப் பயன்படுத்துகிறது. AI பயன்பாடுகள் (கிளையன்ட்கள்) குறிப்பிட்ட செயல்பாடுகளை வழங்கும் பல்வேறு சேவையகங்களுடன் தொடர்பு கொள்ளக்கூடிய ஒரு பொதுவான HTTP- அடிப்படையிலான கிளையன்ட்-சர்வர் கட்டமைப்பை வரையறுப்பதன் மூலம் AI மாதிரிகள் மற்றும் APIகள் அல்லது உள்ளூர் கருவிகள் போன்ற வெளிப்புற வளங்களுக்கு இடையிலான இணைப்பை எளிதாக்குவதை MCP நோக்கமாகக் கொண்டுள்ளது.
MCP-ஐ ஏற்றுக்கொள்வதன் மூலம், MarkItDown, AI முகவர் பணிப்பாய்வுகளில் எளிதாக ஒருங்கிணைப்பதற்காக வடிவமைக்கப்பட்ட கருவிகளின் விரிவடையும் சுற்றுச்சூழல் அமைப்பில் இணைகிறது, இது Anthropic இன் Claude Desktop போன்ற பயன்பாடுகள் AWS மற்றும் Pydantic போன்ற வழங்குநர்களிடமிருந்து பிற MCP-இயக்கப்பட்ட சேவைகளுடன் அதன் அம்சங்களைப் பயன்படுத்த அனுமதிக்கிறது.
AI கருவியாக கோப்பு மாற்றத்தை வெளிப்படுத்துதல்
MIT உரிமத்தின் கீழ் வெளியிடப்பட்ட அடிப்படை MarkItDown கருவி, MCP சேவையகம் வெளிப்படுத்தும் முக்கிய செயல்பாட்டை வழங்குகிறது. MarkItDown, Microsoft Office ஆவணங்கள் (.docx, .pptx, .xlsx), உரை அடிப்படையிலான PDFகள், HTML, JSON, XML, CSV, EPub கோப்புகள் மற்றும் YouTube URLகள் உட்பட பல்வேறு வடிவங்களை Markdown ஆக மாற்றும் திறன் கொண்டது.
அதன் கட்டமைப்பு தெளிவு மற்றும் டோக்கன் செயல்திறன் காரணமாக இந்த வடிவம் AI தொடர்புக்கு சாதகமாக உள்ளது. MarkItDown MCP சேவையகம், AI முகவர்கள் கோப்புகள் அல்லது URLகளை அனுப்பவும், மாற்றப்பட்ட Markdown உரையைப் பெறவும் அனுமதிக்கிறது, இருப்பினும் குறிப்பிட்ட MCP “கருவிகள்” குறித்த விரிவான பொது ஆவணங்கள் தற்போது குறைவாகவே உள்ளன.
பல-மாதிரி உள்ளடக்கம் மற்றும் PDFகளைக் கையாளுதல்
MarkItDown பல-மாதிரி செயலாக்கத்தையும் உள்ளடக்கியது. இது பட EXIF தரவைப் பிரித்தெடுக்கலாம் மற்றும் உள்ளமைக்கப்பட்ட LLM (code>gpt-4o போன்றவை) பயன்படுத்தி விளக்கங்களை உருவாக்கலாம். ஆடியோ கோப்பு டிரான்ஸ்கிரிப்ஷன் speech_recognition நூலகம் வழியாக கையாளப்படுகிறது. MCP சேவையகம் இந்த செயல்பாடுகளை வெளிப்படுத்தக்கூடும் என்றாலும், பயனர்கள் அடிப்படை கருவியின் வரம்புகள், குறிப்பாக பட அடிப்படையிலான PDF களுக்கான வெளிப்புற OCR தேவை மற்றும் PDF மாற்றத்தின் போது ஏற்படும் வழக்கமான வடிவமைப்பு இழப்பு ஆகியவற்றை அறிந்திருக்க வேண்டும், இது pdfminer.six நூலகத்தை நம்பியுள்ளது.
தொழில்நுட்ப தேவைகள் மற்றும் சுற்றுச்சூழல் அமைப்பு சீரமைப்பு
MarkItDown கருவி மற்றும் அதன் MCP சேவையகத்தைப் பயன்படுத்துவதற்கு பைதான் 3.10+ தேவைப்படுகிறது. அடிப்படை தொகுப்பில் மைய தர்க்கம் இருந்தாலும், குறிப்பிட்ட வடிவமைப்பு மாற்றங்கள் விருப்ப சார்புகளை (எ.கா., `mammoth`, `pandas`, `python-pptx`) சார்ந்துள்ளது, இது pip கூடுதல் (code>[docx], [xlsx]) போன்றவை) வழியாக நிறுவ முடியும். மார்ச் மாதத்தில் பதிப்பு 0.1.0 இல் அறிமுகப்படுத்தப்பட்ட ஒரு செருகுநிரல் அமைப்பு, மேலும் நீட்டிப்பை அனுமதிக்கிறது. தற்போதைய பதிப்பு 0.1.1.
ஒரு MCP சேவையகத்தைச் சேர்ப்பது, AI முகவர் கருவி தொடர்பான மைக்ரோசாப்டின் பரந்த உத்தியுடன் MarkItDown ஐ சீரமைக்கிறது. நிறுவனம் முன்பு MCP ஆதரவை Azure AI இல் ஒருங்கிணைத்தது, நெறிமுறைக்கான அதிகாரப்பூர்வ C# SDK இல் ஒத்துழைத்தது மற்றும் ஏப்ரல் மாதத்தில் முக்கிய Azure சேவைகளுக்கான MCP சேவையகங்களின் முன்னோட்டங்களை வெளியிட்டது. ஒரு MCP இடைமுகத்தை வழங்குவது MarkItDown இன் மாற்ற திறன்களை எளிதாகக் கண்டறியக்கூடியதாகவும் தரப்படுத்தப்பட்ட AI முகவர் கட்டமைப்புகளுக்குள் பயன்படுத்தக்கூடியதாகவும் ஆக்குகிறது.
மூலம்: Winbuzzer / Digpu NewsTex