Close Menu
Digpu News  Agency Feed
    Facebook X (Twitter) Instagram
    • Home
    • Technology
    • USA
    • Business
    • Education
    • Startups and Entrepreneurs
    • Health
    Facebook X (Twitter) Instagram
    Digpu News  Agency Feed
    Subscribe
    Wednesday, January 7
    • Home
    • Technology
    • USA
    • Business
    • Education
    • Startups and Entrepreneurs
    • Health
    Digpu News  Agency Feed
    Home»Bengali»বাইটড্যান্স সিড্রিম ৩.০ এআই ইমেজ জেনারেটর এবং সিডএডিট এআই ইমেজ এডিটর উন্মোচন করেছে উন্নত বাস্তবতা সহ

    বাইটড্যান্স সিড্রিম ৩.০ এআই ইমেজ জেনারেটর এবং সিডএডিট এআই ইমেজ এডিটর উন্মোচন করেছে উন্নত বাস্তবতা সহ

    DeskBy DeskAugust 15, 2025No Comments4 Mins Read
    Share Facebook Twitter Pinterest Copy Link LinkedIn Tumblr Email VKontakte Telegram
    Share
    Facebook Twitter Pinterest Email Copy Link

    বাইটড্যান্স তাদের বাইটড্যান্স সিড টিম দ্বারা তৈরি সিড্রিম ৩.০ মডেলের মাধ্যমে উচ্চমানের এআই ইমেজ জেনারেশনের ক্ষেত্রে একযোগে কাজ করছে। চীনা এবং ইংরেজি উভয় ভাষাতেই দক্ষ হিসেবে উপস্থাপিত, সিড্রিম ৩.০ এর লক্ষ্য হল ওপেনএআই-এর জিপিটি-৪ও এবং মিডজার্নির মতো প্রতিষ্ঠিত নামগুলিকে লক্ষ্য করা।

    বাইটড্যান্সের উপকরণগুলি দাবি করে যে মডেলটি ফটোরিয়ালিস্টিক ছবি তৈরিতে, বিশেষ করে প্রতিকৃতি তৈরিতে এবং জটিল টেক্সট রেন্ডারিং পরিচালনায় যথেষ্ট অগ্রগতি করেছে, একই সাথে স্থানীয় উচ্চ-রেজোলিউশন আউটপুট এবং দ্রুত জেনারেশন সময় প্রদান করে। একটি অফিসিয়াল টেকনিক্যাল ওভারভিউ এবং একটি সংশ্লিষ্ট কাগজে অন্তর্নিহিত পরিবর্তনগুলির রূপরেখা দেওয়া হয়েছে।

    মডেলটি ২০২৫ সালের এপ্রিলের শুরুতে বাইটড্যান্সের ডুবাও চ্যাট প্ল্যাটফর্ম এবং জিমেং তৈরির সরঞ্জামে চালু হতে শুরু করে; ডুবাও নিজেই একটি উল্লেখযোগ্য বিতরণ চ্যানেল, মার্চ মাসের মধ্যে বিশ্বব্যাপী প্রায় ১০০ মিলিয়ন মাসিক সক্রিয় ব্যবহারকারী অর্জন করেছে, যা মূলত চীনে একটি বিশাল সম্ভাব্য দর্শক তৈরি করেছে।

    টেক্সট এবং পোর্ট্রেট জেনারেশনের অগ্রগতি

    একটি ক্ষেত্র যেখানে Seedream 3.0 নিজেকে আলাদা করতে চায় তা হল টাইপোগ্রাফি। প্রযুক্তিগত ডকুমেন্টেশন “সূক্ষ্ম-গ্রেইনড টাইপোগ্রাফি জেনারেশন” উন্নত করার প্রচেষ্টাগুলিকে তুলে ধরে “বিশেষ করে জটিল চীনা অক্ষরগুলিতে টেক্সট-রেন্ডারিংয়ের জন্য যা পেশাদার টাইপোগ্রাফি জেনারেশনের জন্য গুরুত্বপূর্ণ।”

    মডেলের দ্বিভাষিক লক্ষ্য দর্শকদের জন্য এটি উল্লেখযোগ্য, কারণ নির্ভুল রেন্ডারিং, বিশেষ করে জটিল স্ক্রিপ্টগুলির জন্য, অনেক চিত্র AI-এর জন্য একটি চ্যালেঞ্জ রয়ে গেছে। ByteDance দাবি করে যে অভ্যন্তরীণ পরীক্ষাগুলি “চীনা এবং ইংরেজি উভয় অক্ষরের জন্য 94% পাঠ্য প্রাপ্যতা হার দেখায়, যা চিত্র তৈরিতে সীমাবদ্ধ ফ্যাক্টর হিসাবে পাঠ্য রেন্ডারিংকে কার্যকরভাবে বাদ দেয়।”

    ByteDance দ্বারা প্রদত্ত ভিজ্যুয়াল তুলনাগুলি পরামর্শ দেয় যে Seedream 3.0 ঘন পাঠ্য লেআউট পরিচালনা করে, বিশেষ করে চীনা ফন্টগুলির সাথে, GPT-4o এর চিত্র মোডের চেয়ে বেশি কার্যকরভাবে (যা মার্চের শেষের দিকে তার চিত্র বৈশিষ্ট্যগুলি চালু করেছিল), যদিও OpenAI এর মডেলটিও শক্তিশালী পাঠ্য ক্ষমতা প্রদর্শন করেছে। এই ফোকাসটি এসেছে যখন অন্যান্য নতুন মডেল, যেমন আগ্রাসী মূল্যের Reve Image 1.0, টেক্সট রেন্ডারিং মানের উপর আংশিকভাবে প্রতিযোগিতা করে।

    বাস্তবসম্মত মানব প্রতিকৃতি তৈরিতে উন্নতিও বাইটড্যান্সের উপস্থাপনার কেন্দ্রবিন্দু, “প্রতিকৃতি তৈরিতে বর্ধিত বাস্তববাদ” উল্লেখ করে। উদ্দেশ্য হল আরও প্রাকৃতিক ত্বকের বৈশিষ্ট্য সহ ছবি তৈরি করা, যা কখনও কখনও AI আউটপুটে দেখা যায় এমন অত্যধিক মসৃণ নান্দনিকতা থেকে দূরে সরে যায়।

    বাইটড্যান্স দ্বারা উদ্ধৃত ব্যবহারকারীর পছন্দের গবেষণায় সিড্রিম 3.0 কে পোর্ট্রেট বাস্তববাদের জন্য উচ্চ স্থান দেওয়া হয়েছে, মিডজার্নির V7 আলফার (যা সিড্রিম 3.0 এর বিবরণ প্রকাশের কিছুক্ষণ আগে আত্মপ্রকাশ করেছিল) তুলনায়। 2K রেজোলিউশন (2048×2048 পিক্সেল) পর্যন্ত ছবি আউটপুট করার ক্ষমতা সিড্রিম 3.0 এর উন্নত টেক্সচার বিশদ বিবরণের জন্য একটি অবদানকারী ফ্যাক্টর হিসাবে উপস্থাপিত হয়েছে, যা পৃথক আপস্কেলিং পদক্ষেপের উপর নির্ভর করে এমন মডেলগুলির সাথে বিপরীত।

    কারিগরি ভিত্তি এবং কর্মক্ষমতা ডেটা

    এই অগ্রগতির পেছনে বেশ কিছু প্রযুক্তিগত আপগ্রেডের কথা জানা গেছে। প্রশিক্ষণ ডেটাসেটের আকার উল্লেখযোগ্যভাবে বৃদ্ধি করা হয়েছে, আংশিকভাবে একটি “ত্রুটি-সচেতন” পদ্ধতির মাধ্যমে যা ডেটা বাতিল করার পরিবর্তে ছোটখাটো ছবির ত্রুটিগুলিকে আড়াল করে।

    প্রশিক্ষণে মিশ্র রেজোলিউশন এবং “ক্রস-মডালিটি RoPE” (রোটারি পজিশন এম্বেডিং) এর মতো কৌশল অন্তর্ভুক্ত করা হয়েছে, একটি পদ্ধতি যা প্রসঙ্গের উপর ভিত্তি করে অবস্থানগত তথ্য সামঞ্জস্য করে, এখানে টেক্সট-ইমেজ অ্যালাইনমেন্ট উন্নত করার উদ্দেশ্যে তৈরি করা হয়েছে। মডেলটি ফ্লো ম্যাচিং অবজেক্টিভস এবং রিপ্রেজেন্টেশন অ্যালাইনমেন্ট লস (REPA)ও ব্যবহার করে। ব্যবহারকারীর পছন্দগুলিকে আরও ভালভাবে মেলানোর জন্য, রিইনফোর্সমেন্ট লার্নিং 20 বিলিয়নেরও বেশি প্যারামিটার পর্যন্ত স্কেল করা বৃহৎ ভিশন-ল্যাঙ্গুয়েজ মডেল (VLM) ব্যবহার করে, পুরষ্কার বিচারক হিসাবে।

    বাইটড্যান্স অনুসারে, জেনারেশন স্পিড ত্বরণ কৌশল থেকে উপকৃত হওয়ার দাবি করা হয়েছে, যা সিড্রিম 3.0 কে প্রায় 3 সেকেন্ডের মধ্যে 1K রেজোলিউশনের ছবি তৈরি করতে সক্ষম করে। প্রাথমিক বেঞ্চমার্ক ফলাফলে Seedream 3.0 কে কৃত্রিম বিশ্লেষণ এরিনা ব্যবহারকারী পছন্দের লিডারবোর্ডের শীর্ষে রাখা হয়েছে, যদিও র‍্যাঙ্কিং তারতম্য হতে পারে।

    যদিও ByteDance এর অভ্যন্তরীণ পরীক্ষাগুলি শক্তিশালী ফলাফল দেখায়, বিভিন্ন প্রম্পট জুড়ে স্বাধীন যাচাইকরণ প্রয়োজন। প্রাথমিক ব্যবহারকারীর প্রতিক্রিয়ায় এর প্রাথমিক বিনামূল্যের প্রাপ্যতা এবং স্টাইলিস্টিক পরিসর উল্লেখ করা হয়েছে তবে রেফারেন্স ইমেজ ইনপুটের অভাবের মতো লঞ্চ সীমাবদ্ধতাও উল্লেখ করা হয়েছে।

    SeedEdit ইমেজ এডিটিং ফিল্ডে প্রবেশ করে

    জেনারেটরের পরিপূরক হল SeedEdit 1.6, একটি টুল যা টেক্সট-প্রম্পট-ভিত্তিক ইমেজ এডিটিং সক্ষম করে, যার মধ্যে ইমেজের মধ্যে টেক্সটের হেরফের অন্তর্ভুক্ত। আনুষ্ঠানিকভাবে Seed T2I মডেলের উপর নির্মিত হিসাবে বর্ণনা করা হয়েছে, এটি GPT-4o এর মাধ্যমে ChatGPT-তে সংহত বৈশিষ্ট্যগুলির সাথে প্রতিযোগিতা করে।

    ByteDance পরামর্শ দেয় যে SeedEdit GPT-4o এর তুলনায় পরিবর্তনের সময় মূল ছবির বৈশিষ্ট্যগুলির উচ্চতর সংরক্ষণ অফার করে, বিশেষ করে টেক্সট পরিবর্তনের মতো জটিল কাজের জন্য। SeedEdit পণ্য অবস্থান ফটোগ্রাফি, শিল্প এবং ই-কমার্সে পেশাদার অ্যাপ্লিকেশনগুলিকে লক্ষ্য করে। যদিও এই অগ্রগতিগুলি ইতিবাচকভাবে উপস্থাপন করা হয়েছে, দাবি করা কর্মক্ষমতা অর্জনের জন্য প্রায়শই বিনিময়ের প্রয়োজন হয়, সম্ভাব্যভাবে গণনার চাহিদাগুলিও অন্তর্ভুক্ত, যা ব্যাপক গ্রহণ এবং তৃতীয় পক্ষের পরীক্ষার মাধ্যমে আরও স্পষ্ট হবে।

     

    সূত্র: Winbuzzer / Digpu NewsTex

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Telegram Copy Link
    Previous Articleএআই এজেন্টদের উন্নত করতে AWS ওপেন সোর্স মডেল কনটেক্সট প্রোটোকল সার্ভার প্রকাশ করেছে
    Next Article শুল্ক নিয়ম পরিবর্তনের মধ্যে DHL মার্কিন যুক্তরাষ্ট্রে উচ্চ-মূল্যের B2C চালান স্থগিত করেছে
    © 2026 ThemeSphere. Designed by ThemeSphere.
    • Home
    • About
    • Team
    • World
    • Buy now!

    Type above and press Enter to search. Press Esc to cancel.