মঙ্গলবার, ২৩ জুন ২০২৬,
৯ আষাঢ় ১৪৩৩
বাংলা English
ই-পেপার

মঙ্গলবার, ২৩ জুন ২০২৬
শিরোনাম: বিকল লঞ্চ থেকে ৯৯৯-এ ফোন, ৮০ যাত্রী উদ্ধার      সেপ্টেম্বর থেকে স্থানীয় সরকার নির্বাচন শুরু হতে পারে: ডা. জাহেদ      সালমান শাহর লাশ উত্তোলনের আদেশ বাতিল      সুশাসন ও সংস্কার ছাড়া বাজেট বাস্তবায়ন কঠিন      দেশজুড়ে কঠোর সতর্কতা      চীনের দালিয়ানে পৌঁছেছেন প্রধানমন্ত্রী      চীন পৌঁছেছেন প্রধানমন্ত্রী      
প্রযুক্তি
ছবির ভেতরে নিখুঁত লেখা: চ্যাটজিপিটির ‘ইমেজেস ২.০’ মডেলে বড় অগ্রগতি
প্রযুক্তি ডেস্ক
প্রকাশ: বুধবার, ২২ এপ্রিল, ২০২৬, ৫:১৬ পিএম
সংগৃহীত ছবি

সংগৃহীত ছবি

ছবির ভেতরে সঠিকভাবে লেখা তৈরিতে বড় উন্নতি এনেছে অপেনএআই। চ্যাটজিপিটির নতুন ‘ইমেজেস ২.০’ মডেল এখন এমন ছবি তৈরি করতে পারে। যেখানে লেখা প্রায় নিখুঁতভাবে উপস্থাপন করা যায়। যা আগে এআইয়ের জন্য বড় চ্যালেঞ্জ ছিল।

প্রযুক্তিবিষয়ক সাইট টেকক্রাঞ্চের এক প্রতিবেদনে বলা হয়েছে, চ্যাটজিপিটির ‘ইমেজেস ২.০’ মডেল এখন এমন মানের লেখা তৈরি করতে পারে। যা সরাসরি ব্যবহারযোগ্য। উদাহরণ হিসেবে একটি রেস্টুরেন্টের মেনু তৈরি করে দেখা গেছে সেটি বাস্তব মেনুর মতোই স্বাভাবিক দেখাচ্ছে।

এর আগে ছবি তৈরির এআই মডেলগুলো মূলত ‘ডিফিউশন মডেল’ ব্যবহার করত। এই পদ্ধতিতে এলোমেলো পিক্সেল থেকে ধীরে ধীরে ছবি তৈরি করা হয়। ফলে ছবির মূল অবজেক্ট ভালোভাবে তৈরি হলেও ছোট অংশ প্রায়ই ভুল হতো।

বিশেষজ্ঞদের ভাষায়, লেখার অংশটি ছবির খুব ছোট একটি অংশ হওয়ায় মডেল সেটিকে ঠিকভাবে শেখাতে পারত না। তাই অদ্ভুত বানান বা বিকৃত শব্দ দেখা যেত।

তবে নতুন মডেলে এই সীমাবদ্ধতা কমেছে। গবেষকেরা ‘অটোরিগ্রেসিভ’ মডেলের মতো নতুন পদ্ধতি ব্যবহার করছেন। যা ভাষা মডেলের মতো কাজ করে। এতে ছবি তৈরির সময় লেখা বা সূক্ষ্ম উপাদানগুলোও বেশি নির্ভুলভাবে তৈরি করা সম্ভব হচ্ছে। যদিও নতুন মডেলের পেছনে ঠিক কোন প্রযুক্তি ব্যবহার করা হয়েছে সে বিষয়ে বিস্তারিত জানায়নি অপেনএআই।

প্রতিষ্ঠানটি জানিয়েছে, ‘ইমেজেস ২.০’ মডেলে “থিংকিং ক্যাপাবিলিটি” বা চিন্তাভাবনার সক্ষমতা যুক্ত করা হয়েছে। এর ফলে এটি একটি প্রম্পট থেকে একাধিক ছবি তৈরি করতে পারে। প্রয়োজনে তথ্য যাচাই করতে পারে এবং জটিল ডিজাইনও তৈরি করতে সক্ষম।

এই মডেল দিয়ে বিভিন্ন আকারের মার্কেটিং ভিজ্যুয়াল, কমিক স্ট্রিপ বা ইউআই ডিজাইন তৈরি করা সম্ভব। এমনকি জাপানি, কোরিয়ান, হিন্দি ও বাংলার মতো নন-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে তৈরি করতে পারে।

তবে এই উন্নতির একটি সীমাবদ্ধতাও রয়েছে। মডেলটির জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত। ফলে সাম্প্রতিক কোনো তথ্য বা ঘটনার ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।

অপেনএআই বলছে, নতুন মডেলটি আগের তুলনায় আরও নির্দিষ্ট নির্দেশনা বুঝতে পারে এবং সূক্ষ্ম বিষয়গুলো ভালোভাবে ফুটিয়ে তুলতে সক্ষম। ছোট লেখা, আইকন, জটিল কম্পোজিশন এসব ক্ষেত্রেও উন্নতি দেখা যাচ্ছে। সর্বোচ্চ টু-কে রেজোলিউশনের ছবি তৈরি করা সম্ভব।

তবে এই মানের ছবি তৈরি করতে কিছুটা বেশি সময় লাগে। সাধারণ প্রশ্নের উত্তর দেওয়ার মতো দ্রুত না হলেও জটিল ছবি তৈরিতে কয়েক মিনিট সময় লাগতে পারে।

প্রতিষ্ঠানটি জানিয়েছে, চ্যাটজিপিটি ও কোডেক্স ব্যবহারকারীরা ধাপে ধাপে এই ফিচার ব্যবহার করতে পারবেন। পেইড ব্যবহারকারীরা উন্নত মানের আউটপুট তৈরি করার সুযোগ পাবেন। পাশাপাশি ‘জিপিটি-ইমেজ-২’ নামে একটি এপিআইও উন্মুক্ত করা হবে। যার খরচ নির্ভর করবে ছবির মান ও রেজুলেশনের ওপর।

বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে। ডিজাইনার, বিপণনকর্মী ও সাধারণ ব্যবহারকারীদের জন্য দ্রুত এবং কম খরচে মানসম্মত ভিজ্যুয়াল তৈরি করা আরও সহজ হবে। একই সঙ্গে এআই-তৈরি কনটেন্ট ও বাস্তব কনটেন্ট আলাদা করা আরও কঠিন হয়ে উঠতে পারে।

কেকে/ এমএস


মতামত লিখুন:
Loading...
Loading...

প্রযুক্তি- এর আরো খবর

সম্পাদক ও প্রকাশক : আহসান হাবীব
বার্তা ও বাণিজ্যিক কার্যালয় : বসতি হরাইজন, ১৭-বি, বাড়ি-২১ সড়ক-১৭, বনানী, ঢাকা-১২১৩
ফোন : বার্তা-০২২২২২৭৬০৩৭, মফস্বল-০২২২২২৭৬০৩৬, বিজ্ঞাপন ও সার্কুলেশন-০২২২২২৭৬০২৯, ০১৭৮৭৬৯৭৮২৩, ০১৮৫৩৩২৮৫১০ (বিকাশ)
ই-মেইল: kholakagojnews@gmail.com, kholakagojadvt@gmail.com

© 2025 Kholakagoj
🔝
close