সাহিত্যিক হতে চান?
সহজ উপায়।
এক লাইনে বলুন শুধু কীসের গল্প লিখতে চান?
ব্যস, এক মুহুর্তে গল্প হাজির হবে আপনার সামনে।
অথবা,
আপনি লিখতে চান দুর্দান্ত কোড?
সহজ উপায়।
শুধুমাত্র বলুন একবার প্রবলেমটা।
পলক ফেলার মধ্যে আপনার কম্পিউটার স্ক্রিনে দেখা দেবে আপনার কোড।
বিনা পরিশ্রম, বিনা সময় ব্যয় করে সফল হন আজকেই।
উপরের কথাগুলো কেমনধারা বিজ্ঞাপনের মতো মনে হচ্ছে না? অসম্ভব নয়। আজ থেকে বছর কয়েক পর হয়তো এমন অনেক এজেন্সি তৈরি হবে যারা আপনার সমস্ত কাজ করে দেবে প্রশিক্ষিত যন্ত্রের মাধ্যমে। এমনিতেই হাজারো অ্যাপ এসে দৈনন্দিন কাজ সহজ করে দিচ্ছে। বাজার দোকান করা থেকে গাড়ি বুক করে ফেলা যায় হাতের পুঁচকে মোবাইলের স্ক্রিনে আঙুল চালিয়ে। অথবা গুগলের কাছে যে কোনো প্রশ্ন নিয়ে হাজির হলে আন্তর্জালের আনাচ কানাচ খুঁজে এনে দেবে তার সম্পর্কিত ওয়েবসাইটের লিংক সব। এমনকি আজকাল কম্পিউটার গন্ধ বিচার করেও বাতলে দিচ্ছে গন্ধটা এসেন্সের কি না। শুধু আমরা মানুষ হিসাবে সৃষ্টিশীল ভাবনার ক্ষেত্রটা ধরে রেখেছিলাম আমাদের হাতে, থুড়ি, মস্তিষ্কে। ফলে গল্প উপন্যাস প্রবন্ধ লেখা অথবা কম্পিউটার কোডিং-এর মাধ্যমে বিশেষ কোনো প্রব্লেমের সমাধান করার ক্ষেত্রে এতদিন মানব-মস্তিষ্কের বিকল্প ছিলো না। কিন্তু এবার যদি তার জন্যেও এসে হাজির হয় মুশকিল আসান?
শুনে কল্পবিজ্ঞানের গল্পের প্লট মনে হচ্ছে? তবে ‘ওপেন এ-আই’ সংস্থার সাম্প্রতিকতম কৃত্রিম বুদ্ধিমত্তাসম্পন্ন চ্যাটবটটির খবর পাননি এখনো। তার পোশাকি নাম ‘চ্যাট-জিপিটি’।
মানুষের মস্তিষ্কের অনুকরণে কম্পিউটারকেও যে শিক্ষা প্রদান করা যায় সে কথা বলেছিলেন প্রখ্যাত ব্রিটিশ গণিতবিদ অ্যালান টুরিং। Computing Machinery and Intelligence শীর্ষক একটি প্রবন্ধে তিনি সেই বিখ্যাত প্রশ্ন তোলেন – Can machines think? টুরিং ‘ইমিটেশন গেম’ বা ‘টুরিং টেস্ট’ নামে একটি পরীক্ষা পদ্ধতির কথাও বলেন, যা পাশ করলে একটি যন্ত্রর প্রতিক্রিয়ার সাথে মানুষের প্রতিক্রিয়ার পার্থক্য নেই বলা যাবে – ফলে সেই যন্ত্র সত্যিই হয়ে উঠবে ‘বুদ্ধিমান’। এর পর টেমস, গঙ্গা, হাডসন, ভল্গা সর্বত্র বয়ে গেছে গ্যালন গ্যালন জল। মানুষের স্নায়ুতন্ত্রের অনুকরণে তৈরি হয়েছে কৃত্রিম স্নায়ুতন্ত্র বা Artificial neural network. ছেলেবেলা থেকে নানাবিধ শিক্ষা এবং অভিজ্ঞতার মাধ্যমে যেমন আমরা আমাদের চারপাশে ছড়িয়ে থাকা সমস্তকিছু সম্পর্কে জ্ঞান লাভ করি – আমরা পড়তে শিখি, প্রশ্নের উত্তর দিতে শিখি বা একটা গাছ আঁকতে বললে কাগজ কলম দিয়ে খসখস করে এঁকে ফেলতে পারি, ঠিক তেমনই নির্দিষ্টভাবে নির্মিত তথ্যভাণ্ডার দিয়ে কম্পিউটারের কৃত্রিম স্নায়ুতন্ত্রকেও শিক্ষিত করে তোলা যায়। তফাত এই যে কম্পিউটার নিতান্তই বোকা হওয়ায় তার ক্ষমতা খুবই সীমিত – সে শুধু বোঝে সংখ্যা। তাই সমস্ত কিছুকেই সে কিছু সংখ্যার সমাহার হিসাবে তার যান্ত্রিক মস্তিষ্ক বা হার্ডডিস্কের মধ্যে রেখে দেয়। কৃত্রিম স্নায়ুতন্ত্রের কাজ হলো একটি নির্দিষ্ট পদ্ধতিতে এই নবপোলব্ধ শিক্ষাকে একটি সমীকরণের মাধ্যমে ‘মনে’ রাখা। এরপর তাকে যাই জিজ্ঞেস করা হবে, সেই প্রশ্নকে ওই গাণিতিক সমীকরণের মধ্যে ফেলে তার সমাধান বের করবে – আর ওই সমাধানই হবে প্রশ্নের উত্তর। এবার যত ভালোভাবে, সমস্তরকম গুণাগুণ বিচার করে এই সমীকরণ তৈরি হবে তত ভালো হবে উত্তরের মান।
মানুষের কথ্য ভাষা কম্পিউটারকে বোঝানোর যে উপায়, তাকে বলা হয় ‘ন্যাচারাল ল্যাংগুয়েজ আন্ডারস্ট্যান্ডিং’ বা NLU. ঊনিশশো ছেষট্টি সালে আমেরিকার ম্যাসাচুসেটস ইন্সটিটিউট অফ টেকনোলজিতে জোসেফ উইজেনবাম নামে এক কম্পিউটার বিশেষজ্ঞ জন্ম দেন ‘ইলাইজা’র। ইলাইজা ছিলো আজকের অ্যালেক্সা বা সিরির বংশের আদিপুরুষ। যদিও সে সময় ন্যাচারাল ল্যাঙ্গুয়েজ আন্ডারস্ট্যান্ডিং দাঁড়িয়ে ছিল আগে থেকে প্রোগ্রাম করে দেওয়া নির্দিষ্ট কিছু নিয়মাবলীর উপর। কম্পিউটারকে সত্যিকারের ভাষা শিক্ষাদান করার পদ্ধতি জানা ছিলো না তখনও। এই ‘ইলাইজা’র কাজ ছিলো মনোবিদের। মানসিক সমস্যার কথা শুনে বাতলে দিত উপায়। আর সেসময় আমেরিকাতে প্রাক-ইন্টারনেট যুগে ইলাইজা প্রবল জনপ্রিয় হয়। মানুষ তাকে নিজেদের বন্ধু ভেবে মনের কথা উজাড় করে দিতে থাকেন। যন্ত্রের প্রতি মানুষের এই বিশ্বাস দেখে উইজেনবাম নিজেই বলেন যে, মানুষ এটা ভুল করছে – একটা কম্পিউটার কখনো একজন মানুষের সমকক্ষ হয়ে উঠতে পারবেনা কোনোদিনই।
বলা বাহুল্য, কয়েক দশকের মধ্যেই প্রাবল্য যন্ত্রকে প্রায় মানুষের সমকক্ষই করে তুলেছে অনেকাংশে। আটের দশকের শেষ থেকেই ইন্টিগ্রেটেড চিপের ক্ষমতা প্রবল হারে বৃদ্ধি পেতে থাকে, সাথে বাড়তে থাকে চাহিদা। ফলে বৃদ্ধি পেতে থাকে কম্পিউটারের গণক-ক্ষমতা বা কম্পিউটেশনাল পাওয়ার। এই হিসাব করার ক্ষমতা বাড়ার ফলে জটিলতর সমীকরণকে দ্রুত সমাধান করতে সক্ষম হয় কম্পিউটার – বিপ্লব ঘটে কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রেও। নয়ের দশকে সমস্ত বিশ্ববিদ্যালয়ে দ্বিগুণ উৎসাহে গবেষণা শুরু হয় কম্পিউটারকে মানুষ করার জন্য। আর তারই ফল হিসাবে এই গত এক দশকে আমাদের চারদিকে ছেয়ে গেছে স্বয়ংক্রিয় যন্ত্রে – আপনার গন্তব্যে পৌঁছতে কত সময় লাগবে তার গণনা থেকে শুরু করে গুগলে তথ্য অন্বেষণ অবধি।
বছর ছয়েক আগে গুগলের এ-আই রিসার্চ ল্যাব গুগল ব্রেন যন্ত্রকে ভাষা শিক্ষাদানের এক নতুন উপায় বাতলায়। এর আগে অবধি একটি বাক্যের মানে বোঝার জন্য কম্পিউটার একটি একটি করে শব্দ (বা তার গাণিতিকরূপ)-কে প্রক্রিয়াভুক্ত করতো। একটি একটি করে শব্দের অর্থকে একত্রিত করে সামগ্রিক একটি অর্থ তৈরি করতো কম্পিউটার। ঠিক যেমনভাবে আমরা পড়ি বা শুনি। কিন্তু গুগল ব্রেইনের বৈজ্ঞানিকরা এই প্রক্রিয়ায় একটু বদল আনলেন। ‘ট্রান্সফর্মার’ নামে একটি নতুন আর্কিটেকচারের কথা বললেন ওঁরা। এখানে মানুষের মতো কম্পিউটারের ‘কানে’ শব্দ একটা একটা করে আসবেনা। বরং একসাথে পুরো বাক্যটাই দেওয়া হবে কম্পিউটারকে এবং সেই বাক্যের অন্তর্গত শব্দগুলির মধ্যে কী সম্পর্ক, কোন সর্বনাম কোন বিশেষ্যকে নির্দেশ করছে বা একটি নির্দিষ্ট শব্দ ঠিক কোন অর্থে এই বাক্যে ব্যবহৃত হচ্ছে – সেটা শেখানো হবে তাকে। এই শিক্ষা কম্পিউটার ‘মনে’ রাখবে একটা জটিল গাণিতিক প্রক্রিয়ারূপে। এবার তা থেকে আমাদের বোঝার মতো ভাষায় ‘ডিকোড’ করা হবে আবার একটি বিপরীত প্রক্রিয়ায়। যেমন, বাংলা থেকে ইংরেজিতে অনুবাদ করার জন্য বাংলা বাক্যটিকে কম্পিউটার নিজের মতো করে বুঝে নেবে প্রথমে, তারপর সে বাক্যের বক্তব্যটিকে ইংরেজি ভাষায় বলে দেবে আমাদের জন্য।
এই ‘ট্রান্সফর্মার’ কম্পিউটারের ভাষা শিক্ষার ক্ষেত্রে এক বৈপ্লবিক পরিবর্তন নিয়ে এল। ফলে শুধু মাত্র বাক্যের গঠনগত অর্থ ছাড়াও কম্পিউটার বুঝতে শুরু করলো বাক্যের মধ্যে লুকিয়ে থাকা বিভিন্ন শব্দের প্রয়োগগত পার্থক্য। ঠিক যেমনটা আমরা বুঝতে পারি স্বাভাবিকভাবেই। এ ছাড়াও যন্ত্রের শিক্ষা সম্পন্ন হতে থাকলো আরো দ্রুততার সাথে। যথারীতি অচিরেই গুগলের এই ‘ট্রান্সফর্মার’ আর্কিটেকচারের প্রয়োগ শুরু হলো সমস্তক্ষেত্রেই। এবং এই নভেম্বরে ‘ওপেন এ-আই’ নামের একটি কোম্পানি এই ট্রান্সফর্মারের প্রয়োগ ঘটিয়ে ইন্টারনেটে পাওয়া যায় এমন সমস্ত তথ্যসম্ভার ব্যবহার করে শিক্ষাদীক্ষা দিয়ে নির্মাণ করলো একটি অভূতপূর্ব চ্যাটবট – তার নাম ‘চ্যাট-জিপিটি’। জিপিটি – অর্থাৎ জেনেরেটিভ প্রি-ট্রেইন্ড ট্রান্সফর্মার। এই জিপিটি নিয়ে ওপেন এ-আই বেশ কিছু বছর ধরেই গবেষণা করছে। জিপিটির কাজই হলো, আপনার প্রশ্নে মানুষের মতো উত্তর দেওয়া। অর্থাৎ সেই অ্যালান টুরিং-এর ‘ইমিটেশন গেম’-এ ফুল মার্কস নিয়ে পাশ করা।
এই জিপিটির সর্বশেষ সংস্করণের উপর নির্ভর করে নির্মিত চ্যাট-জিপিটি এতটাই ক্ষমতাশালী যে, যে কোনো প্রশ্নের উত্তর তো সিধু জ্যাঠার মতো বলেই দিচ্ছে, এ ছাড়া প্লট দিয়ে দিলে নিজের মতো করে বানিয়ে দিচ্ছে গল্প অথবা প্রয়োজনমাফিক লিখে দিচ্ছে কোডও। ফলে প্রকাশ হওয়া মাত্র প্রবল জনসমাদর পেয়ে যাকে বলে ‘সেলিং লাইক হট-কচুরীস’। আর খুব স্বাভাবিকভাবেই প্রশ্ন উঠতে শুরু করেছে তবে কি অদূর ভবিষ্যতে গুগল সার্চের প্রয়োজনীয়তা ফুরবে? কারণ মানুষ কষ্ট করে গুগলের খুঁজে দেওয়া লিংকে গিয়ে পড়ে বুঝে প্রয়োজনীয় তথ্য গ্রহণ করার থেকে এমন সবজান্তা জ্যাঠার কাছে যাওয়াই শ্রেয় মনে করবে যে নিজেই ‘টু দ্য পয়েন্ট’ উত্তর এনে দিচ্ছে। মানুষ অলস হতে ভালবাসে। আর এই টেকনোলজি কোম্পানিদের তাতেই লাভ। ফলে অনেকে চ্যাট-জিপিটিকে অদূর ভবিষ্যতে গুগলের সার্চ-ইঞ্জিনের প্রতিযোগী হিসাবে ভাবতে শুরু করে দিয়েছেন এখনই।
গুগল অবশ্য সে কথা মানতে নারাজ। তাদের বক্তব্য যে ট্রান্সফর্মারের উপর নির্ভর করে তোমরা এমন তাক লাগানো যন্ত্র সিধু জ্যাঠা বানাচ্ছ, সেটা আমাদেরই মস্তিষ্কজাত। ফলে ভেবো না যে অনুরূপ জিনিস বানানোর ক্ষমতা আমাদের নেই। কিন্তু গুগল সেটা এই মুহুর্তে করবে না, কারণ ওপেন এ-আইয়ের চ্যাটবটের কোনো বিষয়ে ভুল তথ্য বা উত্তর দেওয়ার একটা বড়সড় সম্ভাবনা আছে। অন্যদিকে মানুষ সত্য যাচাই করার জন্যই সাহায্য নেয় গুগল সার্চ ইঞ্জিনের। ফলে, গুগল ভুল তথ্য পরিবেশন করার ঝুঁকি নিতে অপারগ। সে কথা ওপেন এ-আই-এর সিইও স্যাম অল্টম্যানও স্বীকার করে নিয়ে বলেছেন, যেহেতু চ্যাটজিপিটির মূল ভিত্তি একটি এ-আই মডেল এবং এ-আই মডেল মাত্রই সেখানে লুকিয়ে থাকে সম্ভাবনাতত্ত্ব, তাই ঠিকের সাথে ভুল উত্তর দেওয়ারও একটা সম্ভাবনা থেকেই যায়। সুতরাং কোনো প্রয়োজনীয় তথ্যবিচারের জন্য চ্যাটজিপিটির উপর নির্ভর না করাটাই শ্রেয়।
তবে এই চ্যাটজিপিটি যে ভবিষ্যতে মানুষের ক্রিয়েটিভ সত্ত্বার অনেকটাই দাবী করে বসবে, সে বিষয়ে সন্দেহ করছেন না কেউই। গরুর রচনা থেকে তাপগতিবিদ্যার জটিল প্রশ্নের সহজ উত্তর এক লহমায় এনে হাজির করছে সামনে। কে বলতে পারে, বছর কয়েকবাদে দু একটা মূল পয়েন্ট দিলে সে লিখে দেবেনা একটা আস্ত উপন্যাস? তাহলে, গল্প-উপন্যাসও ‘ম্যানুফ্যাকচার’ হবে যান্ত্রিক কৌশলে? সে কথা আপাতত ভবিষ্যতই বলবে।