ওয়ানএইটি-র এক-শট অনুকরণ শেখার জন্য নতুন পদ্ধতি, এআই-এর ভবিষ্যতের দিকে তাকিয়ে

ওয়ান-শট ইমিটেশন লার্নিং ইয়ান ডুয়ান, মার্সিন অ্যান্ড্রিওউইক্জ, ব্র্যাডলি সি স্টাডি, জনাথন হো, জোনাস স্নাইডার, ইলিয়া সুটস্কেভার, পিটার অ্যাবেল, ভোজিয়াচ জেরেবাবা

১ May ই মে, ওপেনএআই গবেষকরা তাদের বর্তমান প্রকল্পের তিনটি গুরুত্বপূর্ণ বাধা: মেটা-লার্নিং, এক-শট লার্নিং এবং অটোমেটেড ডেটা জেনারেশন সম্পর্কিত গুরুত্বপূর্ণ দুটি গবেষণার সমাধান অনুসন্ধানের জন্য দুটি প্রকল্পের একটি ভিডিও ভাগ করেছেন। আমার আগের পোস্টে, আমি একটি শট শেখার চিত্তাকর্ষক সমস্যার জন্য নিবেদিত একটি নিবন্ধ প্রতিশ্রুতি দিয়েছি, তাই এখানে দেওয়া আছে। তাদের প্রকাশিত ভিডিওটি একবার দেখে আপনি তাদের আশ্চর্যজনক কাজের ব্যাখ্যা দিয়ে শুরু করতে পারেন:

এই ভিডিওতে আপনি দেখতে পাচ্ছেন এক বাহু শারীরিক রোবট একে অপরের শীর্ষে কিউব স্ট্যাক করে। শিল্প রোবটগুলি বর্তমানে যে জটিল কাজগুলি সম্পাদন করতে সক্ষম হয়েছে তা জেনেও গবেষকরা কী চলছে তা ব্যাখ্যা করার চেষ্টা না করলে অনেকগুলি অ্যাকাউন্টে এটি খুব হতাশাব্যঞ্জক হবে। নিয়ন্ত্রিত পরিবেশে কাজটি সহজ, প্রক্রিয়াগত (হার্ড-কোডেড) পদ্ধতিগুলি ইতিমধ্যে এই সমস্যাগুলি সমাধান করেছে, প্রতিশ্রুতিবদ্ধ এবং বিপ্লবী কি হ'ল শব্দের পরিবেশে একাধিক, আরও জটিল এবং অভিযোজিত আচরণ পর্যন্ত কতটা স্কেল করতে পারে।

মানুষ এবং উচ্চতর প্রাণীর মধ্যে মনের মধ্যে পার্থক্য, এটি যেমন দুর্দান্ত, অবশ্যই তা এক ধরণের নয় এবং সদয়।
- চার্লস ডারউইন

সাদৃশ্য অনুসারে, এই নিবন্ধটি দৃ strong় প্রমাণ যে বর্তমান সজ্জিত এআই (শারীরিক ব্যবস্থাগুলির কৃত্রিম বুদ্ধিমত্তা) এবং 22 তম শতাব্দীর রোবটগুলির মধ্যে জ্ঞানীয় ব্যবস্থাগুলির পার্থক্য এক ধরণের নয়, এক ধরণের হবে। ২০১২ সালের ইমেজনেট প্রতিযোগিতা * থেকে, গভীর শিখন গবেষণা বিকাশ লাভ করছে, নিউরাল নেটওয়ার্ক দ্বারা বিতরণকৃত গণনার প্রকৃতি পরিবর্তনের জন্য এতটা নয়, তবে নির্দিষ্ট কাজ শিখার জন্য নেটওয়ার্ক গঠনের নতুন উপায় সন্ধান করে। নিউরাল নেটওয়ার্ক ক্রিয়াকলাপের জন্য কাঠামো, এই কাঠামোটি হার্ড-কোডড নয় (হাত দ্বারা ডিজাইন করা হয়নি) তবে এটি প্রাথমিকভাবে ইনপুট এবং আউটপুটগুলির মধ্যে সংযুক্ত পারমাণবিক কম্পিউটেশনাল ইউনিটের ফলাফল যা তাদের কাঠামো এবং সংযোগগুলি সংশোধন করতে সক্ষম। এটি নেটওয়ার্কের সামগ্রিক কাঠামোটি সংশোধন করার মাধ্যমে এটি একটি নির্দিষ্ট ফাংশন শিখেছে।

এই নিবন্ধে তারা একটি সাধারণ কাঠামো তৈরি করেছিলেন যাতে কোনও এজেন্টকে একটি বিমূর্ত পদ্ধতিতে কাজগুলি উপস্থাপন করতে প্রশিক্ষণ দিতে পারে, এবং এই জ্ঞানটি উপন্যাসের টাস্কের কেবলমাত্র একটি প্রদর্শনের পরে (একটি শট নকলকরণ শিখন) নতুন অদেখা কাজগুলিতে স্থানান্তর করতে শিখতে পারে (একটি শট নকলকরণ শিখন)।

কাজগুলো

যদিও সঠিক স্থাপত্য বাস্তবায়নের পার্থক্য রয়েছে, তারা সাধারণ পদ্ধতির কার্যকারিতা দেখানোর জন্য উদাহরণ হিসাবে দুটি কাজ করে।

কণা পৌঁছেছে

প্রথম উদাহরণে সিস্টেমটি একটি প্লেনে রঙিন টার্গেট পজিশনের ইনপুট এবং নির্দিষ্ট লক্ষ্যে যাওয়া সিমুলেটেড এজেন্টের একক ভিডিও প্রদর্শন গ্রহণ করে।

চিত্র 2. রোবটটি 2-মাত্রিক শক্তি দিয়ে নিয়ন্ত্রিত একটি বিন্দু ভর। কার্যগুলির পরিবারটি একটি লক্ষ্য লক্ষণ পৌঁছানো। ল্যান্ডমার্কের পরিচয় টাস্কের চেয়ে আলাদা হয়ে যায় এবং মডেলটিকে বিক্ষোভের ভিত্তিতে কোন লক্ষ্যটি অনুসরণ করতে হবে তা নির্ধারণ করতে হবে। (বাম) রোবটের চিত্র; (মাঝের) কাজটি কমলা বাক্সে পৌঁছানো, (ডানদিকে) কাজটি হল সবুজ ত্রিভুজটি পৌঁছানো।

প্রশিক্ষণের সময় সিস্টেমটিকে একই কাজটি পুনরায় উত্পাদন করতে হবে (কমলাতে পৌঁছে দিন) তবে অন্য কনফিগারেশন থেকে, রোবট এবং লক্ষ্যগুলির জন্য শুরু করার বিভিন্ন অবস্থান রয়েছে। এটি স্পষ্ট নয় যে পরীক্ষার সময় এজেন্টকে সেই কাজের উপর পরীক্ষা করা হয়েছিল যে তিনি প্রশিক্ষণ পেয়েছিলেন (কমলা পৌঁছে দিন) অথবা যে কাজটি তিনি আগে কখনও দেখেননি (উদাহরণস্বরূপ সবুজ পৌঁছায়) বা উভয়ই।

প্রশিক্ষিত নীতিটি নতুন পরিস্থিতির উপর মূল্যায়ন করা হয় এবং প্রশিক্ষণের সময় অদেখা নতুন বিক্ষোভ ট্র্যাজেটরিগুলিতে শর্তযুক্ত।

এটি নিশ্চিত যে এজেন্টকে লক্ষ্য একটি অনন্য প্রদর্শন থেকে লক্ষ্য নির্ধারণ করতে হবে এবং আবার অন্য কনফিগারেশন থেকে শুরু করতে হবে। এটি সূচিত করে যে সঠিক মোটর সিকোয়েন্সটি পরীক্ষার আগে শেখা যায়নি এবং কার্য এবং মোটর পরিকল্পনার বিমূর্ততা (উচ্চ-স্তরের কাঠামোগত উপস্থাপনা) এর মাধ্যমে অনুমান করা উচিত er

স্ট্যাকিং ব্লক করুন

দ্বিতীয় উদাহরণে এজেন্টকে কিউবগুলি স্ট্যাক করতে শিখতে হবে (বিভিন্ন রঙ দ্বারা চিহ্নিত) একক সিমুলেটেড বিক্ষোভের মধ্যে প্রদর্শিত একটি হিসাবে order এই সিমুলেটেড বিক্ষোভটি 3 ডি ফিজিক্স ইঞ্জিন দ্বারা উত্পাদিত 2D চিত্রের একটি সিরিজ যা এতে রোবটের মোটর এবং সংবেদক যন্ত্রগুলির বৈশিষ্ট্যগুলি মডেল করা হয়।

এক শট নীতি। অনেক কাজ সমাধানের জন্য প্রশিক্ষিত একটি একক নীতি। শীর্ষস্থানীয় টাস্ক: {abc, def}, নীচের টাস্ক: {আব, সিডি, ইফ

উভয় উদাহরণে বিক্ষোভে এবং বাস্তব পরীক্ষায় কিউবের প্রাথমিক অবস্থানগুলি পৃথক, প্রতিটি কাজ অন্য প্রাথমিক অবস্থান থেকে শুরু হয়। বিক্ষোভের প্রাথমিক অবস্থার সাথে মিলের জন্য রোবট কিউবগুলি প্রতিস্থাপনের চেষ্টা করে না, এটি কিউবকে পাইলিংয়ের উচ্চ স্তরের টাস্কটি সে যে অবস্থায় শুরু করবে তা স্থানান্তর করে।

ডোমেন র্যান্ডমাইজেশন ব্যবহার করে প্রশিক্ষণ

উভয় ক্ষেত্রে প্রশিক্ষণের সময় ব্যবহৃত সমস্ত চিত্রগুলি ডোমেন র্যান্ডমাইজেশন ব্যবহার করে সিমুলেশনের মাধ্যমে প্রাপ্ত হয় যাতে তারা নমুনার নিম্নলিখিত দিকগুলিকে এলোমেলো করে দেবে:

টেবিলের উপর ডিসট্রাক্টর অবজেক্টের সংখ্যা এবং আকৃতি টেবিলের সমস্ত বস্তুর অবস্থান এবং গঠন টেবিলের টেক্সট, মেঝে, স্কাইবক্স এবং রোবটের অবস্থান, অবস্থান এবং অবস্থানের ক্যামেরার ক্ষেত্রের দৃশ্যে আলোকসজ্জার সংখ্যা, অবস্থান, এবং লাইটের স্পেসুলার বৈশিষ্ট্যগুলি চিত্রে টাইপ এবং এলোমেলো শব্দের পরিমাণ

কণা পৌঁছানোর জন্য প্রশিক্ষণ সেট

আমরা টাস্ক পরিবারগুলির ক্রমবর্ধমান কঠিন সেটটি বিবেচনা করি, যেখানে ল্যান্ডমার্কের সংখ্যা 2 থেকে 10 পর্যন্ত বৃদ্ধি পায়, প্রতিটি টাস্ক পরিবারের জন্য, আমরা প্রশিক্ষণের জন্য 10000 ট্র্যাজেক্টরি সংগ্রহ করি, যেখানে ল্যান্ডমার্কের অবস্থান এবং পয়েন্ট রোবটের শুরুর অবস্থানটি এলোমেলোভাবে করা হয়। দক্ষতার সাথে বিক্ষোভ তৈরি করতে আমরা একটি হার্ড-কোডেড বিশেষজ্ঞ নীতি ব্যবহার করি। আমরা পরিবেশে প্রয়োগ করার আগে গণনিত ক্রিয়াগুলিকে নষ্ট করে ট্রাজেক্টোরিজগুলিতে শব্দ যোগ করি এবং নিউরাল নেটওয়ার্ক নীতি প্রশিক্ষণের জন্য আমরা সাধারণ আচরণগত ক্লোনিং ব্যবহার করি

ব্লক স্ট্যাকিংয়ের জন্য প্রশিক্ষণ সেট

কংক্রিটরূপে, আমরা 140 টি প্রশিক্ষণ কার্য এবং 43 টি পরীক্ষার কাজগুলি সংগ্রহ করি, যার মধ্যে প্রতিটি ব্লকের বিভিন্ন পছন্দসই বিন্যাস রয়েছে। প্রতিটি টাস্কে ব্লকের সংখ্যা 2 থেকে 10 এর মধ্যে পরিবর্তিত হতে পারে আমরা প্রশিক্ষণের জন্য প্রতি টাস্কে 1000 টি ট্র্যাজেক্টরি সংগ্রহ করি এবং মূল্যায়নের জন্য ব্যবহৃত ট্র্যাজকোলজির এবং প্রাথমিক কনফিগারেশনের একটি পৃথক সেট বজায় রাখি। কণা পৌঁছানোর কাজটির অনুরূপ, আমরা ট্রাজেক্টোরি সংগ্রহ প্রক্রিয়াতে শব্দটি ইনজেকশন করি। ট্র্যাজেক্টরিগুলি একটি হার্ড-কোডড নীতি ব্যবহার করে সংগ্রহ করা হয়।

হার্ড-কোডেড নীতি ব্যবহার করে সফল বিক্ষোভগুলি সংগ্রহ করা হয়

নোট করুন যে সঠিক ট্র্যাজেটরিজগুলি একটি পদ্ধতিগত "হার্ড-কোডড" নীতি দ্বারা উত্পন্ন হয়েছে, যেটি আমার বিশ্বাস সিস্টেম শনাক্তকরণ এবং নিয়ন্ত্রণের ক্লাসিক কৌশলগুলির উপর নির্ভর করে। প্রশিক্ষণ ও পরীক্ষার সময় এজেন্টের দুটি ইনপুট থাকে: ক) একটি কনফিগারেশন এ বিক্ষোভ, এবং খ) একটি প্রারম্ভিক কনফিগারেশন খ শুধুমাত্র প্রশিক্ষণের সময়, শেখার অ্যালগরিদমের একটি আদর্শ প্রতিক্রিয়াও অ্যাক্সেস থাকে: কনফিগারেশন বি থেকে শুরু হওয়া একটি ট্রাজেক্টোরি সমস্যার উত্তর দেয় এবং যার সাথে এজেন্টের প্রতিক্রিয়াটি শেখার সময় তুলনা করা হয় - এটিকে তদারকি শেখার সমস্যা তৈরি করে।

প্রতিটি প্রশিক্ষণ কাজের জন্য আমরা সফল বিক্ষোভের একটি সেটগুলির উপলব্ধতা অনুমান করি।

যদি এটি স্পষ্ট না হয়, তবে আমি পরবর্তী বিভাগে বিভিন্ন ধরণের শেখার দৃষ্টান্তের মধ্যে পার্থক্যগুলি নিয়ে যাব।

অপ্টিমাইজেশন অ্যালগরিদম এবং ক্ষতি ফাংশন

তত্ত্বাবধানে পড়াশুনা প্রশিক্ষণের দৃষ্টান্তগুলিকে বোঝায় যেখানে প্রতিটি সিদ্ধান্তে নেটওয়ার্কের তার করা উচিত সঠিক পছন্দটিতে অ্যাক্সেস রয়েছে এবং তাই ত্রুটির ধারণাও রয়েছে। উদাহরণস্বরূপ, কুকুর এবং বিড়ালদের মধ্যে শ্রেণিবিন্যাস কার্যে, প্রশিক্ষণের সময় কুকুর এবং বিড়ালের চিত্রগুলির লেবেল আগে থেকেই জানা যায় এবং ত্রুটিগুলি তত্ক্ষণাত সনাক্ত করা যায়। সেই অর্থে এটি অব্যবহৃত শিক্ষার চেয়ে আলাদা যেখানে সাধারণভাবে এজেন্টকে তার প্রাপ্ত ইনপুটগুলির মধ্যে পূর্বের কোনও অজানা কাঠামো খুঁজে পেতে বলা হয়, এবং বিড়াল এবং কুকুরের লেবেল ছাড়াই আবিষ্কার করতে হবে যে কেবলমাত্র ভিত্তিতে বিভিন্ন বস্তুর দুটি গুচ্ছ রয়েছে on তথ্য অন্তর্ভুক্ত তথ্য। এটি রিইনফোর্সমেন্ট লার্নিং থেকেও আলাদা যে প্রায়শই রিয়েল টাইম সিস্টেমে প্রযোজ্য যেখানে লক্ষ্যে পৌঁছানোর সিদ্ধান্তের সঠিক ক্রমটি অজানা তবে কেবল একটি চূড়ান্ত "পুরষ্কার" সিদ্ধান্ত নেবে যে ক্রমটি সঠিক ছিল কি না। অনুকরণ লার্নিং ব্যবহার করে তারা একটি তাত্পর্যপূর্ণ শিখন সমস্যায় একটি ক্লাসিক পুনর্বহাল শেখার সমস্যাটিকে রূপান্তরিত করে, যাতে ত্রুটিটি পর্যবেক্ষণকারী ট্র্যাজেক্টোরির থেকে দূরত্ব থেকে গণনা করা হয়।

যেহেতু এটি কোনও তদারকি প্রশিক্ষণ সেটআপের ক্ষেত্রে, হাতের কাজটি সম্পূর্ণরূপে ক্ষতির ফাংশন দ্বারা সংজ্ঞায়িত করা হয়, যা উদ্দেশ্যপূর্ণ আচরণ থেকে এজেন্ট কতটা দূরে ছিল তা নির্ধারণ করা। এই ফাংশনটি সংজ্ঞায়িত করা প্রায়শই সমালোচনামূলক পদক্ষেপ, কারণ এটি নির্ধারণ করে যে কীভাবে অপ্টিমাইজেশন অ্যালগরিদমগুলি মডেলের পরামিতিগুলি আপডেট করে। এই অ্যালগরিদমগুলি গণনার সময়সীমার ক্ষেত্রে গুরুত্বপূর্ণ, এবং প্রায়শই কিছু সংশোধন করার প্রয়োজন হয়, যদি তা না হয়। প্রকৃতপক্ষে যে সমাধানগুলি খুব উচ্চ মাত্রায় ফাংশনকে হ্রাস করবে তা প্যারামিটার স্পেসের খুব ছোট শেলটিতে থাকে, যার মধ্যে একটি ছোট হাতুড়ি দূরত্ব রয়েছে, আপনি যখনই সেই ছোট ডোমেন থেকে দূরে সরে যাবেন তখনই সমাধানগুলির মধ্যে দূরত্ব দ্রুত বাড়বে। সেই বিষয় নিয়ে অন্যদের মধ্যে খুব আশ্চর্যজনক জেনিফার চয়েস খুব আকর্ষণীয় কাজ করেছেন, তিনি টকিং মেশিনের শেষ পর্বে খুব আকর্ষণীয় সাক্ষাত্কারে বিষয়টিকে ঝাঁকিয়েছেন।

নীতি নেটওয়ার্কগুলির প্রশিক্ষণের সময় (পুরো নেটওয়ার্কটি, কোন পদক্ষেপ নিতে হবে তা ইনপুট থেকে সিদ্ধান্ত নিতে সক্ষম) তারা প্রথমে সফল বিক্ষোভের ট্র্যাকটোরির প্রক্রিয়া করে। এই অংশের জন্য তারা দুটি পদ্ধতির সাথে তুলনা করবে, ক্লাসিক আচরণমূলক ক্লোনিং (তারা ব্যবহার করেছেন বাস্তবায়নের সম্পর্কে নিশ্চিতভাবে নিশ্চিত নয়) এবং ডাগার অ্যালগরিদমগুলি। এরপরে ক্রমাগত বা বিযুক্ত (ক্রমানুসারে ইভেন্টগুলি বিতরণের উপর ভিত্তি করে) ক্রিয়া-এনট্রপি ক্ষতি দ্বারা l2 বা ক্রস-এনট্রপি ক্ষতির মাধ্যমে ক্ষতির ক্রিয়াকে পুনরাবৃত্তি হ্রাস করার অনুমতি দেবে। সমস্ত পরীক্ষার জুড়ে, তারা 0.001 এর শিক্ষার হারের সাথে অপ্টিমাইজেশন সম্পাদন করতে অ্যাডাম্যাক্স অ্যালগরিদম ব্যবহার করেছে used

পদক্ষেপের আকারটি ছোট শুরু হয় এবং দ্রুত ক্ষয় হয়।

নিজেই অ্যালগরিদম স্থানান্তর করার অনুমতি দেয় না, আপনি কীভাবে আপনার প্রশিক্ষণ সেটটি তৈরি করেন এবং আপনার ক্ষতি ফাংশন যা স্থানান্তর করার অনুমতি দেয়।

কাজগুলিতে দুই ধরণের স্থানান্তর বিদ্যমান। প্রথম ধরণের বিষয়টিকে "বাস্তবের ব্যবধান পূরণ করা" হিসাবে উল্লেখ করা হয়, এটি প্রাকৃতিক উদ্দীপনা পরীক্ষা করার জন্য সিমুলেটেড ইনপুটগুলির প্রশিক্ষণের মধ্যে স্থানান্তর করার অনুমতি দেওয়ার ক্ষেত্রে শেখার একটি সাধারণীকরণ। সিমুলেশন ডেটা প্রায়শই বাস্তব জগতের একটি দরিদ্র অনুমান, খুব নিখুঁত, বাস্তব বস্তুর জটিলতার অভাবে। বাস্তব বিশ্বে ক্যামেরাটি ত্রুটিযুক্ত এবং কোলাহলপূর্ণ হতে পারে, মোটর নিয়ন্ত্রণ কম সুনির্দিষ্ট হবে, রঙ পরিবর্তন হবে, টেক্সচার আরও সমৃদ্ধ হবে ইত্যাদি। এই প্রথম স্থানান্তরটির জন্য তারা এমন একটি পদ্ধতি ব্যবহার করেন যা তারা "ডোমেন র্যান্ডমাইজেশন" হিসাবে উল্লেখ করেন : এটি ইনপুটগুলিতে শব্দ যোগ করেই যে নেটওয়ার্ক সাধারণ প্রাসঙ্গিক কাঠামোটি শিখতে পারে যা এটি সত্যিকারের বিশ্বে যথাযথভাবে সাধারণীকরণ করতে দেয়। তারা উদাহরণস্বরূপ প্রশিক্ষণের উদাহরণগুলির মধ্যে ক্যামেরার কোণ পরিবর্তন করবে, অঙ্গবিন্যাস পরিবর্তন করবে বা ট্রাজেক্টোরিগুলি কম নিখুঁত করে তুলবে। প্রশিক্ষণের সময় শব্দ যোগ করে আমরা দৃust়তা যোগ করি।

এখানে দ্বিতীয়বারের পরীক্ষা করা দ্বিতীয় স্থানান্তরটি হ'ল পূর্বে অপ্রকাশিত কনফিগারেশন এবং লক্ষ্যগুলির সেটগুলিতে একটি প্রাসঙ্গিক মোটর সিকোয়েন্স উত্পাদন করার দক্ষতা, যা অন্য এক প্রাথমিক কনফিগারেশন থেকে শুরু করে একইরকম চূড়ান্ত লক্ষ্য নিয়ে একক বিক্ষোভের উপর ভিত্তি করে। আবার এখানে ট্রান্সফার করা সম্ভব হবে যে আমরা কীভাবে প্রশিক্ষণ সেটটি নির্মাণ করব এবং ক্ষতি ফাংশনের মডেলটি করব। প্রশিক্ষণের সময় বিক্ষোভগুলি উপস্থাপন করে যা একই প্রাথমিক অবস্থার থেকে শুরু করে কোনও অনুরূপ লক্ষ্যে পৌঁছায় না, আপনি নেটওয়ার্ককে নিখুঁত অবস্থানগুলি ব্যবহার না করে লক্ষ্যটির একটি উচ্চ-স্তরের উপস্থাপনা এম্বেড করতে শিখতে পারবেন, পাশাপাশি উচ্চতর অর্ডার উপস্থাপনা মোটর ক্রম যা সাধারণ অনুকরণ নয়। নিষ্পাপ প্রাথমিক আর্কিটেকচার প্রশিক্ষণটিকে প্রাসঙ্গিক উপায়ে কাঠামো পরিবর্তন করতে সহায়তা করে এবং এই প্রশিক্ষিত কাঠামোটি চূড়ান্ত ফাংশনকে বোঝায়।

উদ্দেশ্য

ব্লক স্ট্যাকিং দৃষ্টান্তের জন্য তাদের বেশ কয়েকটি প্রতিবন্ধকতা ছিল তারা তাদের শিখন এজেন্টের সাথে দেখা করতে চেয়েছিল।

বিভিন্ন ধরণের ব্লক থাকা টাস্কের দৃষ্টান্তগুলিতে এটি প্রয়োগ করা সহজ হওয়া উচিত।
এটি স্বাভাবিকভাবে একই কাজের বিভিন্ন আদেশের সাধারণীকরণ করা উচিত। উদাহরণস্বরূপ, নীতিটি task dcba task টাস্কে ভাল সম্পাদন করা উচিত, এমনকি যদি এটি কেবলমাত্র task abcd task টাস্কে প্রশিক্ষিত হয়}
এটি চলক দৈর্ঘ্যের বিক্ষোভ সামঞ্জস্য করা উচিত।

এই কাজের জন্য তারা উত্তর চেয়েছিল এমন বেশ কয়েকটি প্রশ্ন ছিল।

পর্যাপ্ত ডেটা অফলাইনে সংগ্রহ করা যেতে পারে, এমন আচরণগত ক্লোনিংয়ের সাথে প্রশিক্ষণ কীভাবে ডাগিয়ারের সাথে তুলনা করে?
চূড়ান্ত কনফিগারেশনটিতে কার্য সম্পূর্ণরূপে নির্দিষ্ট করার জন্য পর্যাপ্ত তথ্য থাকা সত্ত্বেও কীভাবে পুরো বিক্ষোভের কন্ডিশনার চূড়ান্ত পছন্দসই কনফিগারেশনের অবস্থার সাথে তুলনা করে?
পুরো বিক্ষোভের কন্ডিশনার কীভাবে ট্র্যাজেক্টোরির একটি "স্ন্যাপশট" কন্ডিশনার সাথে তুলনা করে, যা ফ্রেমের একটি ছোট উপসাগর যা সর্বাধিক তথ্যবহুল
আমাদের কাঠামো প্রশিক্ষণের সময় এটি কখনও দেখা যায় নি এমন ধরণের কাজের সাফল্যের সাথে সাধারণ করতে পারে? (++)
পদ্ধতির বর্তমান সীমাবদ্ধতাগুলি কী কী?

স্থাপত্য

কণা পৌঁছন

এই প্রথম উদাহরণের জন্য তারা লং শর্ট টার্ম মেমরি (এলএসটিএম) নিউরাল নেটওয়ার্কগুলির উপর ভিত্তি করে তিনটি স্থাপত্যের তুলনা করেছে compared এই নেটওয়ার্কগুলির একটি বিবরণ মেমরি এবং মনোযোগ সম্পর্কে ভবিষ্যতের পোস্টে যাবে যা জ্ঞানীয় এবং গণনা বিজ্ঞান উভয়ই একেবারে আকর্ষণীয় বিষয়। সংক্ষেপে একটি এলএসটিএম প্রতিটি নতুন সময় পয়েন্টে নেটওয়ার্কের ইনপুট অংশ হিসাবে পূর্ববর্তী নেটওয়ার্ক আউটপুটগুলি (সময়ক্রমে) ফিড দেয়, অতীতের রাজ্যগুলির তথ্যকে বর্তমানকে অবহিত করার অনুমতি দেয় (সুতরাং স্বল্পমেয়াদী মেমরি নেটওয়ার্কগুলির নাম)। তারা সময়ের সিরিজ (আলেক্সা, সিরি ইত্যাদি) নিয়ে কাজ করে এমন অনেক অত্যাধুনিক প্রযুক্তির মূলে রয়েছে।

এখানে তারা এই তিনটি নির্দিষ্ট শর্ত ব্যবহার করে:

  1. সমতল এলএসটিএম: মোটর ক্রিয়াকলাপ তৈরি করবে এমন এক মাল্টিলেয়ার পার্সেপট্রনকে এটি খাওয়ানোর জন্য ট্রাজেক্টোরি এবং বর্তমান অবস্থা এম্বেড করতে শেখে
  2. LSTM মনোযোগ সহ: ট্র্যাজেক্টোরির ল্যান্ডমার্কগুলির উপরে একটি ভারী প্রতিনিধিত্ব করুন
  3. মনোযোগ সহ চূড়ান্ত অবস্থা: পূর্ববর্তী স্থাপত্যের মতো ল্যান্ডমার্কগুলির ওজন নির্ধারণের জন্য শুধুমাত্র চূড়ান্ত রাষ্ট্রের প্রশিক্ষণে ব্যবহার করুন

স্ট্যাকিং ব্লক করুন

যদিও নীতিগতভাবে, জেনেরিক নিউরাল নেটওয়ার্ক বিক্ষোভ এবং বর্তমান পর্যবেক্ষণ থেকে উপযুক্ত পদক্ষেপের জন্য ম্যাপিং শিখতে পারে, আমরা একটি উপযুক্ত আর্কিটেকচার ব্যবহার করা গুরুত্বপূর্ণ মনে করেছি। ব্লক স্ট্যাকিং শেখার জন্য আমাদের আর্কিটেকচার এই কাগজের অন্যতম প্রধান অবদান, এবং আমরা বিশ্বাস করি এটি ভবিষ্যতে আরও জটিল কাজগুলির এক-শট অনুকরণ শেখার জন্য আর্কিটেকচারের প্রতিনিধিত্বকারী।

মনোযোগ মডিউল

টাস্কটি শিখতে ব্যবহৃত নেটওয়ার্কগুলির কাঠামো বর্ণনা করতে নিবন্ধটি তুলনামূলকভাবে উচ্চ স্তরের রয়ে গেছে। আর্কিটেকচারের একটি মূল উপাদান হ'ল তাদের মনোযোগ মডিউল, তবে আমি বিশ্বাস করি যে এই বিষয়টির একটি প্রয়োজনীয় পোস্টের প্রয়োজনীয় প্রয়োজনীয়তার বিষয়ে বিশদ বিবরণ প্রয়োজন। টেকসই মনোযোগের জ্ঞানীয় বিজ্ঞান ধারণার সাথে সাদৃশ্য করে, মনোযোগ মডিউলগুলি স্থান এবং সময়ের বিভিন্ন সময় জুড়ে থাকা প্রাসঙ্গিক তথ্যগুলিকে রাখতে এবং ফোকাস করার জন্য ব্যবহৃত হয়। এটি একটি স্থির আকারের আউটপুট উত্পন্ন করে যা সময় এবং জায়গাতে প্রসারিত তথ্যের সামগ্রীর এম্বেডিং ধারণ করে। টপোলজির সাথে উপমা অনুসারে, গণিতের একটি শাখা যা আমি বিশ্বাস করি যে আমরা ভবিষ্যতে কীভাবে বিতরণ উপস্থাপনাগুলি বুঝতে পারি তা ব্যাপকভাবে জানাতে হবে, একটি মনোযোগ নেটওয়ার্ক তথ্য, একই বক্রতা, ভিন্ন আকারের একটি টপোলজিকাল আইসোমরফিজম সম্পাদন করে। মনে রাখবেন যে এই নেটওয়ার্কগুলি অপ্রত্যাশিত বা বিরল ঘটনাগুলিতে মনোনিবেশ করতে সক্ষম স্যালেন্সি ডিটেক্টরের ভূমিকা পালন করে না, যা নিউরোসায়েন্সের মনোযোগের ধারণার সাথে সম্পর্কিত একটি ফাংশন।

এখানে তারা দুটি ধরণের মনোযোগ নেটওয়ার্ক ব্যবহার করে: ক) একটি টেম্পোরাল মনোযোগ নেটওয়ার্ক যা মেমরির মধ্যে থাকা সামগ্রীতে (ক্যোরি, প্রসঙ্গ এবং মেমরি ভেক্টর) ওজন যোগ করে এবং খ) একটি প্রতিবেশী মনোযোগ নেটওয়ার্ক যা ব্লকের সাথে সম্পর্কিত তথ্য পুনরুদ্ধারে সক্ষম হয় এজেন্টের বর্তমান প্রশ্নের উপর নির্ভর করে অবস্থানগুলি।

টেম্পোরাল মনোযোগ নেটওয়ার্ক: সি: প্রসঙ্গ ভেক্টর, এম: মেমরি ভেক্টর, কিউ: ক্যোয়ারী ভেক্টর, ভি: শিখানো ভেক্টরের ওজন। আউটপুট মেমরি ভেক্টরের মতো একই আকারের। এটি সেই ভেক্টরের একটি লিনিয়ার সংমিশ্রণ যা কিছু মেমরি ভেক্টরকে প্রসঙ্গ এবং ক্যোয়ারি ভেক্টরগুলির উপর ভিত্তি করে আউটপুটটিতে আরও প্রভাব ফেলতে দেয়।এখানে একই ধারণা, স্থানিক তথ্যের মধ্যে প্রতিযোগিতা মনোযোগ ব্যবস্থা দ্বারা গতিশীলভাবে বজায় রাখা হয়।

পলিসি নেটওয়ার্ক

সম্পূর্ণ নেটওয়ার্কটি তিনটি পৃথক উপ-নেটওয়ার্ক নিয়ে গঠিত: বিক্ষোভের নেটওয়ার্ক, প্রসঙ্গ নেটওয়ার্ক এবং ম্যানিপুলেশন নেটওয়ার্ক।

বিক্ষোভের নেটওয়ার্ক ইনপুট হিসাবে একটি বিক্ষোভ ট্র্যাজেক্টরি গ্রহণ করে এবং নীতি দ্বারা ব্যবহৃত হতে পারে বিক্ষোভের এম্বেডিং উত্পাদন করে। এই এমবেডিংয়ের আকার বিক্ষোভের দৈর্ঘ্যের কার্যকারিতা হিসাবে এবং পরিবেশে ব্লকের সংখ্যা হিসাবে রৈখিকভাবে বৃদ্ধি পায়।

এখানে যেমন প্রদর্শিত হয়েছে বিক্ষোভ নেটওয়ার্কটি বিভিন্ন জটিলতা এবং আকারের একটি সাধারণ ফর্ম্যাটে প্রદર્શનকে এম্বেড করতে সক্ষম হয় যা প্রাসঙ্গিক নেটওয়ার্কের দ্বারা কার্যটি উপস্থাপনের জন্য ব্যবহৃত হবে। ইতিমধ্যে সম্ভবত এই স্তরেই জেনারালাইজেশন ঘটে থাকে, বিক্ষোভের সময় প্রদর্শিত ট্র্যাজেক্টোরি এবং ঘনক্ষেত্রের নিখুঁত অবস্থানগুলি সম্পর্কে প্রদর্শিত বামনটি এম্বেডিংয়ের উচিত leaving

প্রসঙ্গ নেটওয়ার্কের কাঠামোটির দিকে তাকানো, যদিও খুব উচ্চ-স্তরের থেকে, আমরা কেন্দ্রীয় টেম্পোরাল মনোযোগ মডিউলগুলিতে বিক্ষোভের এম্বেডিং খাওয়ানো বিক্ষোভের নেটওয়ার্কের সাথে ইন্টারফেসটি দেখি। আমরা আরও দেখতে পাই যে পূর্ববর্তী ক্রিয়াকলাপগুলি (এলএসটিএম) এবং বর্তমান অবস্থা মোটামুটি মোটর নেটওয়ার্কে প্রেরণে একটি বৈশ্বিক প্রেক্ষাপট এম্বেডিং উত্পন্ন করতে বিক্ষোভ এম্বেডিংয়ের সাথে সংযুক্ত করে ইনপুট হিসাবে খাওয়ানো হয়।

নেটওয়ার্ক ফাংশন সম্পর্কে তাদের বর্ণনাটি আমার মতে কাগজের সবচেয়ে গুরুত্বপূর্ণ অংশ:

প্রসঙ্গ নেটওয়ার্কটি একটি ক্যোয়ারী ভেক্টরকে বর্তমান অবস্থার একটি ফাংশন হিসাবে গণনা করে শুরু করা হয়, যা তারপরে প্রদর্শনী এম্বেডিংয়ের বিভিন্ন সময় পদক্ষেপগুলিতে অংশ নিতে ব্যবহৃত হয়। একই সময়ে পদক্ষেপের মধ্যে বিভিন্ন ব্লকের উপর মনোযোগ ওজন একসাথে সংক্ষিপ্ত করা হয়, সময় প্রতি পদক্ষেপে একক ওজন উত্পাদন করতে। এই সাময়িক মনোযোগের ফলাফলটি এমন ভেক্টর যার আকার পরিবেশের ব্লকের সংখ্যার সাথে সমানুপাতিক। তারপরে আমরা প্রতিটি ব্লকের এম্বেডিং জুড়ে তথ্য প্রচারের জন্য প্রতিবেশীর মনোযোগ প্রয়োগ করি। এই প্রক্রিয়াটি একাধিকবার পুনরাবৃত্তি হয়, যেখানে রাজ্যটি অপরিশোধিত ওজন সহ একটি এলএসটিএম সেল ব্যবহার করে উন্নত করা হয়।
পূর্ববর্তী ক্রিয়াকলাপগুলি এমন একটি এম্বেডিং তৈরি করে যার আকার বিক্ষোভের দৈর্ঘ্যের তুলনায় স্বতন্ত্র, তবে এখনও ব্লকের সংখ্যার উপর নির্ভর করে। তারপরে আমরা স্থির-মাত্রিক ভেক্টর উত্পাদন করতে স্ট্যান্ডার্ড নরম মনোযোগ প্রয়োগ করি, যেখানে মেমরির বিষয়বস্তু কেবল প্রতিটি ব্লকের অবস্থান নিয়ে থাকে, যা রোবটের রাজ্যের সাথে মিলিয়ে ম্যানিপুলেশন নেটওয়ার্কে প্রবেশ করা ইনপুট গঠন করে।
স্বজ্ঞাতভাবে, যদিও ম্যানিপুলেশন অপারেশনটির প্রতিটি পর্যায়ে পরিবেশে বস্তুর সংখ্যা পৃথক হতে পারে, প্রাসঙ্গিক বস্তুর সংখ্যা ছোট এবং সাধারণত স্থির থাকে। ব্লক স্ট্যাকিং পরিবেশের জন্য বিশেষভাবে, রোবটটিকে কেবলমাত্র (ব্লক উত্স) বাছাই করার চেষ্টা করছে এমন ব্লকের অবস্থানের দিকে মনোযোগ দেওয়া উচিত, পাশাপাশি এটি যে ব্লকটির অবস্থান শীর্ষে রাখার চেষ্টা করছে তার অবস্থানের দিকেও লক্ষ্য ব্লক)। অতএব, একটি সঠিকভাবে প্রশিক্ষিত নেটওয়ার্ক বিক্ষোভের সাথে সম্পর্কিত পর্যায়ে বর্তমান অবস্থার সাথে মিল রাখতে শিখতে পারে, এবং উত্সটি এবং টার্গেট ব্লকের বিভিন্ন পরিচয় এবং বিভিন্ন ব্লকের উপর নরম মনোযোগের ওজন হিসাবে প্রকাশিত শনাক্তকরণগুলি সনাক্ত করতে পারে, যা পরে সম্পর্কিত অবস্থানগুলি উত্তোলনের জন্য ব্যবহৃত হয় ম্যানিপুলেশন নেটওয়ার্কে পাস করা।

যেভাবে তারা তাদের বিবরণটি সমাপ্ত করেন এটি একটি বিশেষজ্ঞ সিস্টেম পদ্ধতির কাছ থেকে একটি লার্নিং সিস্টেমের পদ্ধতির কাছে এআই গবেষণার বর্তমান প্রবাহের একটি নিখুঁত উদাহরণ এবং এটি মস্তিষ্কের নীচে কীভাবে বিকশিত হয়েছিল তা প্রায় আলোচনার ইঙ্গিত দেয়।

যদিও আমরা প্রশিক্ষণে এই ব্যাখ্যাটি প্রয়োগ করি না, তবুও আমাদের পরীক্ষামূলক বিশ্লেষণটি শিখেছি নীতি কীভাবে অভ্যন্তরীণভাবে কাজ করে তার এই ব্যাখ্যাটিকে সমর্থন করে।

তারা জানেন না এটি কীভাবে কাজ করে! তারা একটি নির্দিষ্ট কাঠামো সম্পাদন করতে সক্ষম এমন কিছু কাঠামো তৈরি করতে সক্ষম করে এবং আমাদের কাছে একটি প্রাক-প্রিরি কার্যকর বলে মনে হয় এমন কিছু তথ্য সংরক্ষণের জন্য একটি কাঠামো তৈরি করে এবং এটিকে পুরো কাঠামোটি শিখবে আশা করে একটি প্রশিক্ষণ সেট সরবরাহ করে! সেখানে একধরনের কৃত্রিম গোয়েন্দা গবেষণা ভুডো বৃদ্ধি পাচ্ছে, একটি শিল্প, সঠিক দিক দিয়ে হিউরিস্টিক অনুসন্ধানকে পরিচালিত করার উপায়। এবং মনে হয় পুরো those যাদুকররা এখন ওপেনএআইএর জন্য কাজ করছেন।

তাদের নিজস্ব কথায় ম্যানিপুলেশন নেটওয়ার্কটি সহজতম কাঠামো, মাল্টি-লেয়ার পার্সেপট্রনকে খাওয়ানো প্রসঙ্গ থেকে শুরু করে মোটর অ্যাকশন তৈরি হয়।

ফলাফল

ফলাফলগুলি প্রায়শই এমন একটি অংশ যার জন্য আমার খুব আগ্রহ নেই, বিশেষত এই ধরণের চমকপ্রদ উজ্জ্বল প্রযুক্তিগত কাগজপত্রগুলির জন্য। আমি দ্রুত যাব, নীচের অংশে এই পদ্ধতির কাজ হচ্ছে, এটি হার্ড-কোডড বিশেষজ্ঞ নীতিগুলির অনুরূপ নির্ভুলতার সাথে সম্পাদন করে এবং সেই নির্দিষ্ট পদ্ধতিগত পদ্ধতির বিপরীতে, কার্যগুলির দুর্দান্ত অ্যারেটিতে সাধারণীকরণযোগ্য।

কণা পৌঁছন

ব্লক স্ট্যাকিং

এই পরীক্ষাগুলিতে তারা বিভিন্ন শর্তও পরীক্ষা করে। ডাগার ব্যবহার করে তারা প্রদর্শিত ট্র্যাজেক্টোরিটিকে নিম্নচালিত করে তিনটি পৃথক ইনপুট অবস্থার তুলনা করে: পূর্ণ ট্রাজেক্টরিজ, ট্র্যাজেক্টরির স্ন্যাপশট বা কেবল চূড়ান্ত অবস্থা ব্যবহার করে। তারা আচরণের ক্লোনিং অ্যালগরিদমকে প্রদর্শনের সম্পূর্ণ ট্রাজেক্টোরির সাথেও তুলনা করে।

কিউব আইডেন্টিটির উপরে সিস্টেমের সক্ষমতার একটি শক্ত প্রমাণ strong

আলোচনা

এই বিগত মাসগুলিতে ওপেনএআইয়ের দ্রুত গতির অগ্রযাত্রাগুলি পড়তে, আমি তাদের কাজ সম্পর্কে কথা বলতে এবং তাদের কাজগুলিতে আমি কী বিশ্বাস করি এবং আমার সামগ্রিকভাবে এআইয়ের ক্ষেত্রের অগ্রগতি সম্পর্কে কীভাবে আমার ভাবনা জানাতে আগ্রহী তা বোধ করি জৈবিক মস্তিষ্ক কাজ করে। বিশেষত এই ক্রমবর্ধমান ধারণাটি যে মানুষের মধ্যে আপাতদৃষ্টিতে ভাগ করা জ্ঞানীয় ক্রিয়াকলাপগুলি একটি ভাগ করা কাঠামোর কারণে এতটা নয় যা কোনও কাজ সম্পাদন করতে জানে তা কেবল পরিবর্তিত হয়, বরং এটি একই পরিবেশের সাথে মোকাবিলা করা অপেক্ষাকৃত অনুরূপ নিষ্পাপ কাঠামোর ফলস্বরূপ, অনুরূপ কাজ সম্পাদন করতে শিখুন। ফাংশনটি একটি কার্যবিহীন কাঠামোর ফলাফল যা কেবল পরিবেশের সাথে খাপ খাইয়ে নেওয়ার জন্য বেশ কয়েকটি পরামিতি ট্যুইক করে কেবল স্থানীয় পরিবেশের পরিবর্তে নির্দিষ্ট পরিবেশের কারণে একটি নির্দিষ্ট কাজ শিখতে সক্ষম a

কার্য বনাম কনফিগারেশন: একটি আপাতদৃষ্টিতে স্বেচ্ছাসেবী সংজ্ঞা

আমাকে অবশ্যই স্বীকার করতে হবে যে তারা কেন যেভাবে বিভিন্ন কাজ সম্পর্কে কথা বলতে পছন্দ করেছিল তা আমি বুঝতে পারি না। একে অপরের সাথে সম্পর্কিত ব্লকের অবস্থান প্রতিনিধিত্ব করে স্ট্রিংয়ের সেট হিসাবে ব্লক স্ট্যাকিং পরীক্ষায় একটি কার্য সংজ্ঞায়িত করা হয়, সেটের উপাদানগুলির সংখ্যা স্ট্যাকের সংখ্যা এবং অক্ষরের সংখ্যা নির্ধারণ করে যা ব্লকের সংখ্যা নির্ধারণ করে । স্ট্যাকের নিখুঁত অবস্থান নির্বিশেষে কোনও কাজ স্ট্যাকের ব্লকের ব্যবস্থা blocks

কিছু ব্লক টেবিলের উপরে থাকতে পারে তবে টাস্কের অংশ নয়

আপেক্ষিক অবস্থান এবং স্ট্যাকের সংখ্যা পৃথক কার্যের মানদণ্ড হিসাবে সংজ্ঞায়িত করার তাদের পছন্দটি স্বেচ্ছাচারিত বলে মনে হয়। প্রকৃতপক্ষে, ব্লকগুলির নিখুঁত প্রারম্ভিক অবস্থানের উপর ভিত্তি করে (তারা যা কনফিগারেশন হিসাবে উল্লেখ করে) বিভিন্ন কার্য সম্পর্কে কথা বলার অর্থও বুদ্ধিমান হতে পারে। আমি বিশ্বাস করি সমস্যার সাধারণ প্রকৃতি তাদের কাছে স্পষ্ট, তবে স্পষ্টতার উদ্দেশ্যে তারা বিশদে না যাওয়ার পছন্দ করেন। নীতি শিক্ষাকে দুই ধরণের জেনারালাইজেশন হিসাবে তারা পরবর্তীকালে কীভাবে ফ্রেম করে তা আরও বোধগম্য হয়:

নোট করুন যে সাধারণীকরণকে একাধিক স্তরে মূল্যায়ন করা হয়: শিখেছি নীতিটি কেবল নতুন কনফিগারেশন এবং ইতিমধ্যে দেখা কাজগুলির নতুন প্রদর্শনীতে সাধারণীকরণের প্রয়োজন নয়, তবে নতুন কার্যগুলিতে সাধারণীকরণেরও প্রয়োজন।

কেবলমাত্র "কার্যাদি" "স্ট্যাক অর্ডারিং" দ্বারা প্রতিস্থাপন করুন। টাস্কটি সঠিকভাবে শিখার অর্থ এই যে এজেন্ট কিউবসের অবস্থান (কনফিগারেশন) বিমূর্ত করতে সক্ষম এমন একটি এম্বেডিং শিখবে, তবে তাদের পরিচয় (টাস্ক), স্ট্যাকের সংখ্যা (টাস্ক) এবং বিক্ষোভের গতিপথ (সংক্ষেপে সংক্ষেপে পরিচয় করিয়ে দেওয়া) উদ্ধৃতি) একটি প্রাসঙ্গিক মোটর প্রতিক্রিয়া উত্পাদন করতে।

এই সাধারণীকরণগুলি পরস্পরবিরোধী বলে মনে হচ্ছে, কীভাবে একই নেটওয়ার্ক কিউবের প্রাথমিক কনফিগারেশন বা তাদের পরিচয় বিমূর্ত করতে পারে এবং মোটর প্রতিক্রিয়ার জন্য তাদের পরম অবস্থানটি পুনরুদ্ধার করতে পারে?

এটি শেখার সময় বিভিন্ন উপকারের সাবনেটওয়ার্কের প্রয়োজনীয়তার ব্যাখ্যা করে, বিভিন্ন ইনপুট গ্রহণ করে এবং এটি ব্যাখ্যা করে যে প্রসঙ্গে নেটওয়ার্কে টাস্কের একটি বিমূর্ত প্রতিনিধিত্ব নিম্নোক্ত আদেশের আগে কিউবস পরম পজিশনের মতো নিম্ন অর্ডার সংক্রান্ত তথ্য সরবরাহ করা হয়।

আপনি কাজ এবং কনফিগারেশনের এই পার্থক্যের বিষয়ে মন্তব্য করা নির্বোধ বলে মনে করতে পারেন, তবে এটি বোঝার প্রয়োজন যে এটি মূলত বিভিন্ন বিষয়গুলিতে খেলতে বিমূর্তির একই প্রক্রিয়া (এবং এটি নিম্নলিখিত বিভাগে খোলে)।

অদম্যতা ছাড়া কোন শিক্ষা নেই

ট্রান্সফার লার্নিং সম্ভবত জ্ঞানার্জনের সবচেয়ে আকর্ষণীয় ধারণা এটি ইন-সিলিকো বা ইন-ভিভো হোক না কেন এটি এআই গবেষক এবং নিউরোসাইটিস্ট উভয়েরই জন্য অত্যন্ত উত্তপ্ত বিষয় এবং এটি আমার পিএইচডি থিসিসের বিষয় হতে পারে। নোট করুন যে মেশিন-লার্নিংয়ের আগে অনেক ক্ষেত্রে ঘনিষ্ঠভাবে সম্পর্কিত ধারণাগুলি অনুসন্ধান করা হয়েছে এবং এই বিমূর্ত এবং সর্বদা আংশিকভাবে সংজ্ঞায়িত ধারণার অনেক নাম রয়েছে names দার্শনিক, নৃতাত্ত্বিক এবং সমাজবিজ্ঞানীরা এটিকে (পোস্ট-) স্ট্রাকচারালিজম (ক্লড লেভি-স্ট্রস, মিশেল ফোকল্ট) হিসাবে উল্লেখ করতে পারেন, ভাষাতত্ত্ববিদ সিনট্যাগমা এবং নেস্টেড ট্রি স্ট্রাকচার (নোয়াম চমস্কি) সম্পর্কে কথা বলবেন, গণিতবিদরা সম্ভবত হোমিওমর্ফিিজম বা ইনগ্রায়েন্টস এবং শিক্ষার কথা ভাবেন গবেষক বা স্নায়ুবিজ্ঞানীরা এটিকে স্ট্রাকচারাল লার্নিং হিসাবে উল্লেখ করতে পারেন। আপনি মেশিন লার্নিংয়ের ক্ষেত্রে প্রতিনিধিত্ব শেখার এবং মেটা-লার্নিংয়ের মতো সম্পর্কিত ধারণাটি দেখতে পাবেন যা লেখকের উপর নির্ভর করে ট্রান্সফার লার্নিং বা ট্রান্সফার লার্নিং সঞ্চালনের জন্য ব্যবহৃত শেখার দৃষ্টান্ত বোঝাতে পারে। ডিপ নিউরাল নেটওয়ার্কগুলি সম্পর্কে কথা বলার সময় এই পার্থক্যগুলি ঝাপসা হয়ে যায়, যেমন সংক্ষেপে একটি নিউরাল নেট সাধারণত একটি গোলমাল পরিবেশে কোনও কাঠামো (মেটা-লার্নিং) সংশোধন করে একটি নির্দিষ্ট সমস্যা (উপস্থাপনা শেখা) এম্বেড করতে শিখছে যা ট্রান্সফার শেখার এক প্রকারকে বোঝায়।

এআই গবেষক এবং জ্ঞানীয় বিজ্ঞানী প্রায়শই স্থানান্তর শিক্ষার একটি খুব সংক্ষিপ্ত সংজ্ঞা রাখেন, এটি এমন একটি প্রক্রিয়া যা একটি সিস্টেমকে একটি নির্দিষ্ট কার্যে অর্জিত জ্ঞানকে একটি সাধারণ রচনা কাঠামো ভাগ করে দেওয়ার জন্য অন্য কার্য সম্পাদন করার অনুমতি দেয় (নিবন্ধে বর্ণিত হিসাবে)। জ্ঞানীয় বিজ্ঞানের কাছে দুটি কার্য কীভাবে পৃথক বলে মনে হচ্ছে তার উপর নির্ভর করে কাছাকাছি এবং দূরবর্তী স্থানান্তর সম্পর্কে এই ধারণা রয়েছে। তবে আরও বিমূর্ত দৃষ্টিকোণ থেকে, একটি কোলাহলপূর্ণ এবং জটিল পরিবেশে, সমস্ত শিক্ষাই হস্তান্তর শিখনের একটি রূপ এবং খুব কাছের এবং খুব দূরের স্থানান্তরের মধ্যে পার্থক্য কেবল ভাগ করা তথ্যের বিষয় - আবার প্রকৃতির নয় scale

নিয়ন্ত্রিত পরিবেশে বাস্তবের কঠোর কোডিং ডিসক্রিটাইজেশন নির্মাণের চেষ্টা আগেই করা হয়, তবে বাস্তবে এই বিচক্ষণতা ট্রান্সফার লার্নিং প্রক্রিয়াগতভাবে পুনরুত্পাদন করে, এটি একটি সাধারণ ঘের কাঠামোর অধীনে বাস্তবে পাওয়া অসীম রাজ্যের একত্রিত করে। সংক্ষেপে ট্রান্সফার লার্নিং বলতে সরাসরি বা প্রসারণ দ্বারা প্রক্রিয়াটিকে বোঝায় যে মাধ্যমে শিখন এজেন্টরা বিশ্বের মডেলগুলি তৈরিতে আক্রমণকারীদের ব্যবহার করে। এটি এমন একটি প্রক্রিয়া যা সমানতা, পুনরাবৃত্তি এবং এর বিভিন্নতা ব্যবহার করে ক্রমবর্ধমান বিমূর্ত এবং রচিত উপস্থাপনা তৈরি করে যা ইনপুট দ্বারা বিবিধ স্প্যানের উপরে নকশাগুলি গঠন করবে। সাধারণ অর্থে এটি বুনিয়াদি ক্রিয়াকলাপ তৈরি করতে দেয় যার মাধ্যমে আমরা তথ্য গোষ্ঠীগুলিতে হেরফের করি, অনেকটা গণিতের মতো এটি ইউনিয়ন এবং ছেদ করার জন্য অনুমতি দেয়। এটি সনাক্তকরণের অনুমতি দেয়, এটি আমাদের অবজেক্টগুলিকে শ্রেণীবদ্ধ করার ক্ষমতা ব্যাখ্যা করে। জোশ তেনেমবাম একটি উদাহরণ দিয়েছেন যা সত্যিই আমার সাথে কথা বলেছিল: কল্পনা করুন যে আপনি দু'বছরের বাচ্চাকে প্রথমবার ঘোড়া চিনতে শেখাচ্ছেন, আপনি তাকে বিভিন্ন ঘোড়ার কয়েক জোড়া ছবি দেখান এবং তারপরে আপনি তাকে অন্য ঘোড়ার ছবি দেখান এবং একটি বাড়ির ছবি এবং তাকে জিজ্ঞাসা করুন যে কোনটি ঘোড়া। একটি শিশু এই কাজটি খুব সহজেই করবে তবে এটি এখনও এমন কিছু যা কম্পিউটার খুব কম ইনপুট (ওয়ান শট লার্নিং) দিয়ে ভাল করতে পারে না।

শিশুটি কীভাবে এটি করেছে?

শিশুদের মধ্যে পশুর স্বীকৃতি অধ্যয়ন করা হয়েছে এবং প্রাসঙ্গিক অংশগুলিতে বিষয়বস্তুগুলি ডিকনস্ট্রাক্ট করার দক্ষতার সাথে সম্পর্কিত, পশমের বর্ণের পরিসর, ঘাড়ের আকার, সামগ্রিক আকার ইত্যাদি This এই ক্ষমতাটি আপনাকে একটি দরজা খোলার অনুমতিও দেয় is এর আগে কখনও দেখেনি, আপনি একটি মোটর সিকোয়েন্স শিখেছেন যা কোনও পরিস্থিতিতে (ডোমেন জেনারালাইজেশন) সাধারণীকরণ করে। আপনি বিশ্বকে সহজ করার জন্য ব্যাখ্যামূলক মডেল তৈরি করতে যা ব্যবহার করেন তা হ'ল, আপনি সম্ভবত বিখ্যাত সুইস ঘড়িতে কোকিলের আকস্মিক প্রয়োগ দ্বারা আশ্চর্য হয়ে যেতে পারেন, তবে দ্বিতীয় উপস্থিতির পরে আপনি এটি প্রত্যাশা করবেন। অদম্যতা সন্ধান করা হ'ল কীভাবে একটি নিউরাল নেটওয়ার্ক শিখতে হয় এবং সেই মডেলগুলি অজ্ঞান করে তৈরি করা হয়। একটি উদাহরণ হ'ল আমরা কীভাবে গণিত এবং সংখ্যা শোনার আগেই পদার্থবিজ্ঞান সম্পর্কে স্বজ্ঞাতভাবে শিখি।

কেউ উদাহরণস্বরূপ জিজ্ঞাসা করতে পারেন যে মাইক্রোগ্রাভিতে জন্মানো একটি শিশু পৃথিবীর মাধ্যাকর্ষণের সাথে খাপ খাইয়ে নেবে এবং স্বজ্ঞাতভাবে শিখবে যে বস্তুগুলি নামানোর সময় মাটিতে পড়ে যাবে?

আমরা অনুমান করতে পারি যে শিশু এবং বেশিরভাগ প্রাণী অজ্ঞান হয়ে তাদের মডেলটি সংশোধন করবে, যেমন আপনি যখন কুকুরের পাতে মোজা রাখেন এবং নতুন তথ্যের সাথে খাপ খাইয়ে নিতে কিছুটা সময় লাগে।

তবে একটি ছোট বাচ্চার জন্য ভাষা, চিহ্ন এবং বিশ্বাসের মাধ্যমে কৌতূহল থেকে, তার স্বজ্ঞাত মডেলটির একটি সচেতন জিজ্ঞাসাবাদ এবং সংশোধন ঘটবে। আমাদের মডেলগুলি সচেতনভাবে জিজ্ঞাসাবাদ এবং পরিবর্তন করার আমাদের ক্ষমতা মনোমুগ্ধকর এবং একদিকে যেমন, মানুষই কেবল প্রক্রিয়াটি ভার্বালাইজ করতে সক্ষম এমন এক প্রজাতি হতে পারে তবে অন্যান্য প্রজাতিও একই রকম সচেতন সংশোধন করতে পারে।

আগ্রাসন হ'ল সময়ের বাধ্যবাধকতা, যদি সবকিছু সর্বদা নতুন ছিল এবং কোনও উপায়েই অনুমানযোগ্য না হত, তবে এখনও এই অনন্য অদলীয় রয়ে যাবে যে সবকিছু সর্বদা নতুন এবং অনির্দেশ্য। অদম্যতা ছাড়াই একটি পৃথিবী কল্পনা করা অসম্ভব, যেহেতু এখানে উল্লেখ করার মতো কোনও বিশ্ব থাকতে পারে না, অদম্য জীবন ছাড়া অসম্ভব এবং আমাদের মস্তিষ্ক অকেজো হয়ে যায়। জীবন এমন একটি মেশিন যা কেবলমাত্র ঘটনাদের অনুমানযোগ্য পুনরাবৃত্তি, কারণ এবং প্রভাবগুলির পুনরাবৃত্তি দ্বারা জীবের মধ্যে চক্রীয় পুনরায় প্রবর্তন দ্বারা কাজ করে। এবং সেই প্রয়োজনীয় চক্রগুলির ব্যবহারের উন্নতির জন্য জীবন অনুসন্ধানে, আমাদের মস্তিষ্কই চূড়ান্ত হাতিয়ার। এটি একটি পূর্বাভাস মেশিন, একটি অভিযোজিত অঙ্গ যা গতিময় পুনরাবৃত্তি খুঁজে পেতে এবং এটি বিশ্বের সাথে আরও ভাল যোগাযোগের জন্য ব্যবহার করতে সক্ষম।

জীবনটি বেছে নেওয়া এই পদ্ধতিটি কাঠামোর সামান্য পরিবর্তনের পক্ষে অত্যন্ত মজবুত। যা একইরকম রয়ে গেছে তা বিশ্ব, পরিবেশের পরিসংখ্যানগত বৈশিষ্ট্য, তবে এটির মুখোমুখি হওয়া নিউরাল স্ট্রাকচার ততক্ষণ পরিবর্তিত হতে পারে যতক্ষণ না এটি চিকিত্সার জন্য বিকশিত প্রাসঙ্গিক তথ্য এম্বেড করতে পারে। এটি ব্যাখ্যা করে যে আমাদের মস্তিস্ক পৃথক থেকে পৃথক পৃথক এমনকি প্রাথমিক আদালতগুলিতেও এত আলাদা হতে পারে এবং তবুও একই ক্রিয়াকলাপ ভাগ করে নিতে পারে।

নার্ভাস সিস্টেমগুলি অভিযোজিত, প্রাসঙ্গিক উপায়ে আচরণের পরিবর্তন করতে তাদের বিবর্তন এবং ধীর জিনগত পরিবর্তনগুলির প্রয়োজন হয় না ations একটি সাধারণ স্নায়ুতন্ত্র, যেমন সি এলিগেন্সে পাওয়া যায়, একটি সহজাত অভ্যন্তরীণ সমন্বয়কারী এবং বাহ্যিক সংবেদক হিসাবে কাজ করে: খাদ্য বোঝা এবং এটির দিকে এগিয়ে যাওয়া, ব্যথা থেকে পালানো, পুনরুত্পাদন করা। সম্ভাব্য রাজ্যগুলির একটি ছোট সংখ্যায় (বামদিকে খাবার, নীচে তাপ ইত্যাদি) এটিকে বিবেচনা করার জন্য এই সাধারণ সিস্টেমগুলি প্রাথমিকভাবে কঠোর ছিল এবং আমাদের অত্যন্ত শোরগোলের বিশ্বের চূড়ান্ত অনুমানের কাজ করছিল। আমাদের মোটর এবং সংবেদী ক্ষমতাগুলি আমাদের স্নায়ুতন্ত্রের ভবিষ্যদ্বাণীমূলক ক্ষমতাগুলির সাথে এক সাথে বিবর্তিত হয়েছিল। আমাদের সেন্সরগুলি আরও সুনির্দিষ্ট হওয়ার সাথে সাথে স্নায়ুতন্ত্র ধীরে ধীরে তথ্য সঞ্চয় করতে এবং অভিজ্ঞতা থেকে শিখতে তার কাঠামোটি পরিবর্তন করতে সক্ষম হয়। প্রাথমিকভাবে এটি নির্দিষ্ট ধরণের গন্ধ বা হালকা ধরণের ধরণের ইনপুটগুলি সনাক্ত করতে শিখতে সক্ষম হয়েছিল এবং ক্রমবর্ধমান জটিল মোটর সিস্টেমটি নিয়ন্ত্রণ করতে ট্রায়াল এবং ত্রুটির মাধ্যমে শিখতে সক্ষম হয়। নোট করুন যে বিশ্বটি এত জটিল যে আমাদের মস্তিষ্ক স্বাভাবিকভাবেই জন্মগত পদ্ধতিগত পদ্ধতির পরিবর্তে একটি শেখার দৃষ্টান্তের দিকে বিকশিত হয়েছিল। গুণগতভাবে এটি নিখুঁতভাবে বোঝায়, গো-এর একটি সাধারণ খেলায় মহাবিশ্বে পরমাণুর সংখ্যা (10⁸⁰) এর চেয়ে অনেক বেশি বড় একটি রাষ্ট্র-স্থান রয়েছে (10⁸⁰), এবং জীবগুলি যতটা সম্ভব সমস্ত জটিল কোড-অনুমানের চেষ্টা করতে আরও জটিল হয়ে উঠেছে as সংযুক্তি বিস্ফোরণের কারণে এটি দ্রুত অচল হয়ে যেতে পারে বলে জানিয়েছে।

কিছু লোক বিশ্বাস করতে পারে যে আমাদের মস্তিষ্ক এমনভাবে নির্মিত হয়েছে যাতে এটি জন্মগতভাবে স্থানটি উত্থিত করে তার প্রতিনিধিত্ব করে, ডিএনএতে কোথাও কোথাও এমন একটি জিন থাকে যা মুখ গঠন করে, বা শব্দ তরঙ্গের অস্থায়ী সংগঠন যা তৈরি করে আপ শব্দ। তারা বিশ্বাস করতে পারে যে এই সহজাত জ্ঞান কোথাও কোথাও জন্মের সময় এনকোডড। অন্যরা বিশ্বাস করতে পারে, আমার দর্শনের শিক্ষকের মতো আমি যখন হাইস্কুলে ছিলাম, তখন সেই অস্তিত্বের সংক্ষিপ্তসার ঘটেছিল এবং আমাদের মস্তিষ্কটি জীব এবং জগতের মুখোমুখি হয়ে সম্পূর্ণ এবং সম্পূর্ণরূপে সংজ্ঞায়িত হয়। বাস্তবতা অবশ্যই আরও জটিল, এবং এখনও অবধি অধ্যয়ন করা বেশিরভাগ টেনিস্লাফিক্যাল সিস্টেমের জন্য, মস্তিষ্ক সহজাতভাবে যে ক্রিয়াটি সম্পাদন করবে তা এনকোড করে না তবে তার ইনপুটগুলিতে থাকা তথ্যের উপর নির্ভর করে এটি শিখবে। যদি প্রাসঙ্গিক তথ্যে ইনপুটটি খুব দুর্বল হয় তবে সেই কাঠামোটিতে শিখার সক্ষমতাটির মেয়াদ শেষ হওয়ার তারিখ থাকতে পারে (যেমন অ্যাম্বলিওপিয়া)। তবে যদি সহজাত কাঠামো চূড়ান্ত ফাংশনটি এনকোড না করে তবে মস্তিষ্কের একটি নির্দিষ্ট কাঠামো থাকে। এই কাঠামোটি ব্যক্তিদের মধ্যে সংরক্ষণ করা হয় এবং একই প্রজাতির ব্যক্তিরা সাধারণ ফাংশন এবং ড্রাইভ ভাগ করে। ডিএনএ স্থানে একটি নির্দিষ্ট কাঠামো স্থাপন করে, একটি কাঠামো তাদের চূড়ান্ত ফাংশন সহজাতভাবে সম্পাদন করতে সক্ষম হয় না তবে পৃথক অভিজ্ঞতার ভিত্তিতে নির্দিষ্ট কাজগুলির জটিলতা শিখতে সক্ষম একটি কাঠামো। অবাক হওয়ার মতো বিষয় নয় যে বিবর্তন একটি অত্যন্ত কার্যকর রক্ত-মস্তিষ্কের বাধা রক্ষা করে মস্তিষ্ককে শরীরের অন্যান্য অংশ থেকে মেনিনেজ এবং শক্ত হাড়ের খোলকে বাইরের বিশ্ব থেকে রক্ষা করে, কারণ অন্যান্য অঙ্গগুলির মতো নয় জিনোমে কাঠামোটি এনকোড করা হয়, প্রশিক্ষিত মস্তিষ্কের গঠনটি জন্মগতভাবে সঞ্চিত মডেল থেকে পুনরায় জেনারেট করা যায় না। আকর্ষণীয় বিষয়টি হ'ল আমরা ক্রমবর্ধমান জটিল কার্য সম্পাদনকারী জটিল গভীর নেটওয়ার্কগুলির বিকাশের মাধ্যমে সাদৃশ্য দ্বারা উদ্ভূত একই শিক্ষার ব্যবস্থাগুলি দেখি।

কাঠামোগত কাঠামো দেখতে শক্ত কিন্তু সর্বত্র

সাইডেনোট হিসাবে এটি আশ্চর্যের বিষয় যে এমনকি লেখকরাও বুঝতে পারেন না যে তাদের লক্ষ্যে পৌঁছানোর প্রথম কাজটির একটি গঠনমূলক কাঠামো রয়েছে।

কণা পৌঁছানোর কাজগুলি সরল পরিস্থিতিতে দৃ general়তার সাথে সাধারণীকরণের চ্যালেঞ্জগুলি সুন্দরভাবে প্রদর্শন করে। তবে, কার্যগুলি একটি রচনা কাঠামো ভাগ করে না, জেনারালাইজেশনকে মূল্যায়ন করে নতুন কার্যকে চ্যালেঞ্জিং করে।

যদিও স্ট্রাকিংটি ব্লক স্ট্যাকিংয়ের তুলনায় প্রকৃতপক্ষে নিম্ন স্তরের এবং পরীক্ষামূলক হেরফেরের জন্য সহজেই অ্যাক্সেসযোগ্য নয়, কার্যটি কার্যত একটি ভাগ করে নেওয়া কাঠামোর সমন্বিত। বিমানটিকে বিশ্বের অনুমান করে, একটি গঠনমূলক কাঠামো হ'ল যে ঘনক পরিচয় (রঙ) অনুবাদ সহ সংরক্ষণ করা হয় এবং ব্লক এ-থেকে একটি এলোমেলো অবস্থান শুরু হয় - অবস্থানের (এক্সএ 1, ইএ 1) বি অবস্থানে বি ব্লক করতে (Xb1, Yb2) ) অবস্থান এ ব্লক এ থেকে অবস্থানের (এক্সএ 2, ইয়া 2) বি অবস্থানের (এক্সবি 2, ওয়াইবি 2) যাওয়ার চেয়ে একই উচ্চতর অর্ডার রচনা কাঠামোর অংশ।

নেটওয়ার্কগুলির মধ্যে ইন্টারফেস

বিমূর্ততার বিভিন্ন স্তরে ইনপুটগুলি চিকিত্সা করতে সক্ষম নিউরাল নেটওয়ার্কগুলির এজেন্সির জন্য ইন্টারফেসের প্রয়োজন হবে, এমন একটি ডোমেন যা আমি বিশ্বাস করি যে এটি আবিষ্কার করতে অনেক বাম উপস্থাপিত। এই ইন্টারফেসগুলি অসংখ্য প্রকৃতির হতে পারে। এগুলি উদাহরণস্বরূপ দুটি নেটওয়ার্কের মধ্যে একটি সাধারণ ভাষা হিসাবে দেখা যেতে পারে, যেমন নিবন্ধে প্রদর্শিত হয়েছে, একটি মনোনিবেশ সিস্টেম (বিক্ষোভের নেটওয়ার্ক) দিয়ে সজ্জিত একটি নিম্ন স্তরের নেটওয়ার্ক একটি উপস্থাপনায় একটি প্রদর্শনের অনুবাদ করতে পারে অন্য নেটওয়ার্ক (প্রসঙ্গ নেটওয়ার্ক) ব্যবহার করতে পারে বিক্ষোভের দৈর্ঘ্য বা প্রাথমিক কনফিগারেশন যাই হোক না কেন সরাসরি ক্রিয়া করতে।

এই ভাষার পৃষ্ঠতলটি এখানে একটি বিমান, আকারে স্থির, তবে যে কোনও সম্ভাব্য পরিবর্তনগুলি যা নেটওয়ার্কের মধ্যে যোগাযোগের উন্নতি করতে পারে তা কল্পনা করতে পারে। উদাহরণস্বরূপ, শিখার সময় নেটওয়ার্কগুলি ইন্টারঅ্যাক্ট করার কারণে পৃষ্ঠের আকারটি গতিবেগভাবে বৃদ্ধি বা সঙ্কুচিত করতে সেট করা যেতে পারে, সুতরাং ভাষার জটিলতা সংকুচিত বা প্রসারিত করে। উদাহরণস্বরূপ প্রতিক্রিয়ার মাধ্যমে আমরা আরও গতিশীল ইন্টারঅ্যাকশন কল্পনা করতে পারি। আমরা সুবিধার্থী নেটওয়ার্কগুলির অস্তিত্ব কল্পনা করতে পারি যা নেটওয়ার্কগুলির মধ্যে যোগাযোগ সহজতর করতে শিখবে, সমান্তরাল নেটওয়ার্ক হিসাবে বিদ্যমান যা দ্বিতীয় নেটওয়ার্কের ইনপুট এবং আউটপুটের উপর ভিত্তি করে প্রথম নেটওয়ার্কের ইনপুটকে মডিউল করতে শিখবে। আমরা জটিল প্রসঙ্গ নেটওয়ার্কগুলি কল্পনা করতে পারি যা একাধিক আরও বিশেষায়িত নেটওয়ার্কগুলিতে টোনিক (ধীরে ধীরে পরিবর্তিত) আগমন হিসাবে কাজ করে ... ভবিষ্যতের গবেষণার আকর্ষণীয় অঞ্চল!

ব্যর্থতার ক্ষেত্রে নতুন মডিউলগুলির সম্ভাব্য ভূমিকা সম্পর্কে ইঙ্গিত দেওয়া হয়

এটি লক্ষণীয় যে ত্রুটিগুলি প্রায়শই মোটর ত্রুটির কারণে ঘটে থাকে এবং কাজের জটিলতার সাথে ভুলের সংখ্যা বৃদ্ধি পায়।

কেবল টার্গেটের সংখ্যা বাড়িয়ে মোটর ফাংশনটি খারাপ হওয়া উচিত নয়, এটি দৃ strong় প্রমাণ যে প্রজনন নেটওয়ার্কটি মোটর নেটওয়ার্কের সাথে কথা বলতে শিখেছে তা খুব বিমূর্ত। এটি আশ্চর্যজনক কারণ তারা বলেছে যে তাদের পরীক্ষাটি দেখায় যে প্রসঙ্গ নেটওয়ার্ক এবং মোটর নেটওয়ার্কের মধ্যে ইন্টারফেস তুলনামূলকভাবে কংক্রিট (রোবটের অবস্থান, লক্ষ্যটির অবস্থান)।

সম্ভাব্য সমাধান হতে পারে, যেহেতু এটি একটি মডুলার আর্কিটেকচার, বিভিন্ন ক্ষতির ফাংশন ব্যবহার করা বা প্রতিটি কাজের একটি নির্দিষ্ট দিককে উপস্থাপনকারী মডুলার লস ফাংশন। বিক্ষোভের বীমা করার জন্য এটি মস্তিষ্কের প্রাক মোটর অঞ্চলের সমতুল্য দ্বারাও সহায়তা করা হবে এবং মোটর কমান্ডের অবনতি না করে প্রসঙ্গ নেটওয়ার্ক বিমূর্ত থাকতে পারে। সেরা মোটর কমান্ড নির্বাচন করার জন্য প্রমোটর অঞ্চলগুলি লক্ষ্য (অ্যাবস্ট্রাক্ট নেটওয়ার্কগুলি থেকে) এবং সংবেদক ইনপুটগুলির উপর ভিত্তি করে অবজেক্টগুলিকে আরও ভাল স্থানীয়করণ করা প্রয়োজন। দেখে মনে হচ্ছে প্রসঙ্গ নেটওয়ার্ক উভয়ই একটি বর্ধিত স্তরের এমবেডিংয়ে বিক্ষোভ স্থানান্তর করার চেষ্টা করছে এবং বর্তমান প্রসঙ্গে একই সময়ে মোটর ক্রিয়াকলাপটি প্রস্তুত করার চেষ্টা করছে। মোটর সিস্টেমের সাথে লক্ষ্য লক্ষ্য ও অভিযোজিত পদ্ধতিতে যোগাযোগ করা শিখাই একটি প্রি মোটর নেটওয়ার্কের ভূমিকা ছিল, মোটর লার্নিং এবং দ্রুত অভিযোজনের জন্য প্রিমোটরের কাজগুলি এবং সেরিবেলাম উভয়কেই একত্রিত করে।

মোরাভেকের প্যারাডক্স একটি আকর্ষণীয় তত্ত্ব রয়েছে যা পূর্বাভাস দেয় যে এটি উচ্চতর স্তরের জ্ঞান হবে না যা গুণগতভাবে কর দেওয়া হবে তবে সংবেদক ইনপুট এবং মোটর সিস্টেমের ফলাফলগুলি চিকিত্সা করবে। মোটামুটি কার্যকরভাবে নিয়ন্ত্রণের জন্য এটি আমাদের সেরিবেলামে উপস্থিত মস্ত নিউরনগুলির (আমাদের মস্তিষ্কের অন্যান্য অংশের চেয়ে বেশি) প্রকৃতপক্ষে কার্যকর হতে পারে। এই প্যারাডক্সটি এমন এক সময়ে (80 এর দশকে) তৈরি করা হয়েছিল যখন আমরা এখনও বিশ্বাস করি যে আমরা অনিয়ন্ত্রিত কোলাহলপূর্ণ পরিবেশে জটিল কাজ সম্পাদনের জন্য আমাদের নিজস্ব জ্ঞানকে কোনও মেশিনে এম্বেড করতে পারি। অবশ্যই এই প্যারাডক্সটি বোঝা যায় যদি কোনওভাবেই মেশিন বিশ্বকে একটি বিচক্ষণ রাষ্ট্রের মধ্যে প্রতিনিধিত্ব করতে সক্ষম হয়, এটির উপর উচ্চ স্তরের ফাংশন তৈরি করা সহজ হবে। তবে আমি বিশ্বাস করি যে উভয়ই চূড়ান্তভাবে কর আদায় হিসাবে প্রমাণিত হবে এবং নেটওয়ার্কগুলির মধ্যে ইন্টারফেসে অভ্যন্তরীণ উপস্থাপনাটি আমাদের নিজস্ব সচেতন প্রতিনিধিত্বের মতো কিছু থেকে দূরে থাকবে।

উপসংহার

সমস্যার সুনির্দিষ্ট চিকিত্সার দায়িত্বে থাকা প্রত্যেককে বিভিন্ন স্নায়বিক নেটওয়ার্ক একত্রিত করে এই নিবন্ধটি দেখায় যে অন্তর্নিহিতভাবে সাধারণীকরণের প্রয়োজন এমন একটি কাজ তৈরি করে এবং ডোমেন র্যান্ডমাইজেশনের মাধ্যমে উপযুক্ত শিক্ষার পরিবেশ তৈরি করে, একটি স্মৃতি এবং অ্যাক্সেস সহ একটি নিউরাল নেটওয়ার্ক মনোযোগ ব্যবস্থা সহজ প্রজননের বাইরে সাধারণকরণ শিখতে পারে। এটি একটি উচ্চতর অর্ডার লক্ষ্যটি আবিষ্কার করতে শিখতে পারে যা কেবল একবার তথ্যের চাক্ষুষ প্রবাহে প্রদর্শিত হয়েছিল এবং ভিন্ন লক্ষ্যে সেই লক্ষ্যের পুনরুত্পাদন করতে সক্ষম যথাযথ ক্রিয়াগুলি পুনরুদ্ধার করতে একটি সাধারণীকৃত জায়গায় গণনা সম্পাদন করে।

ভবিষ্যতে আমরা সেই পারমাণবিক বিল্ডিং ব্লকগুলির উপর নির্মিত কাঠামোগুলির ক্রমবর্ধমান জটিলতা দেখতে পাব জটিল কাজগুলিকে সাধারণীকরণ করতে শিখতে সক্ষম হয়েছি তবে আরও গুরুত্বপূর্ণভাবে এই জাতীয় বেশ কয়েকটি কার্য সম্পাদন করা হয়েছে, নতুন পরিবেশে, ইনপুটগুলি প্রিপ্রোসেসিংয়ের মতো হার্ড কোডেড পদ্ধতির উপর কম নির্ভরতার সাথে or মেমরি স্টোরেজ মেমরি স্টোরেজটি একটি মেমরি নেটওয়ার্ক জুড়ে বিতরণ করা উপস্থাপনাগুলি দ্বারা প্রতিস্থাপিত হবে, রিয়েল টাইম মনোযোগী নেটওয়ার্কগুলিতে চক্রীয় ক্রিয়াকলাপ দ্বারা মনোযোগী সিস্টেমগুলি প্রতিস্থাপন করা হবে। প্রশ্নটি রয়ে গেছে যে আমরা কীভাবে একটি শক্তিশালী সিরিয়াল প্রযুক্তি (ট্যুরিং মেশিনগুলি) মূর্ত পদ্ধতিতে বিতরণ করা কম্পিউটিংয়ের উপর আমাদের বর্ধিত নির্ভরতার সাথে মানিয়ে নিতে সক্ষম হব।