یادگیری مفهومی ربات ها با سیستم ComText

ربات انسان نمای بکستر baxter

شما را به خواندن این مقاله دعوت می کنیم.

اشتراک گذاری:

Share on telegram
Share on whatsapp
Share on linkedin

محدودیت‌های ربات‌ها

برخلاف چیزی که در فیلم ها می بینید، امروزه ربات ها هنوز در انجام کارها محدودیت های زیادی دارند. ممکن است برای انجام کارهای تکراری بسیار خوب عمل کنند اما عدم توانایی آن ها در فهمیدن تفاوت های ظریف زبان انسان، آن ها را در انجام وظایف پیچیده ناتوان می سازد.

به عنوان مثال، اگر شما یک ابزار خاص را در جعبه ابزار قرار دهید و از ربات بخواهید که آن را بردارد، گیج می شود. برداشتن چیزی به معنای توانایی نگاه کردن و تشخیص اشیا می­ باشد، دستور فهمیدن و تشخیص “آن” در سوال مطرح شده ابزاری است که شما در جعبه قرار دادید و تشخیص تمایز بین آن با سایر ابزار مشابه و هم سایز.

معرفی سیستم یادگیری ماشین ComText

اخیرا محققان هوش مصنوعی و علوم کامپیوتر دانشگاه MIT به انجام این نوع وظایف توسط ربات نزدیکتر شده اند. در یک مقاله جدید، یک سیتم alexa-like  ارائه شده است که به ربات امکان تشخیص گستره ی وسیعی از فرمان ها را مبتنی بر یک دانش متنی درباره ی اشیا و محیط آن ها می دهد. آن ها این سیستم را “comtext” به معنی “commands in context” نامگذاری کرده‌اند.

موقعیت جعبه ابزار بالا در بین وظایفی بود که ComText می تواند انجام دهد. اگر شما به سیستم بگویید که “ابزاری که انداختم ابزار من است” آن حقیقت را به بیس دانشش می افزاید. شما می توانید ربات را با اطلاعات بیشتری درباره ی اشیا دیگر نیز آپدیت کنید و وظایف متعددی شبیه به برداشتن اشیا را بر مبنای دستور های مختلف به ربات بدهید.

درحالی که انسان ها جهان اطراف را به صورت مجموعه ای از اشیا و مردم و مفاهیم انتزاعی می فهمند، ماشین ها آن را به شکل پیکسل، نقشه­ ی سه بعدی تولید شده توسط سنسورها و point-clouds می بینند. یکی از نویسندگان مقاله می گوید:” این شکاف معنایی یعنی برای ربات ها فهم چیزی که ما از آن ها میخواهیم نیاز به ارائه ی قوی تری از کاری که ما انجام می دهیم و چیزی که می گوییم دارد.”

این تیم، سیستم ComText را بر روی ربات انسان‌نمای بکستر (Baxter) آزمایش کرده‌اند. بکستر یک ربات با دو بازوی متحرک و پایین تنه ثابت است که برای مصارف صنعتی استفاده می‌شود.

یادگیری ربات ها

نحوه کار یادگیری ماشین ComText

اطلاعاتی مانند تاریخ، تاریخ تولد و وقایع جزئی از حافظه اخباری (Declarative memory) هستند. حافظه اخباری به دو دسته تقسیم می‌شود: حافظه معنایی (Semantic memory) که مفاهیم عام مثل “آسمان آبی است” را شامل می‌شود؛ و حافظه ضمنی (Episodic memory) که اطلاعات شخصی را شامل می‌شود، مثل اینکه در مهمانی قبل چه اتفاقی افتاد.

بیشتر کارهای صورت گرفته در یادگیری ربات‌ ها مرتبط با حافظه معنایی بوده‌اند که باعث نادیده گرفته شدن بسیاری از اطلاعات مرتبط با آینده می‌شود. ComText می‌تواند با مشاهده وقایع و پردازش گفتار انسان، مجموعه‌ای از اطلاعات مرتبط با حافظه ضمنی را در مورد شکل، اندازه، نوع و حتی مالکیت یک جسم به دست آورد. به این ترتیب ربات می‌تواند تصمیم‌گیری کرده، مفاهیم را برداشت کرده و به دستورات پاسخ دهد. تفاوت اصلی این سیستم با سایر روش‌ها، این ایده است که ربات هم باید مثل انسان انواع مختلفی از حافظه داشته باشد. این تیم برای اولین بار مدل ریاضی برای تفکیک این دو نوع حافظه از هم را ارائه داده و در حال تعیین تمایزهای آن دو است.

با استفاده از سیستم ComText ربات بکستر توانست در بیش از ۹۰ درصد موارد، دستور را به درستی اجرا کند. این تیم در حال توسعه روش برای درک دستورهای پیچیده‌تر مثل دستورات چند مرحله‌ای، نیت کارها و در نظر گرفتن ویژگی اجسام برای ارتباط درست با آنها است. برای مثال اگر به یک ربات گفته شود که بر روی میز دو جعبه وجود دارد که در یکی شکر و در دیگری بیسکویت است و سپس از ربات خواسته شود که “خوراکی را بردار”، انتظار می‌رود که بتواند تشخیص دهد که شکر یک ماده اولیه است و نمی‌تواند خوراکی مورد نظر فرد باشد.

نوژان یک شرکت هوش مصنوعی است که در این زمینه خدماتی مانند پردازش تصویر، پردازش صدا و خدمات یادگیری ماشین را انجام می‌دهد. برای کسب اطلاعات بیشتر به صفحه درباره ما و برای سفارش محصول و خدمات به فرم ثبت سفارش مراجعه کنید.

درباره یادگیری ربات ها بیشتر بخوانید.

برای دریافت آخرین اخبار نوژان ایمیل خود را وارد نمائید
1 دیدگاه
  1. نقشه سه بعدی تولید شده توسط سنسورها یعنی چی ؟؟؟میشه بیشتر توضیح بدید؟

دیدگاه خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مطالب مشابه