GOOGLE's RT-2 nedir?



Google'un RT-2 modeli, DeepMind tarafından geliştirilen ileri düzey bir görüntü-dil-eylem (VLA) modelidir. RT-2, RT-1 modelinin yeteneklerini geliştirir ve robotların görsel ve metin verilerini yorumlayıp eyleme dönüştürme biçiminde önemli ilerlemeler sunar.

RT-2, web verileri (görseller ve metinler) üzerinde geniş çaplı ön eğitim yaparak robotlara çeşitli görevleri nasıl gerçekleştireceklerini öğretir. Bu model, bu bilgiyi doğrudan robotik eylemlere dönüştürebilir ve her görev için kapsamlı özel eğitim verisi gerektirmez. Bu, RT-2'nin yeni ve daha önce görülmemiş senaryolara genelleme yapabilmesini sağlar, bu da her görev için geniş miktarda özel eğitim verisi gerektiren geleneksel yöntemlere göre önemli bir ilerlemedir​ (Google DeepMind)​​ (blog.google)​.

RT-2 modeli, karmaşık akıl yürütme ve karar verme yeteneği ile öne çıkar. Robotun görsel-semantic kavramları anlamasını ve bu kavramlar üzerinde robotik kontrol yapabilmesini gerektiren görevlerde, web verilerinden öğrenilen bilgiyi kullanarak, yeni ve daha önce görülmemiş nesneler veya senaryolar üzerinde çalışabilir​ (Open Data Science)​​ (Atlasiko)​.

Örneğin, RT-2 modeli, "masadan düşmek üzere olan çantayı al" veya "iki artı birin toplamına muzu hareket ettir" gibi komutları yerine getirebilir. Bu tür komutlar, robotun daha önce görmediği nesnelerle veya senaryolarla karşılaştığında bile doğru eylemleri gerçekleştirebilmesini sağlar​ (Google DeepMind)​. RT-2, RT-1 modeline göre tanıdığı görevlerde benzer performans sergilerken, yeni ve görülmemiş senaryolarda performansını neredeyse iki katına çıkararak %62 başarı oranına ulaşmıştır​ (Atlasiko)​.

Bu modelin potansiyel uygulamaları, bağlama duyarlı robotlar geliştirme yolunda önemli adımlar atmayı vaat eder. Depolarda veya diğer endüstriyel ortamlarda, robotlar her nesneyi farklı bir şekilde ele alabilir, nesnenin türü, ağırlığı, kırılganlığı gibi faktörleri dikkate alarak çeşitli görevleri yerine getirebilirler.

RT-2'nin bu yetenekleri, robot teknolojisinde ve yapay zeka destekli robotların endüstriyel ve günlük yaşamda daha geniş bir yelpazede uygulanabilirliğinde önemli bir dönüşümü işaret etmektedir​ (Open Data Science)​.



Please Select Embedded Mode To Show The Comment System.*

Daha yeni Daha eski

نموذج الاتصال