Pembelajaran penguatan mendalam akan mengubah manufaktur seperti yang kita kenal – TechCrunch

0
15


Jika Anda berjalan di jalan meneriakkan nama setiap benda yang Anda lihat — truk sampah! pengendara sepeda! pohon ara! — kebanyakan orang tidak akan menyimpulkan bahwa Anda pintar. Tetapi jika Anda melewati rintangan, dan Anda menunjukkan kepada mereka cara menavigasi serangkaian tantangan untuk mencapai akhir tanpa cedera, mereka akan melakukannya.

Sebagian besar algoritma pembelajaran mesin meneriakkan nama di jalan. Mereka melakukan tugas-tugas perseptif yang dapat dilakukan seseorang dalam waktu kurang dari satu detik. Tetapi jenis AI lainnya — pembelajaran penguatan mendalam — bersifat strategis. Ia belajar bagaimana mengambil serangkaian tindakan untuk mencapai tujuan. Itu kuat dan cerdas — dan itu akan mengubah banyak industri.

Dua industri di puncak transformasi AI adalah manufaktur dan rantai pasokan. Cara kami membuat dan mengirimkan barang sangat bergantung pada kelompok mesin yang bekerja bersama, dan efisiensi serta ketahanan mesin tersebut merupakan fondasi ekonomi dan masyarakat kita. Tanpa mereka, kita tidak dapat membeli kebutuhan dasar untuk hidup dan bekerja.

Startup seperti kovarian, Kerabat Ocado dan Mesin Cerah menggunakan pembelajaran mesin dan pembelajaran penguatan untuk mengubah cara mesin dikendalikan di pabrik dan gudang, memecahkan tantangan yang sangat sulit seperti membuat robot mendeteksi dan mengambil objek dengan berbagai ukuran dan bentuk dari tempat sampah, antara lain. Mereka menyerang pasar yang sangat besar: Kontrol industri dan pasar otomasi sangat berharga $152 miliar tahun lalu, sementara otomatisasi logistik dihargai lebih dari $50 miliar.

Pembelajaran penguatan mendalam secara konsisten menghasilkan hasil yang tidak dapat dilakukan oleh pembelajaran mesin dan alat pengoptimalan lainnya.

Sebagai seorang teknolog, Anda memerlukan banyak hal untuk membuat pembelajaran penguatan mendalam berhasil. Bagian pertama yang harus dipikirkan adalah bagaimana Anda akan mendapatkan agen pembelajaran penguatan mendalam Anda untuk melatih keterampilan yang Anda inginkan untuk diperoleh. Hanya ada dua cara — dengan data nyata atau melalui simulasi. Setiap pendekatan memiliki tantangannya sendiri: Data harus dikumpulkan dan dibersihkan, sementara simulasi harus dibangun dan divalidasi.

Beberapa contoh akan menggambarkan apa artinya ini. Pada tahun 2016, GoogleX mengiklankan “pertanian lengan” robotnya — ruang yang diisi dengan lengan robot yang sedang belajar memegang benda dan mengajari orang lain cara melakukan hal yang sama — yang merupakan salah satu cara awal algoritme pembelajaran penguatan untuk mempraktikkan gerakannya di lingkungan nyata dan mengukur keberhasilan tindakannya. Putaran umpan balik itu diperlukan untuk dipelajari oleh algoritma berorientasi tujuan: Itu harus membuat keputusan berurutan dan melihat ke mana arahnya.

Dalam banyak situasi, tidak layak untuk membangun lingkungan fisik di mana algoritma pembelajaran penguatan dapat belajar. Katakanlah Anda ingin menguji berbagai strategi untuk mengarahkan ribuan armada truk yang memindahkan barang dari banyak pabrik ke banyak gerai ritel. Akan sangat mahal untuk menguji semua strategi yang mungkin, dan pengujian tersebut tidak hanya membutuhkan biaya untuk menjalankannya, tetapi kegagalan yang dijalankan akan menyebabkan banyak pelanggan yang tidak senang.

Untuk banyak sistem besar, satu-satunya cara yang mungkin untuk menemukan jalur tindakan terbaik adalah dengan simulasi. Dalam situasi tersebut, Anda harus membuat model digital dari sistem fisik yang ingin Anda pahami untuk menghasilkan kebutuhan pembelajaran penguatan data. Model-model ini disebut, secara bergantian, kembar digital, simulasi, dan lingkungan pembelajaran penguatan. Mereka semua pada dasarnya memiliki arti yang sama dalam aplikasi manufaktur dan rantai pasokan.

Membuat ulang sistem fisik apa pun membutuhkan pakar domain yang memahami cara kerja sistem. Ini bisa menjadi masalah bagi sistem sekecil pusat pemenuhan tunggal karena alasan sederhana bahwa orang-orang yang membangun sistem tersebut mungkin telah pergi atau meninggal, dan penerusnya telah belajar cara mengoperasikannya tetapi tidak merekonstruksinya.

Banyak perangkat lunak simulasi menawarkan antarmuka kode rendah yang memungkinkan pakar domain untuk membuat model digital dari sistem fisik tersebut. Ini penting, karena keahlian domain dan keterampilan rekayasa perangkat lunak seringkali tidak dapat ditemukan pada orang yang sama.

Mengapa Anda harus melalui semua masalah ini untuk satu algoritma? Karena pembelajaran penguatan mendalam secara konsisten menghasilkan hasil yang tidak dapat dilakukan oleh pembelajaran mesin dan alat pengoptimalan lainnya. Pikiran Dalam menggunakannya, tentu saja, untuk mengalahkan juara dunia permainan papan Go. Pembelajaran penguatan adalah bagian dari algoritme yang merupakan bagian integral untuk mencapai hasil terobosan dengan catur, pelipatan protein, dan permainan Atari. Juga, OpenAI melatih penguatan mendalam untuk mengalahkan tim manusia terbaik di Dota 2.

Sama seperti jaringan saraf tiruan yang dalam mulai menemukan aplikasi bisnis pada pertengahan 2010-an, setelah Geoffrey Hinton dipekerjakan oleh Google dan Yann LeCun oleh Facebook, demikian juga, pembelajaran penguatan yang mendalam akan memiliki dampak yang meningkat pada industri. Ini akan mengarah pada peningkatan kuantum dalam otomatisasi robot dan kontrol sistem pada urutan yang sama seperti yang kita lihat dengan Go. Ini akan menjadi yang terbaik yang kita miliki, dan dalam jangka panjang.

Konsekuensi dari keuntungan tersebut adalah peningkatan besar dalam efisiensi dan penghematan biaya dalam produk manufaktur dan operasi rantai pasokan, yang mengarah pada penurunan emisi karbon dan kecelakaan di tempat kerja. Dan, untuk lebih jelasnya, titik tersedak dan tantangan dunia fisik ada di sekitar kita. Baru pada tahun lalu, masyarakat kita telah dilanda berbagai gangguan rantai pasokan karena COVID, penguncian, bencana Terusan Suez, dan peristiwa cuaca ekstrem.

Memperbesar COVID, bahkan setelah vaksin dikembangkan dan disetujui, banyak negara mengalami kesulitan memproduksi dan mendistribusikannya dengan cepat. Ini adalah masalah manufaktur dan rantai pasokan yang melibatkan situasi yang tidak dapat kami persiapkan dengan data historis. Mereka membutuhkan simulasi untuk memprediksi apa yang akan terjadi, serta bagaimana kita dapat mengatasi krisis dengan baik ketika itu terjadi, seperti yang diilustrasikan Michael Lewis dalam bukunya baru-baru ini “firasat.”

Perpaduan kendala dan tantangan baru yang terjadi di pabrik dan rantai pasokan inilah yang dapat membantu kita menyelesaikannya dengan lebih cepat melalui pembelajaran penguatan dan simulasi. Dan kami yakin akan menghadapi lebih banyak dari mereka di masa depan.



Sumber

LEAVE A REPLY

Please enter your comment!
Please enter your name here