TeknoSuar.com – ChatGPT adalah chatbot kecerdasan buatan dari OpenAI yang membuat takjub banyak orang. Dari teknologi yang saat ini berkembang, ChatGPT memang mudah sekali dikenal dan populer jadi perbincangan banyak orang.
Sangat sedikit inovasi teknologi yang mendapatkan minat sebanyak yang telah dicapai ChatGPT dalam waktu sesingkat itu. Rsanya kecerdasan buatan yang satu ini tidak pernah kehabisan trik keren setiap hari. Banyak orang mengaku belajar tentang hal-hal baru yang menarik ternyata bisa dilakukan kecerdasan buatan.
Tetapi bagaimana ChatGPT dapat melakukan hal-hal tersebut? Bagaimana cara kerja ChatGPT?
Bagaimana ChatGPT Dibuat?
Untuk memahami cara kerja ChatGPT, ada baiknya melihat asal-usul dan otak di balik chatbot AI mutakhir ini.
ChatGPT dibuat oleh perusahaan OpenAI. Perusahaan ini memang menjadi otak juga dibalik kecerdasan buatan lain seperti DALL-E, InstructGPT, dan Codex.
ChatGPT kemudian viral pada tahun 2022 dan hingga kini masih menjadi perbincangan. Padahal OpenAI sudah membangunnya cukup lama, namun dengan publikasi yang memang terbatas.
ChatGPT dibangun dengan model GPT-3 atau lebih tepatnya GPT-3.5. GPT merupakan singkatan dari Generative Pre-trained Transformer.
GPT-3 adalah iterasi ketiga dari lini model AI GPT dan didahului oleh GPT-2 dan GPT. Iterasi sebelumnya dari model GPT sama-sama berguna, tetapi GPT-3 dan iterasi GPT-3.5 yang disetel halus jauh lebih hebat. Sebagian besar yang dapat dilakukan ChatGPT adalah karena teknologi GPT-3 yang mendasarinya.
Apa itu GPT?
Sudah dijelaskan tadi bahwa ChatGPT dibangun di atas model GPT generasi ketiga. Tapi apa itu GPT?
Kata “Generative” di GPT mewakili kemampuannya untuk menghasilkan teks bahasa manusia secara alami. “Pre-trained” mewakili fakta bahwa model ini telah dilatih pada beberapa kumpulan data terbatas. Ibarat manusia, mereka membaca buku-buku yang diperlukan sebelum menjawab pertanyaan. Sementara itu “Transformer” mewakili arsitektur pembelajaran mesin dasar yang mendukung GPT.
Nah, secara keseluruhan, Generative Pre-trained Transformer (GPT) adalah model bahasa yang telah dilatih menggunakan data dari internet dengan tujuan menghasilkan teks bahasa manusia saat disajikan secara langsung.
Bagaimana ChatGPT Dilatih?
ChatGPT sendiri tidak dilatih dari awal. Ini adalah versi GPT-3.5 yang disempurnakan, yang merupakan versi GPT-3 yang disempurnakan. Model GPT-3 dilatih dengan sejumlah besar data yang dikumpulkan dari internet. Sebut saja Wikipedia, Twitter, dan Reddit dan seluruh sumber informasi baku dari internet, GPT-3 ini merekamnya.
Jika Anda bertanya-tanya bagaimana cara GPT dilatih, GPT-3 dilatih menggunakan kombinasi pembelajaran yang diawasi dan Reinforcement Learning through Human Feedback (RLHF).
Pembelajaran yang diawasi adalah tahap di mana model dilatih pada kumpulan data besar teks yang diambil dari internet. Tahap RLHF adalah di mana ia dilatih untuk menghasilkan respons yang lebih baik yang selaras dengan apa yang akan diterima manusia secara baik dan benar.
Pelatihan Dengan Pembelajaran Terbimbing
Untuk lebih memahami bagaimana pembelajaran yang diawasi dan penguatan berlaku untuk ChatGPT, bayangkan sebuah skenario di mana seorang siswa diajari menulis esai oleh seorang guru. Pembelajaran yang diawasi akan setara dengan guru yang memberi siswa ratusan esai untuk dibaca. Tujuannya di sini adalah agar siswa mempelajari bagaimana sebuah esai harus ditulis dengan membiasakan diri dengan nada, kosa kata, dan struktur dari ratusan esai.
Namun, akan ada baik dan buruk di antara ratusan esai itu. Karena siswa dilatih tentang salinan yang baik dan yang buruk, kadang-kadang siswa mungkin menulis esai yang buruk karena siswa juga diberi esai yang buruk di beberapa titik. Ini berarti ketika diminta untuk menulis esai, siswa mungkin menulis salinan yang tidak dapat diterima atau cukup baik untuk guru. Di sinilah pembelajaran penguatan masuk.
Pelatihan Dengan Pembelajaran Penguatan
Setelah guru menetapkan bahwa siswa memahami aturan umum penulisan esai dengan membaca ratusan esai, guru kemudian akan sering memberikan pekerjaan rumah menulis esai kepada siswa.
Selanjutnya, guru akan memberikan umpan balik tentang pekerjaan rumah menulis esai, memberi tahu siswa apa yang telah mereka lakukan dengan baik dan apa yang dapat mereka tingkatkan. Siswa menggunakan umpan balik untuk memandu pekerjaan rumah penulisan esai berikutnya, dan membantu siswa untuk meningkat dari waktu ke waktu.
Ini mirip dengan tahap pembelajaran penguatan pelatihan model GPT. Setelah diberi sejumlah besar teks yang diambil dari internet, model tersebut dapat menjawab pertanyaan. Namun, akurasinya tidak akan cukup baik. Pelatih manusia mengajukan pertanyaan kepada model dan memberikan umpan balik tentang jawaban mana yang lebih tepat untuk setiap pertanyaan.
Model ini menggunakan umpan balik untuk meningkatkan kemampuannya menjawab pertanyaan dengan lebih akurat dan lebih seperti cara manusia merespon. Beginilah cara ChatGPT menghasilkan tanggapan yang terdengar seperti manusia yang koheren, menarik, dan secara umum akurat.
Bagaimana ChatGPT Mampu Menjawab Pertanyaan?
Jadi, jika Anda login ke situs web ChatGPT, kemudian meminta ChatGPT untuk menulis lirik lagu Hati-Hati di Jalan dari Tulus, maka mesin ini akan menuliskannya untuk Anda.
Nah, “keajaiban” di balik ChatGPT ini terkait erat dengan pelatihannya.
ChatGPT tampak menjawabnya dengan benar. Ia menuliskan lirik lagu tersebut dengan baik. Namun yang sebetulnya terjadi tidak demikian.
Sebagai mesin, ia sudah merangkum seluruh informasi yang ada di internet. Kemudian ia memprediksi pertanyaan yang diajukan dan memprediksi jawaban yang paling mungkin diberikan.
Proses seperti ini terkait dengan pembelajaran terbimbing dan pembelajaran penguatan tadi. Ia sudah menyimpan banyak informasi dari internet, namun tetap membutuhkan penguatan untuk mengetahui apa yang paling mirip responnya.
Lantas apakah ChatGPT berpotensi salah? Bisa jadi. Namun potensi salah dari sebuah robot yang telah merekam banyak informasi dibandingkan dengan penanya yang bahkan tidak tahu informasi tersebut, tentu jawaban ChatGPT ini jauh lebih baik dibandingkan manusia sebagai penanya itu.