Cara Mendeteksi ChatGPT dan Plagiarisme AI
Diterbitkan: 2023-06-22ChatGPT telah menjungkirbalikkan dunia akademik dan bisnis dengan kemampuannya untuk menghasilkan salinan yang koheren dan ditulis dengan baik tentang hampir semua subjek di bumi dalam hitungan detik.
Kemampuannya yang luar biasa telah membuat siswa dari semua tingkat pendidikan beralih ke chatbot – serta para pesaingnya, seperti Bard – untuk menulis esai rumit yang jika tidak akan membutuhkan waktu berjam-jam untuk menyelesaikannya.
Ini telah memulai percakapan global tentang fenomena baru, yang sering disebut sebagai "plagiarisme ChatGPT". Panduan ini mencakup alat yang digunakan bisnis dan lembaga pendidikan untuk mendeteksi plagiarisme ChatGPT, bahaya menyontek dengan ChatGPT – dan apakah menggunakan ChatGPT dianggap sebagai plagiarisme sama sekali.
- Cara Mendeteksi Plagiarisme ChatGPT
- Pemeriksa Plagiarisme AI dan ChatGPT Paling Populer
- Apakah Pemeriksa Konten AI Benar-Benar Berfungsi?
- Apakah Menggunakan ChatGPT atau Bard Sebenarnya Plagiarisme?
- Bahaya Kecurangan Dengan ChatGPT
- Apakah ChatGPT Menjiplak?
- Apakah Bard Menjiplak?
- Apakah Alat AI Lainnya Menjiplak?
- Haruskah Saya Menggunakan ChatGPT untuk Esai atau Pekerjaan Saya?
Cara Mendeteksi Plagiarisme ChatGPT
Untuk mendeteksi plagiarisme ChatGPT, Anda memerlukan pemeriksa konten AI. Pemeriksa konten AI memindai teks untuk menentukan apakah teks tersebut diproduksi oleh chatbot seperti ChatGPT atau Bard, atau oleh manusia. Namun, seperti yang akan kita bahas nanti, alat ini jauh dari dapat diandalkan.
Sedikit lebih sulit untuk mendeteksi plagiarisme dalam hal kode, sesuatu yang juga dapat dihasilkan oleh ChatGPT dengan baik. Tidak ada ekosistem alat pendeteksi AI yang sama untuk kode seperti yang ada untuk konten.
Namun, jika Anda berada di lingkungan universitas, misalnya, dan Anda mengirimkan kode jauh melampaui tingkat teknis Anda, profesor atau dosen Anda mungkin memiliki kecurigaan yang sangat masuk akal bahwa Anda telah meminta ChatGPT untuk membantu Anda.
Alat Pemeriksa Plagiarisme AI dan ChatGPT Paling Populer Ditinjau
Sejak peluncuran ChatGPT pada November 2022, banyak perusahaan dan lembaga pendidikan telah memproduksi pemeriksa konten AI, yang mengklaim dapat membedakan antara konten yang dibuat secara artifisial dan konten yang dibuat oleh manusia. Sekarang, banyak perusahaan juga menggunakan chatbot Google Bard, yang menggunakan model bahasa yang berbeda.
Namun, akurasi yang diklaim dari alat pendeteksi konten AI yang paling terkemuka sekalipun masih diperdebatkan dengan sengit dan kasus pengadilan antara siswa yang dituduh secara salah menggunakan konten AI dan pendidikan telah terwujud.
Intinya begini: Tidak ada alat di ruang ini yang 100% akurat, tetapi beberapa jauh lebih baik daripada yang lain.
GPTZero
GPTZero adalah alat deteksi konten AI gratis dan populer yang mengklaim bahwa ini adalah "pendeteksi AI paling akurat di seluruh kasus penggunaan, diverifikasi oleh berbagai sumber independen".
Namun, Kembali pada bulan April, seorang mahasiswa sejarah di UC Davis membuktikan bahwa GPTZero - alat pendeteksi konten AI yang digunakan oleh profesornya - salah ketika memberi label esainya sebagai buatan AI.
Kami menguji GPTZero dengan meminta ChatGPT untuk menulis cerita pendek. GPTZero, sayangnya, tidak dapat mengetahui bahwa konten tersebut ditulis oleh alat AI:
Orisinalitas.ai
Originality.ai tentu saja merupakan salah satu alat pendeteksi konten AI yang lebih akurat yang tersedia saat ini.
Perusahaan melakukan studinya sendiri ke alat pendeteksi konten AI pada bulan April tahun ini, di mana ia memberi makan 600 blok teks buatan dan 600 buatan manusia ke sistem pendeteksi kontennya sendiri, serta alat populer lainnya yang mengklaim mereka melakukan hal serupa. .
Seperti yang Anda lihat dari hasil di bawah ini, Originality.ai mengungguli semua alat yang disertakan dalam pengujian:
Satu-satunya downside ke Originality.ai adalah tidak ada paket gratis, dan Anda bahkan tidak dapat mengujinya secara gratis seperti yang Anda bisa dengan aplikasi lain yang termasuk dalam artikel ini. harganya $20 untuk 2.000 kredit, yang memungkinkan Anda memeriksa 200.000 kata.
Copyleaks Detektor Konten AI
Copyleaks adalah pendeteksi konten AI gratis yang mengklaim dapat membedakan antara salinan buatan manusia dan buatan AI dengan akurasi 99,12%.
Copyleaks juga akan memberi tahu Anda jika aspek tertentu dari dokumen atau bagian ditulis oleh AI, bahkan jika bagian lain tampaknya ditulis oleh manusia.
Copyleaks mengatakan itu mampu mendeteksi konten buatan AI yang dibuat oleh "ChatGPT, GPT-4, GPT-3, Jasper, dan lainnya", dan bahkan mengklaim bahwa "setelah model yang lebih baru keluar, kami akan dapat mendeteksinya secara otomatis."
Biaya CopyLeaks $8,33 per bulan untuk 1.200 kredit (salinan 250 kata per kredit).
Namun, dalam pengujian yang dilakukan oleh TechCrunch pada Februari 2023, Copyleaks salah mengklasifikasikan berbagai jenis salinan buatan AI, termasuk artikel berita, entri ensiklopedia, dan surat pengantar sebagai buatan manusia.
Selain itu, studi Originality.ai yang dirujuk di atas hanya menemukan keakuratannya dalam 14,50% kasus – jauh dari klaim akurasi 99,12% yang dibuat oleh CopyLeaks.
Namun, saat kami mengujinya, tampaknya dapat diketahui bahwa teks yang kami masukkan dihasilkan oleh ChatGPT:
Detektor AI Turnitin
Turnitin adalah perusahaan pendeteksi plagiarisme berbasis di AS yang digunakan oleh berbagai universitas untuk memindai karya siswanya. Turnitin dirancang untuk mendeteksi semua jenis plagiarisme tetapi terungkap pada bulan April bahwa itu telah berinvestasi dalam tim yang berfokus pada AI untuk beberapa waktu sekarang.
Turnitin mengatakan bahwa itu dapat "mendeteksi keberadaan tulisan AI dengan keyakinan 98% dan tingkat positif palsu kurang dari satu persen di lingkungan lab terkontrol kami."
Namun, perusahaan juga mengatakan bahwa konten jika menandai konten sebagai buatan AI, ini harus diperlakukan sebagai "indikasi, bukan tuduhan". Keakuratan sebenarnya dari detektor AI Turnitin telah diperdebatkan oleh Washington Post, serta sumber lainnya.
Perangkat lunak pendeteksi konten AI Turnitin saat ini gratis, tetapi perusahaan mengatakan dalam FAQ di situs webnya bahwa mereka pindah ke program lisensi berbayar pada Januari 2024 – harganya tidak ditentukan.
Pengklasifikasi Teks OpenAI
Tidak ingin dikalahkan oleh pemeriksa konten AI pihak ketiga, OpenAI sendiri telah merilis perangkat lunak yang dirancang untuk mengklasifikasikan apakah konten telah dihasilkan oleh AI.
Panjang dokumen atau teks yang Anda masukkan harus lebih dari 1000 karakter. Setelah Anda memasukkan dokumen Anda, OpenAI akan memberi tahu Anda hampir secara instan seberapa besar kemungkinan dokumen itu dibuat oleh manusia.
Saya memposting kutipan dari artikel Tech.co baru-baru ini, yang ditulis oleh seorang penulis – yang menurut OpenAI “sangat tidak mungkin” ditulis oleh AI.
Dalam artikel TechCrunch yang sama yang kami rujuk sebelumnya, publikasi mengatakan OpenAI memperkirakan bahwa pengklasifikasi teksnya kehilangan 74% konten yang dihasilkan AI. Untung mereka juga jujur tentang hal ini – saat kami melakukan pengujian kedua, menggunakan cerita pendek yang dihasilkan oleh ChatGPT, tidak menangkap fakta bahwa itu dihasilkan oleh AI:
Apakah Deteksi Konten AI Sebenarnya Berfungsi?
Tidak ada alat pendeteksi konten AI yang 100% andal – pengujian kami membuktikannya dengan sangat baik.
Namun, tidak satu pun alat yang telah kita diskusikan hari ini benar-benar mengklaim 100% akurat, dan sangat sedikit yang mengklaim benar-benar bebas dari kesalahan positif. Lainnya, seperti GPTZero, memposting penafian tentang menganggap hasil mereka sebagai Injil.
Sejumlah mahasiswa yang dituduh menggunakan kecerdasan buatan untuk membuat esai telah dipaksa untuk membuktikan bahwa karya mereka asli.
Di Texas, pada bulan Maret, seorang profesor secara keliru mengecewakan seluruh siswa setelah menuduh mereka menggunakan ChatGPT untuk menulis esai. Ada juga kumpulan laporan – dan studi seperti yang dilakukan oleh Originality.ai – yang menunjukkan bahwa bahkan pemeriksa plagiarisme yang paling cakap pun tidak seakurat yang mereka klaim.
Bahkan pendeteksi konten AI Turnitin tidak mudah. Dalam tes yang relatif kecil baru-baru ini yang dilakukan oleh Washington Post yang telah kita diskusikan sebelumnya, akurasinya jauh dari 98% yang diklaim dapat mereka hasilkan.
Orisinalitas.ai, di sisi lain, tentu saja salah satu yang lebih kuat yang tersedia – dan bahkan teknologi pendeteksiannya tidak selalu tepat.
Selain itu, jika positif palsu ada dalam kapasitas apa pun, maka akan selalu ada ruang bagi siswa untuk mengklaim karya mereka orisinal dan salah diidentifikasi.
Apakah Menggunakan ChatGPT atau Bard Plagiarisme?
Masih bisa diperdebatkan apakah ChatGPT sebenarnya adalah plagiarisme. Oxford Languages mendefinisikan plagiarisme sebagai "praktik mengambil karya atau ide orang lain dan menyerahkannya sebagai miliknya".
ChatGPT bukanlah manusia, dan tidak sekadar mereproduksi karya dan ide orang lain saat menghasilkan jawaban. Jadi, menurut definisi kamus, itu bukan plagiarisme langsung.
Bahkan jika itu melakukan itu, jika Anda jujur tentang dari mana asalnya (yaitu ChatGPT), bisa dibilang, itu bukan plagiarisme.
Namun, beberapa sekolah dan universitas memiliki aturan plagiarisme yang luas dan mempertimbangkan untuk menggunakan chatbot untuk menulis esai seperti itu. Seorang mahasiswa di Universitas Furman gagal mendapatkan gelar filsafat pada bulan Desember setelah menggunakan ChatGPT untuk menulis esainya. Dalam kasus lain, seorang profesor di Universitas Michigan Utara melaporkan menangkap dua siswa yang menggunakan chatbot untuk menulis esai untuk kelas mereka.
Menggunakan ChatGPT untuk menghasilkan esai dan kemudian memberikannya sebagai karya Anda sendiri mungkin lebih baik digambarkan sebagai "curang" dan jelas "tidak jujur".
Inti dari menulis esai adalah untuk menunjukkan bahwa Anda mampu menghasilkan pemikiran orisinal, memahami konsep yang relevan, dengan hati-hati mempertimbangkan argumen yang bertentangan, menyajikan informasi dengan jelas, dan mengutip sumber Anda.
Ada sedikit perbedaan antara menggunakan ChatGPT dengan cara ini dan membayar siswa lain untuk menulis esai untuk Anda – yang tentu saja curang.
Berkenaan dengan Google's Bard, jawabannya sedikit lebih rumit. Garis logika yang sama yang digunakan di atas berlaku untuk Bard seperti halnya untuk ChatGPT, tetapi Bard telah dirusak oleh tuduhan plagiarisme dan salah mengutip hal-hal yang ditariknya dari internet dengan cara yang tidak dimiliki ChatGPT. Jadi, menggunakan Bard dapat menyebabkan Anda secara tidak sengaja menjiplak sumber lain ( lebih lanjut tentang ini di bawah ).
Bahaya Kecurangan Dengan ChatGPT
Christopher Howell, Asisten Profesor Tambahan di Universitas Elon, baru-baru ini meminta sekelompok siswa untuk menggunakan ChatGPT untuk tugas kritis dan kemudian menilai esai yang dihasilkannya untuk mereka.
Dia melaporkan dalam utas Twitter yang panjang (bagian pertama digambarkan di bawah) bahwa semua 63 siswa yang berpartisipasi menemukan beberapa bentuk "halusinasi" - termasuk kutipan palsu, dan sumber palsu dan disalahtafsirkan - dalam tugas mereka.
Apakah ChatGPT Menjiplak dalam Tanggapannya?
Tidak – ChatGPT tidak mengambil informasi dari sumber lain dan hanya menggabungkannya, kalimat demi kalimat. Ini adalah kesalahpahaman tentang cara kerja Transformer Pra-terlatih Generatif.
ChatGPT – atau lebih tepatnya model bahasa GPT – dilatih pada kumpulan data besar dokumen, materi situs web, dan teks lainnya.
Ini menggunakan algoritme untuk menemukan urutan dan pola linguistik dalam kumpulan datanya. Paragraf, kalimat, dan kata kemudian dapat dihasilkan berdasarkan apa yang telah dipelajari oleh model bahasa tentang bahasa dari urutan dalam kumpulan data ini.
Inilah sebabnya mengapa jika Anda mengajukan pertanyaan yang sama pada ChatGPT pada waktu yang sama dari dua perangkat yang berbeda, jawabannya biasanya sangat mirip – tetapi masih akan ada variasi, dan kadang-kadang menawarkan jawaban yang sama sekali berbeda.
Apakah Bard Menjiplak dalam Tanggapannya?
Saingan terbesar ChatGPT, Bard Google memiliki lebih banyak masalah dengan menjiplak konten sejak diluncurkan daripada rekannya yang lebih populer. Situs web teknologi Perangkat Keras Tom menemukan bahwa Bard telah menjiplak salah satu artikelnya, dan kemudian melanjutkan untuk meminta maaf ketika salah satu stafnya memanggilnya.
Baru-baru ini, pada Mei 2023, PlagiarismCheck memberi tahu Yahoo News bahwa mereka menghasilkan 35 potongan teks dengan Bard, dan menemukannya menjiplak di atas 5% di 25 di antaranya hanya dengan memparafrasakan konten yang ada yang sudah dipublikasikan di internet.
Satu perbedaan besar antara Bard dan ChatGPT yang mungkin dapat menjelaskan hal ini adalah bahwa Bard dapat mencari tanggapan di internet, itulah sebabnya Bard cenderung menangani pertanyaan yang berkaitan dengan peristiwa setelah tahun 2021, yang diperjuangkan oleh ChatGPT dengan lebih baik. Namun, ini tampaknya juga berarti ia menarik data dari sumber dengan cara yang kurang orisinal dan lebih sering mengutip sumbernya.
Contoh-contoh ini mungkin merupakan blip, tetapi ada baiknya untuk mengetahui risikonya jika Anda menggunakan Bard untuk pekerjaan penting.
Apakah Alat AI Lainnya Menjiplak?
Sayangnya, ya – dan beberapa perusahaan telah mempermalukan diri mereka sendiri dengan menggunakan alat AI yang menjiplak konten. Misalnya, CNET – salah satu situs teknologi terbesar di dunia – ditemukan menggunakan alat AI untuk menghasilkan artikel, dan sama sekali tidak transparan tentangnya. Sekitar setengah dari artikel yang diterbitkan CNET menggunakan AI ditemukan memiliki beberapa informasi yang salah.
Lebih buruk lagi, Futurisme, yang meluncurkan penyelidikan terhadap plagiarisme AI CNET, mengatakan bahwa "perilaku buruk bot berkisar dari penyalinan kata demi kata hingga pengeditan sedang hingga pengulangan yang signifikan, semua tanpa memberi kredit yang sesuai dengan aslinya".
Alat AI yang tidak menghasilkan konten asli yang unik – baik itu seni atau teks – berpotensi menjiplak konten yang sudah dipublikasikan di internet. Penting untuk memahami dengan tepat bagaimana model bahasa yang digunakan alat AI Anda berfungsi dan juga memiliki pengawasan ketat atas konten yang dihasilkannya, atau Anda bisa berakhir di posisi yang sama dengan CNET.
Haruskah Anda Menggunakan ChatGPT untuk Esai atau Pekerjaan?
Menggunakan ChatGPT untuk Esai
Fakta bahwa ChatGPT tidak hanya mengambil jawaban dari sumber lain dan menyatukan kalimat berarti bisnis dapat menggunakan ChatGPT untuk berbagai tugas berbeda tanpa mengkhawatirkan masalah hak cipta.
Tapi mekanisme internalnya juga membuatnya sering berhalusinasi dan membuat kesalahan. Ini jauh, jauh dari sempurna – dan meskipun sangat menggoda untuk meminta ChatGPT menulis esai Anda untuk universitas atau perguruan tinggi, kami tidak menyarankannya.
Pedoman pengiriman khusus setiap lembaga pendidikan akan sedikit berbeda, tentu saja, tetapi kemungkinan besar itu sudah dianggap "menipu" atau plagiarisme di universitas atau sekolah Anda. Plus, terlepas dari seberapa akuratnya, institusi pendidikan menggunakan pendeteksi konten AI, yang akan meningkat seiring waktu.
Menggunakan ChatGPT di Tempat Kerja
Tentu saja, banyak orang sudah menggunakan ChatGPT di tempat kerja – ini terbukti berguna di berbagai industri, dan membantu pekerja dalam segala jenis peran menghemat waktu berharga dalam tugas sehari-hari.
Namun, jika Anda menggunakan ChatGPT di tempat kerja, sebaiknya terbukalah dengan manajer atau penyelia Anda tentang hal itu – terutama jika Anda menggunakannya untuk aktivitas penting seperti menulis laporan untuk pemangku kepentingan eksternal.
Kami juga sangat menyarankan untuk mengedit dan meninjau dengan cermat semua pekerjaan yang Anda gunakan untuk menghasilkan ChatGPT, Bard, atau alat AI lainnya. Tidak bijaksana memasukkan informasi pribadi atau perusahaan yang sensitif ke dalam chatbot apa pun, karena tidak banyak informasi publik tentang tempat penyimpanan obrolan ini atau infrastruktur keamanan OpenAI.
Menggunakan Alat AI Lain untuk Esai atau Pekerjaan
Tentu saja, Bard dan ChatGPT bukan satu-satunya chatbot AI yang ada. Namun, kami ragu untuk memberikan dukungan kami di balik alat AI yang lebih kecil yang tidak didukung oleh model bahasa yang kuat. Mereka tidak akan memiliki sumber daya yang baik, dan Anda tidak mungkin menganggapnya berguna jika Anda bereksperimen dengan menggunakannya untuk bekerja.
Namun, aturan yang sama masih berlaku – terbukalah dengan manajer Anda dan dapatkan persetujuan untuk menggunakannya, jangan memasukkan data perusahaan yang sensitif, dan selalu tinjau jawaban yang Anda berikan.