Close Menu

    Subscribe to Updates

    Get the latest creative news from FooBar about art, design and business.

    What's Hot

    Langkah Mas Dhito Tangani Stunting Bawa Kabupaten Kediri Terbaik Kedua se-Jatim

    2 Juli 2025

    Pembersih Udara Favorit kami adalah $ 37 untuk hari utama

    2 Juli 2025

    Rodri Kembali Alami Cedera

    2 Juli 2025
    Facebook X (Twitter) Instagram YouTube
    Trending
    • Langkah Mas Dhito Tangani Stunting Bawa Kabupaten Kediri Terbaik Kedua se-Jatim
    • Pembersih Udara Favorit kami adalah $ 37 untuk hari utama
    • Rodri Kembali Alami Cedera
    • IMR – Pagar Pasar Besar Ambrol, Komisi B Desak Revitalisasi Pasar
    • Kasus Perusakan Kafe ANT Probolinggo Sidang Perdana, Korban Cabut Tuntutan
    • Lindungi Anak Yunani Perketat Aturan Produk Tembakau dan Alkohol
    • IMR – ASN Purna Tugas Dilepas dengan Hormat di Kota Batu
    • Aji Santoso Tegaskan Sanksi Tak Pengaruhi Posisi Jhon Mena di Persela Lamongan
    Facebook X (Twitter) Instagram YouTube
    Info Malang RayaInfo Malang Raya
    • LIPUTAN KHUSUS
    • MALANG RAYA
      • KOTA MALANG
      • KABUPATEN MALANG
      • KOTA BATU
    • JAWA TIMUR
    • NASIONAL
    • OLAHRAGA
    • RAGAM
      • TEKNOLOGI
      • UNDANG-UNDANG
      • WISATA & KULINER
      • KOMUNITAS
      • IMR ENGLISH
    • OPINI
    • COVER HARIAN IMR
    • LOGIN
    Info Malang RayaInfo Malang Raya
    • LIPUTAN KHUSUS
    • MALANG RAYA
    • KOTA MALANG
    • KABUPATEN MALANG
    • KOTA BATU
    • JAWA TIMUR
    • NASIONAL
    • INTERNASIONAL
    • OLAHRAGA
    • OPINI
    • RAGAM
    • KOMUNITAS
    • WISATA & KULINER
    • KAJIAN ISLAM
    • TEKNOLOGI
    • UNDANG-UNDANG
    • INFO PROPERTI & LOWONGAN KERJA
    • TIPS & TRIK
    • COVER HARIAN IMR
    • IMR TV
    • LOGIN
    Home»RAGAM»TEKNOLOGI»Pidato sumber terbuka Meta mengenali lebih dari 4.000 bahasa lisan
    TEKNOLOGI

    Pidato sumber terbuka Meta mengenali lebih dari 4.000 bahasa lisan

    By admin23 Mei 2023
    Facebook Twitter WhatsApp Telegram Email Copy Link
    2083da10 f672 11ed 9fae 36f04f718dd4.cf

    Infomalangraya.com –

    Meta telah membuat model bahasa AI yang (dalam perubahan kecepatan yang menyegarkan) bukan tiruan ChatGPT. Proyek Massively Multilingual Speech (MMS) perusahaan dapat mengenali lebih dari 4.000 bahasa lisan dan menghasilkan ucapan (text-to-speech) di lebih dari 1.100. Seperti kebanyakan proyek AI lainnya yang diumumkan secara publik, Meta adalah MMS sumber terbuka saat ini untuk membantu melestarikan keragaman bahasa dan mendorong para peneliti untuk membangun fondasinya. “Hari ini, kami membagikan model dan kode kami secara publik sehingga orang lain dalam komunitas riset dapat mengembangkan pekerjaan kami,” tulis perusahaan itu. “Melalui karya ini, kami berharap dapat memberikan kontribusi kecil untuk melestarikan keanekaragaman bahasa yang luar biasa di dunia.”

    Pengenalan ucapan dan model teks-ke-ucapan biasanya memerlukan pelatihan selama ribuan jam audio dengan label transkripsi yang menyertainya. (Label sangat penting untuk pembelajaran mesin, memungkinkan algoritme mengkategorikan dan “memahami” data dengan benar.) Namun untuk bahasa yang tidak banyak digunakan di negara industri — banyak di antaranya terancam punah dalam beberapa dekade mendatang — “ini data tidak ada,” seperti yang dikatakan Meta.

    Meta menggunakan pendekatan yang tidak konvensional untuk mengumpulkan data audio: memanfaatkan rekaman audio dari teks-teks agama yang diterjemahkan. “Kami beralih ke teks-teks agama, seperti Alkitab, yang telah diterjemahkan dalam berbagai bahasa dan terjemahannya telah dipelajari secara luas untuk penelitian terjemahan bahasa berbasis teks,” kata perusahaan itu. “Terjemahan ini memiliki rekaman audio yang tersedia untuk umum dari orang yang membaca teks ini dalam berbagai bahasa.” Menggabungkan rekaman Alkitab yang tidak berlabel dan teks serupa, peneliti Meta meningkatkan bahasa model yang tersedia menjadi lebih dari 4.000.

    Jika Anda seperti saya, pendekatan itu mungkin mengangkat alis Anda pada pandangan pertama, karena kedengarannya seperti resep untuk model AI yang sangat bias terhadap pandangan dunia Kristen. Tapi Meta mengatakan bukan itu masalahnya. “Meskipun isi rekaman audionya religius, analisis kami menunjukkan bahwa model ini tidak bias menghasilkan bahasa yang lebih religius,” tulis Meta. “Kami percaya ini karena kami menggunakan pendekatan klasifikasi temporal koneksionis (CTC), yang jauh lebih terbatas dibandingkan dengan model bahasa besar (LLM) atau model urutan-ke-urutan untuk pengenalan ucapan.” Selain itu, meskipun sebagian besar rekaman religius dibacakan oleh penutur laki-laki, hal itu juga tidak menimbulkan bias laki-laki — tampil sama baiknya dalam suara perempuan dan laki-laki.

    Setelah melatih model penyelarasan untuk membuat data lebih bermanfaat, Meta menggunakan wav2vec 2.0, model “pembelajaran representasi ucapan mandiri” perusahaan, yang dapat melatih data tanpa label. Menggabungkan sumber data yang tidak konvensional dan model ucapan yang diawasi sendiri menghasilkan hasil yang mengesankan. “Hasil kami menunjukkan bahwa model Massively Multilingual Speech bekerja dengan baik dibandingkan dengan model yang ada dan mencakup 10 kali lebih banyak bahasa.” Secara khusus, Meta membandingkan MMS dengan Whisper OpenAI, dan itu melebihi ekspektasi. “Kami menemukan bahwa model yang dilatih pada data Pidato Multibahasa Masif mencapai separuh tingkat kesalahan kata, tetapi Pidato Multibahasa Masif mencakup 11 kali lebih banyak bahasa.”

    Meta memperingatkan bahwa model barunya tidak sempurna. “Misalnya, ada beberapa risiko bahwa model ucapan-ke-teks dapat salah menerjemahkan kata atau frasa tertentu,” tulis perusahaan itu. “Tergantung pada keluarannya, ini dapat mengakibatkan bahasa yang menyinggung dan/atau tidak akurat. Kami terus percaya bahwa kolaborasi lintas komunitas AI sangat penting untuk pengembangan teknologi AI yang bertanggung jawab.”

    Sekarang Meta telah merilis MMS untuk penelitian sumber terbuka, ia berharap dapat membalikkan tren teknologi yang menyusutkan bahasa dunia menjadi 100 atau kurang yang paling sering didukung oleh Big Tech. Ia melihat dunia di mana teknologi asistif, TTS, dan bahkan teknologi VR / AR memungkinkan semua orang berbicara dan belajar dalam bahasa ibu mereka. Dikatakan, “Kami membayangkan dunia di mana teknologi memiliki efek sebaliknya, mendorong orang untuk menjaga bahasa mereka tetap hidup karena mereka dapat mengakses informasi dan menggunakan teknologi dengan berbicara dalam bahasa pilihan mereka.”

    Jumlah Pembaca: 557

    Bahasa dari Lebih Lisan mengenali Meta pidato Sumber Terbuka
    Share. Facebook Twitter WhatsApp Telegram Email Copy Link

    Berita Terkait

    Pembersih Udara Favorit kami adalah $ 37 untuk hari utama

    2 Juli 2025

    Layar dot-matrix kecil dan menyenangkan di ponsel perusahaan yang paling mahal

    2 Juli 2025

    Iceblock naik ke puncak tangga lagu App Store setelah pejabat membantingnya

    2 Juli 2025
    Leave A Reply Cancel Reply

    banner 300250
    banner 300250
    banner 250250
    Search
    BERITA POPULER

    Bupati Malang Hadiri Kanjuruhan Street Race Edisi 13

    30 Maret 20240

    Ironi Psywar: Arema FC yang Dulu Dilecehkan, Kini Justru Menendang PSS Sleman

    24 Mei 20250

    10 Aplikasi Musik Tanpa Iklan Terbaik, Diunduh Jutaan Pengguna!

    25 April 202446

    Pantun Pj. Walikota Malang Bikin Suasana Meriah di Acara Malang Raya Shopping Adventure 2024

    1 April 20242
    Facebook X (Twitter) Instagram YouTube
    • DISCLAIMER
    • INDEX BERITA
    • PEDOMAN MEDIA SIBER
    • REDAKSI
    © 2016 Infomalangraya. Designed by Mohenk.

    Type above and press Enter to search. Press Esc to cancel.