Apple Kembangkan Teknologi MGIE, Alat AI yang Bisa Edit Foto dengan Perintah Teks

Ilustrasi Apple (Foto: PARBOABOA/Wanovy)

PARBOABOA - Apple resmi merilis model AI open source untuk pengeditan gambar bernama MLLM-Guided Image Editing (MGIE).

Untuk diketahui, MGIE menggunakan model bahasa besar multimodal (multimodal large language models/MLLMs) untuk menafsirkan perintah berbasis teks saat memanipulasi gambar.

Di era perkembangan AI, Apple selalu hati-hati dalam merencanakan langkah-langkahnya. Perusahaan ini juga menjadi salah satu dari sedikit perusahaan yang tidak mengumumkan rencana besar terkait AI setelah kehebohan ChatGPT tahun lalu.

Namun, Apple konon memiliki versi ChatGPT mirip chatbot yang bernama “Apple GPT” dan Tim Cook menyatakan bahwa Apple akan mengumumkan beberapa pengumuman besar terkait AI pada akhir tahun ini.

MLLM merupakan kolaborasi Apple dengan para peneliti Universitas California, Santa Barbara, Amerika Serikat (AS).

Hasil kerja sama Apple dan Universitas California Santa Barbara ini dituangkan dalam sebuah laporan makalah yang dipresentasikan dalam ajang International Conference on Learning Representations (ICLR) 2024.

Konon, ICRL 2024 merupakan salah satu konferensi besar tentang AI dan hal lainnya yang berkaitan dengan teknologi tersebut.

Kembali ke MGIE tadi, Apple menyebut bahwa ini merupakan tool AI Image Generator yang bisa membuat kegiatan edit foto lebih mudah dan interaktif, tentunya lewat serangkaian kata atau perintah yang dimasukkan pengguna.

Dengan MGIE, Apple mengatakan, pengguna bisa memakai bahasa natural yang spesifik dan ekspresif, supaya AI bisa membuat gambar akurat seperti apa yang pengguna mau.

Kemudian, pengguna juga bisa memberikan saran atau feedback kepada MGIE supaya tool AI tersebut bisa "lebih pintar", serta bisa mengintegrasikan MGIE dengan aplikasi lain tergantung fungsi dan kepentingan pengguna.

Pada prosesnya, MGIE sederhananya memungkinkan AI mengedit foto sesuai dengan perintah teks yang dimasukkan pengguna.

Di gambar yang ada di sebelah kiri atas, misalnya, pengguna bisa memerintah MGIE untuk mengedit foto makanan berupa pizza supaya ditaburi sayuran.

Selain itu, pengguna juga bisa meminta MGIE untuk menghapus obyek dari sebuah foto, membuat foto menjadi lebih terang, hinga mengubah warna dari sebuah obyek yang ada dalam foto.

MGIE dapat diterapkan pada tugas penyuntingan gambar yang sederhana dan lebih kompleks seperti memodifikasi objek tertentu dalam foto untuk menjadikannya bentuk yang berbeda atau menjadi lebih cerah. Model ini memadukan dua penggunaan model bahasa multimodal yang berbeda.

MLLM memiliki kemampuan untuk mengubah perintah teks yang sederhana atau ambigu menjadi instruksi yang lebih terperinci dan jelas yang dapat dijalankan oleh editor foto.

Selain mengimplementasikan perubahan signifikan pada gambar, MGIE juga bisa melakukan pemotongan, penyesuaian ukuran, dan rotasi foto, serta meningkatkan kecerahan, kontras, dan keseimbangan warna, semuanya berdasarkan petunjuk teks.

Ia juga dapat mengedit area tertentu pada foto dan, misalnya, memodifikasi rambut, mata, dan pakaian orang yang ada di dalamnya, atau menghapus elemen di latar belakang.

Kendati demikian, belum diketahui kapan MGIE akan dirilis secara publik. Tak disebutkan juga apakah tool AI ini akan disematkan ke dalam berbagai produk Apple, seperti iPhone atau iPad, atau tidak.

Namun yang jelas, MGIE bersifat open source dan tersedia di GitHub, sehingga pengguna atau pengembang (developer) lain bisa berkontribusi atau menggunakannya dengan bebas.

Editor: Wanovy
TAG :
Baca Juga
LIPUTAN KHUSUS