Sundar Pichai, CEO Google | foto @google |
Developer dapat menyaksikan keynote secara online melalui live stream, menonton sesi teknis secara on demand, dan menjelajahi materi pembelajaran mandiri.
Sementara itu, ada juga I/O Connect yang merupakan seri acara developer offline dari Google yang berfokus pada penerapan teknologi dan pengumuman dari Google I/O melalui sesi, demo, konsultasi, dan lainnya secara live. Pelajari lebih lanjut tentang I/O Connect.
Perusahaan yang dipimpin Sundar Pichai itu juga menggelar I/O Extended merupakan serangkaian acara global dari Google Developer Groups yang diselenggarakan oleh komunitas untuk para pengembang. Namun setiap acara dapat memiliki format yang berbeda-beda.
Namun apa saja poin-poin penting dalam gelaran Google I/O 2024? kontributor blog.google Molly McHugh-Johnson mencatat ada100 hal yang diumumkan di Google I/O 2024.
"Banyak hal yang terjadi di I/O 2024! Apakah Anda sangat menyukai pembaruan aplikasi Gemini terbaru, merasa sangat bersemangat dengan apa yang akan terjadi pada pengembang, atau tidak sabar untuk mencoba alat AI generatif terbaru, selalu ada sesuatu untuk semua orang. Tidak percaya kami? Di bawah ini, kami mengumpulkan 100 hal yang kami umumkan selama dua hari terakhir," tulisnya dalam blog resmi Google.
Berikut poin-poin penting gelaran Google I/O 2024 yang dilansir dalam resmi Google:
Momen AI dan momentum model.
1. Kami memperkenalkan Gemini 1.5 Flash : model berbobot lebih ringan yang dirancang agar cepat dan efisien untuk melayani dalam skala besar. 1.5 Flash adalah model Gemini tercepat yang disajikan di API.
2. Kami telah meningkatkan 1.5 Pro secara signifikan, model terbaik kami untuk kinerja umum di berbagai tugas.
3. Baik 1.5 Pro dan 1.5 Flash tersedia dalam pratinjau publik dengan jendela konteks 1 juta token di Google AI Studio dan Vertex AI.
4. 1.5 Pro juga tersedia dengan jendela konteks 2 juta token untuk pengembang melalui daftar tunggu di Google AI Studio dan Vertex AI .
5. Kami berbagi Project Astra : visi kami untuk masa depan asisten AI.
6. Kami mengumumkan Trillium , generasi keenam dari akselerator AI khusus kami, Tensor Processing Unit (TPU). Ini adalah TPU dengan performa paling tinggi hingga saat ini.
7. Dibandingkan dengan TPU v5e, TPU Trillium mencapai peningkatan performa komputasi puncak per chip sebesar 4,7x.
8 . Mereka juga merupakan generasi kami yang paling ramah lingkungan: TPU Trillium 67% lebih hemat energi dibandingkan TPU v5e.
9. Dan kami mendemonstrasikan prototipe awal Ikhtisar Audio untuk NotebookLM , yang menggunakan kumpulan materi yang diunggah untuk membuat diskusi verbal yang dipersonalisasi untuk pengguna.
10. Kami mengumumkan bahwa Grounding dengan Google Penelusuran — alat yang menghubungkan model Gemini dengan pengetahuan dunia, beragam kemungkinan topik, atau informasi terkini di internet — kini tersedia secara umum di Vertex AI .
11. Kami menambahkan pemahaman audio di Gemini API dan AI Studio, sehingga Gemini 1.5 Pro kini dapat mempertimbangkan gambar dan audio untuk video yang diunggah di AI Studio.
12. Dimulai dengan Pixel, aplikasi yang menggunakan Gemini Nano dengan Multimodality akan mampu memahami dunia seperti yang dilakukan manusia — tidak hanya melalui input teks tetapi juga melalui penglihatan, suara, dan bahasa lisan.
Model media generatif dan eksperimen Labs.
13. Kami mengumumkan Imagen 3 , model pembuatan gambar kualitas tertinggi kami.
14. Imagen 3 memahami bahasa dan maksud alami di balik perintah Anda dan menggabungkan detail kecil dari perintah yang lebih panjang. Hal ini membantunya menghasilkan tingkat detail yang luar biasa, menghasilkan gambar fotorealistik dan nyata dengan artefak visual yang jauh lebih sedikit mengganggu dibandingkan model kami sebelumnya.
15. Imagen 3 juga merupakan model terbaik kami untuk merender teks — sebuah tantangan untuk model pembuatan gambar.
16. Kami meluncurkan Imagen 3 ke Penguji Tepercaya di ImageFX dan Anda dapat mendaftar untuk bergabung dalam daftar tunggu .
17. Imagen 3 juga akan hadir di Vertex AI musim panas ini.
18. Lalu kami mengumumkan Veo , model pembuatan video kami yang paling mumpuni. Ini menghasilkan video resolusi 1080p berkualitas tinggi yang dapat berdurasi lebih dari satu menit, dalam berbagai gaya sinematik dan visual.
19. Kami juga akan menghadirkan beberapa kemampuan Veo ke YouTube Shorts dan produk lainnya di masa mendatang.
20. Kami memamerkan apa yang Veo dapat bantu para seniman lakukan dengan berkolaborasi dengan pembuat film — termasuk Donald Glover, yang bereksperimen dengan Veo untuk sebuah proyek film.
21. Kami menyoroti Music AI Sandbox , seperangkat alat AI musik yang memungkinkan orang membuat bagian instrumental baru dari awal, mentransfer gaya antar pelacak, dan banyak lagi. Anda dapat menemukan beberapa lagu baru dari kolaborasi ini — termasuk satu dari Wyclef Jean dan satu lagi dari Marc Rebillet — di YouTube sekarang.
22. Dan pastikan untuk melihat Infinite Wonderland , sebuah pengalaman di mana seniman dan materi iklan Google bereksperimen bersama untuk menyempurnakan model AI guna menata ulang dunia visual novel “Alice's Adventures in Wonderland” tanpa henti. Pembaca Infinite Wonderland dapat menghasilkan gambar yang tampaknya tak terbatas untuk masing-masing dari 1.200 kalimat dalam buku berdasarkan gaya masing-masing artis.
23. Kami mengumumkan VideoFX , alat eksperimental terbaru kami yang menggunakan model video generatif Google DeepMind, Veo, dan memungkinkan Anda mengubah ide menjadi klip video.
24. Ini juga dilengkapi dengan mode Storyboard yang memungkinkan Anda mengulangi adegan demi adegan dan menambahkan musik ke video akhir Anda.
25. Kami menambahkan lebih banyak kontrol editorial ke ImageFX — permintaan fitur teratas dari komunitas — sehingga Anda dapat menambah, menghapus, atau mengubah elemen hanya dengan menyapukan gambar Anda.
26. ImageFX juga akan menggunakan Imagen 3 untuk membuka lebih banyak fotorealisme dengan detail yang lebih kaya dan artefak visual yang lebih sedikit serta rendering teks yang lebih akurat.
27. MusicFX memiliki fitur baru yang disebut “Mode DJ” yang membantu Anda memadukan irama dengan menggabungkan genre dan instrumen, menggunakan kekuatan AI generatif untuk menghidupkan cerita musik.
28. Mulai minggu ini, ImageFX dan MusicFX kini tersedia di lebih dari 100 negara melalui Labs.
Cara baru untuk menyelesaikan lebih banyak hal dengan aplikasi Gemini.
29. Kami menghadirkan Gemini 1.5 Pro, model mutakhir kami, kepada pelanggan Gemini Advanced — yang berarti Gemini Advanced kini memiliki jendela konteks 1 juta token dan dapat melakukan hal-hal seperti memahami 1.500 halaman PDF.
30. Ini juga berarti Gemini Advanced kini memiliki jendela konteks terbesar dari semua chatbot yang tersedia secara komersial di dunia.
31. Kami menambahkan kemampuan untuk mengunggah file melalui Google Drive atau langsung dari perangkat Anda langsung ke Gemini Advanced.
32. Gemini Advanced akan segera membantu Anda menganalisis data untuk mengungkap wawasan dengan cepat dan membuat bagan dari file data yang diunggah seperti spreadsheet.
33. Berita bagus untuk wisatawan: Gemini Advanced memiliki fitur perencanaan baru yang lebih dari sekadar daftar aktivitas yang disarankan dan benar-benar akan membuat rencana perjalanan khusus hanya untuk Anda.
34. Lalu ada Gemini Live untuk pelanggan Gemini Advanced, pengalaman percakapan baru yang mengutamakan seluler yang menggunakan teknologi ucapan tercanggih untuk membantu Anda melakukan percakapan lisan yang lebih alami dan intuitif dengan Gemini.
35. Gemini Live memungkinkan Anda memilih dari 10 suara yang terdengar alami yang dapat ditanggapi oleh Anda; ditambah lagi, Anda dapat berbicara sesuai kecepatan Anda sendiri atau menyela di tengah respons dengan pertanyaan klarifikasi.
36. Gemini di Google Messages sekarang memungkinkan Anda mengobrol dengan Gemini di aplikasi yang sama tempat Anda mengirim pesan kepada teman-teman Anda.
37. Pelanggan Gemini Advanced akan segera dapat membuat Permata, versi Gemini yang disesuaikan dan dirancang untuk apa pun yang Anda impikan. Cukup jelaskan apa yang Anda ingin Permata Anda lakukan dan bagaimana Anda ingin Permata tersebut meresponsnya, dan Gemini akan mengambil instruksi tersebut dan membuat Permata untuk kebutuhan spesifik Anda.
38. Dan nantikan lebih banyak alat Google yang terhubung ke Gemini, termasuk Google Kalender, Tugas, Keep, dan Jam.
Pembaruan yang membuat Penelusuran bekerja untuk Anda
39. Kami menggunakan model Gemini baru yang disesuaikan untuk Google Penelusuran guna menyatukan kemampuan lanjutan Gemini — termasuk penalaran multi-langkah, perencanaan, dan multimodalitas — dengan sistem Penelusuran kami yang terbaik di kelasnya.
40. Ikhtisar AI dalam Penelusuran diluncurkan ke semua orang di AS mulai minggu ini dan segera hadir di lebih banyak negara.
41. Dan kemampuan penalaran multi-langkah akan segera hadir di Ikhtisar AI di Lab Penelusuran untuk kueri bahasa Inggris di AS. Jadi, daripada memecah pertanyaan Anda menjadi beberapa penelusuran, Anda dapat mengajukan pertanyaan rumit seperti “temukan studio yoga atau pilates terbaik di Boston dan tunjukkan detail tentang penawaran perkenalan mereka dan waktu berjalan kaki dari Beacon Hill.”
42. Segera, Anda akan dapat menyesuaikan Ikhtisar AI Anda dengan opsi untuk menyederhanakan bahasa atau menguraikannya secara lebih rinci, ketika Anda baru mengenal suatu topik atau mencoba memahami inti suatu subjek.
43. Pencarian juga mendapatkan kemampuan perencanaan baru. Misalnya, perencanaan makan dan perjalanan dengan penyesuaian akan diluncurkan akhir tahun ini di Lab Penelusuran, segera diikuti oleh lebih banyak kategori seperti pesta dan kebugaran.
44. Berkat kemajuan dalam pemahaman video, kini Anda memiliki kemampuan untuk mengajukan pertanyaan dengan video. Penelusuran dapat menjawab pertanyaan visual yang rumit dan memecahkannya untuk Anda, lalu menjelaskan langkah selanjutnya dan menawarkan sumber daya dengan Ikhtisar AI.
45. Dan dalam waktu dekat, AI generatif dalam Penelusuran juga akan membuat halaman hasil yang diatur oleh AI saat Anda mencari ide-ide segar. Halaman hasil pencarian yang diatur oleh AI ini akan tersedia saat Anda mencari kategori seperti makan, resep, film, musik, buku, hotel, belanja, dan banyak lagi.
Bantuan dari model Gemini di Ruang Kerja dan Foto
46. Gemini 1.5 Pro kini tersedia di panel samping di Gmail, Dokumen, Drive, Slide, dan Spreadsheet melalui Workspace Labs — dan akan diluncurkan ke pelanggan Gemini for Workspace dan pelanggan Google One AI Premium bulan depan.
47. Anda dapat menggunakan panel samping Gmail untuk meringkas email guna mendapatkan detail dan item tindakan yang paling penting.
48. Selain ringkasan, aplikasi seluler Gmail akan segera menggunakan Gemini untuk dua fitur baru lainnya: Balasan Cerdas Kontekstual dan Tanya Jawab Gmail.
49. Dalam beberapa minggu mendatang, Bantu saya menulis di Gmail dan Dokumen akan mendukung bahasa Spanyol dan Portugis.
50. Akhir tahun ini di Labs, Anda bahkan dapat meminta Gemini untuk mengatur lampiran email secara otomatis di Drive, membuat lembar berisi data, lalu menganalisisnya dengan Tanya Jawab Data.
51. Fitur eksperimental baru di Google Foto yang disebut Tanya Foto semakin memudahkan untuk mencari kenangan tertentu atau mengingat informasi yang disertakan dalam galeri Anda. Fitur ini menggunakan model Gemini dan akan diluncurkan dalam beberapa bulan mendatang.
52. Anda juga dapat menggunakan Ask Photos untuk membuat galeri sorotan dari perjalanan baru-baru ini, dan bahkan akan menuliskan teks hasil personalisasi untuk Anda bagikan di media sosial.
Kemajuan Android
53. Dimulai dengan Pixel akhir tahun ini, Gemini Nano — model fondasi bawaan perangkat Android — akan memiliki kemampuan multimodal. Selain memproses masukan teks, ponsel Pixel Anda juga akan dapat memahami lebih banyak informasi dalam konteks seperti pemandangan, suara, dan bahasa lisan.
54. Talkback, fitur aksesibilitas untuk perangkat Android yang membantu penyandang tunanetra dan gangguan penglihatan menggunakan sentuhan dan umpan balik lisan untuk berinteraksi lebih baik dengan perangkat mereka, ditingkatkan berkat Gemini Nano dengan Multimodalitas.
55. Fitur perlindungan penipuan baru yang akan menggunakan AI pada perangkat Gemini Nano untuk membantu mendeteksi panggilan telepon penipuan dengan cara yang menjaga privasi. Nantikan detail selengkapnya akhir tahun ini.
56. Kami mengumumkan bahwa Circle to Search saat ini tersedia di lebih dari 100 juta perangkat Android, dan kami akan menggandakannya pada akhir tahun ini.
57. Segera, Anda akan dapat menggunakan Gemini di Android untuk membuat dan menarik dan melepas gambar yang dihasilkan ke Gmail, Google Message, dan lainnya, atau bertanya tentang video YouTube yang Anda lihat.
58. Jika Anda memiliki Gemini Advanced, Anda juga akan memiliki opsi untuk “Tanyakan PDF ini” untuk mendapatkan jawaban dengan cepat tanpa harus menelusuri beberapa halaman.
59. Siswa sekarang dapat menggunakan Circle to Search untuk bantuan pekerjaan rumah langsung dari ponsel dan tablet Android tertentu. Fitur ini didukung oleh LearnLM — rangkaian model baru kami berdasarkan Gemini, yang disesuaikan untuk pembelajaran.
60. Akhir tahun ini, Circle to Search akan mampu memecahkan masalah yang lebih kompleks yang melibatkan rumus simbolik, diagram, grafik, dan banyak lagi.
61. Oh, dan kami memperkenalkan Android 15 beta kedua.
62. Kunci Deteksi Pencurian menggunakan Google AI yang kuat untuk mendeteksi jika perangkat Anda telah dirampas dan dengan cepat mengunci informasi di ponsel Anda.
63. Ruang pribadi akan hadir di Android 15, yang memungkinkan Anda memilih aplikasi agar tetap aman di dalam ruang terpisah yang memerlukan lapisan autentikasi tambahan untuk dibuka.
64. Dan jika layar kunci terpisah tidak cukup untuk ruang pribadi Anda, Anda dapat menyembunyikan keberadaannya sama sekali.
65. Pada akhir tahun ini, Google Play Protect akan menggunakan AI pada perangkat untuk membantu mengenali aplikasi yang berupaya menyembunyikan tindakannya untuk melakukan penipuan atau phishing.
66. Kami menghadirkan pengalaman perpesanan terbaru ke Jepang dengan RCS di Google Message.
67. Di AS, Anda akan segera dapat membuat tiket versi digital yang hanya berisi teks. Cukup ambil foto tiket masuk (seperti kartu asuransi atau tiket acara) dan tambahkan dengan mudah ke Google Wallet Anda untuk akses cepat.
68. Kami menunjukkan bagaimana konten augmented reality akan tersedia langsung di Google Maps, meletakkan dasar bagi platform extended reality (XR) yang kami bangun melalui kerja sama dengan Samsung dan Qualcomm untuk ekosistem Android.
69. Kini Anda dapat mengikuti episode acara favorit Anda di Max dan Peacock atau memulai permainan Angry Birds di mobil tertentu yang dilengkapi Google.
70. Kami juga menghadirkan Google Cast ke mobil dengan Android Automotive OS, dimulai dengan Rivian dalam beberapa bulan mendatang, sehingga Anda dapat dengan mudah mentransmisikan konten video dari ponsel ke mobil.
71. Akhir tahun ini, pengoptimalan masa pakai baterai akan diterapkan pada jam tangan dengan Wear OS 5. Misalnya, lari maraton di luar ruangan akan mengonsumsi daya hingga 20% lebih sedikit jika dibandingkan dengan jam tangan dengan Wear OS 4.
72. Wear OS 5 juga akan memberikan aplikasi kebugaran opsi untuk mendukung lebih banyak jenis data seperti waktu kontak tanah, panjang langkah, dan osilasi vertikal.
73. Kini lebih mudah memilih tontonan di Google TV dan perangkat OS Android TV lainnya dengan deskripsi hasil personalisasi AI, berkat model Gemini kami.
74. Deskripsi yang dihasilkan AI ini juga akan mengisi deskripsi film dan acara TV yang hilang atau tidak diterjemahkan.
75. Inilah statistik menariknya: Sejak diluncurkan, orang telah membuat lebih dari 1 miliar koneksi Fast Pair.
76. Akhir bulan ini, Anda akan dapat menggunakan Fast Pair untuk menghubungkan dan menemukan item seperti kunci, dompet, atau koper Anda di aplikasi Temukan Perangkat Saya dengan tag pelacak Bluetooth dari Chipolo dan PebblePee (dengan lebih banyak mitra yang akan datang).
Perkembangan untuk pengembang.
77. Anda dapat bergabung dengan Kompetisi Pengembang API Gemini dan menjadi bagian dalam menemukan aplikasi AI yang paling berguna dan inovatif. Hadiahnya: DeLorean 1981 custom yang dipasang secara elektrik.
78. Kami memperkenalkan PaliGemma , model terbuka bahasa visi pertama kami yang dioptimalkan untuk tanya jawab visual dan teks gambar.
79. Kami mempratinjau versi Gemma berikutnya, Gemma 2. Ini dibangun dengan arsitektur yang benar-benar baru dan akan menyertakan contoh parameter 27B yang lebih besar yang mengungguli model dua kali ukurannya dan berjalan pada satu host TPU.
80. Model Gemini kini tersedia untuk membantu pengembang menjadi lebih produktif di Android Studio, IDX, Firebase, Colab, VSCode, Cloud, dan Intellj.
81. Gemini 1.5 Pro akan hadir di Android Studio akhir tahun ini. Dilengkapi dengan jendela konteks yang besar, model ini menghasilkan respons berkualitas lebih tinggi dan membuka kasus penggunaan seperti input multimodal.
82. Google AI Studio kini tersedia di lebih dari 200 negara termasuk Inggris dan UE
83. Pemanggilan fungsi paralel dan ekstraksi bingkai video kini didukung oleh Gemini API.
84. Dan dengan fitur cache konteks baru di API Gemini, yang akan hadir bulan depan, Anda akan dapat menyederhanakan alur kerja untuk permintaan besar dengan menyimpan file konteks yang sering digunakan dengan biaya lebih rendah.
85. Android kini menyediakan dukungan kelas satu untuk multiplatform Kotlin untuk membantu pengembang berbagi logika bisnis aplikasi mereka di seluruh platform.
86. Resizable Emulator, Mode pemeriksaan Compose UI, dan Streaming Perangkat Android yang didukung oleh Firebase adalah produk baru yang semuanya dapat membantu pengembang membangun untuk semua faktor bentuk.
87. Dimulai dengan Chrome 126, Gemini Nano akan diintegrasikan ke dalam klien Chrome Desktop.
88. Lihat Transitions API untuk aplikasi multi-halaman, fitur yang banyak diminta, kini tersedia sehingga pengembang dapat dengan mudah membangun navigasi seperti aplikasi yang lancar dan lancar, apa pun arsitektur situsnya.
89. Project IDX, pengalaman pengembang terintegrasi baru kami untuk aplikasi multiplatform full-stack, kini terbuka untuk dicoba semua orang.
90. Firebase merilis Firebase Genkit dalam versi beta, yang akan semakin memudahkan pengembang untuk membangun pengalaman AI generatif ke dalam aplikasi mereka.
91. Firebase juga merilis Firebase Data Connect, cara baru bagi pengembang untuk menggunakan SQL dengan Firebase (melalui Google Cloud SQL). Hal ini tidak hanya akan menghadirkan alur kerja SQL ke Firebase, namun juga mengurangi jumlah kode aplikasi yang perlu ditulis oleh developer.
92. Kami mengajak para pengembang untuk berdiskusi mendalam tentang teknologi dan penelitian yang mendukung AI kami bersama James Manyika, Jeff Dean, dan Koray Kavukcuoglu.
Kemajuan AI yang bertanggung jawab
93. Kami meningkatkan kerja sama tim merah — sebuah praktik yang telah terbukti di mana kami secara proaktif menguji kelemahan sistem kami sendiri dan mencoba memecahkannya — melalui teknik baru yang kami sebut “Tim Merah Berbantuan AI”.
94. Kami juga memperluas SynthID ke dua modalitas baru: teks dan video.
95. Watermarking teks SynthID juga akan menjadi sumber terbuka dalam beberapa bulan mendatang melalui perangkat AI Generatif Bertanggung Jawab kami yang telah diperbarui.
96. Kami mengumumkan LearnLM, rangkaian model baru berdasarkan Gemini dan disesuaikan untuk pembelajaran. LearnLM telah mendukung berbagai fitur di seluruh produk kami, termasuk Gemini, Penelusuran, YouTube, dan Google Kelas.
97. Kami akan bermitra dengan para ahli dari institusi seperti Columbia Teachers College, Arizona State University, NYU Tisch, dan Khan Academy untuk menyempurnakan dan memperluas LearnLM di luar produk kami.
98. Dan kami juga bekerja sama dengan MIT RAISE untuk mengembangkan kursus online yang membekali pendidik untuk menggunakan AI generatif secara efektif di kelas.
99. Kami telah membuat alat eksperimental baru yang disebut Illuminate untuk membuat pengetahuan lebih mudah diakses dan dicerna.
100. lluminate dapat menghasilkan percakapan yang terdiri dari dua suara yang dihasilkan AI, memberikan gambaran umum tentang wawasan utama dari makalah penelitian. Anda dapat mendaftar untuk mencobanya hari ini di labs.google.
Simak videonya di bawah ini: