Masa Depan AI Generatif dalam Analisis Video Menggunakan NVIDIA Jetson Orin

Deskripsi postingan blog

Kunzang

9/18/20244 min baca

Masukkan teks di sini...Analisis video, dalam ekosistem AIoT, memainkan peran penting dalam mengubah data video mentah menjadi wawasan yang dapat ditindaklanjuti dengan teknik dasar seperti deteksi wajah dan deteksi gerakan, yang ditujukan untuk mengidentifikasi dan menafsirkan elemen visual dasar dalam aliran video, sehingga meningkatkan pengambilan keputusan, efisiensi operasional, dan keamanan di berbagai sektor.

Dengan memadukan kemampuan pemrosesan AI dengan jaringan perangkat IoT yang luas, analitik video memungkinkan pemantauan dan analisis waktu nyata untuk berbagai aplikasi mulai dari perencanaan kota dan manajemen lalu lintas hingga analitik ritel, perawatan kesehatan, dan keselamatan industri. Analitik video dalam AIoT terletak pada kemampuannya untuk memanfaatkan sinergi antara kekuatan analitis AI dan kecakapan pengumpulan data IoT, yang mengarah ke langkah berikutnya dari solusi pemantauan dan pengambilan keputusan yang cerdas.

Menggabungkan AI Generatif: dari Deteksi hingga Interpretasi

Nah, saat ini, kita tidak puas hanya dengan mendeteksi tindakan yang dapat dipicu. Semakin banyak ide dan aplikasi yang muncul menggunakan model Bahasa Besar (LLM) , yang meningkatkan analisis video dengan membuat sistem lebih akurat dan mudah digunakan.

Bagaimana Generative AI Memberdayakan Analisis Video

AI Generatif memperkenalkan jenis metode baru yang membantu kita memahami dunia dengan cara yang sebelumnya tidak dapat kita lakukan. Model-model ini hebat dalam bekerja dengan masukan bahasa alami dan dapat membantu kita memahami konten dengan lebih baik, termasuk gambar dan video. Model-model ini sangat bagus dalam belajar dengan cepat dengan pelatihan masukan data zero-shot atau few-shot, yang mengubah cara kita berinteraksi dengan konten digital, membuatnya lebih mudah diakses dan dipahami.

LLM memainkan peran penting dalam perubahan ini. Ini adalah model AI yang hebat dalam konteks pemrosesan bahasa alami dan pembelajaran mesin. Dilatih secara ekstensif pada beragam data tekstual, model ini unggul dalam memahami dan menghasilkan bahasa seperti manusia. Anda dapat dengan mudah memfasilitasi model ini untuk:

  • menganalisis dan menghasilkan deskripsi dari konten video

  • memfasilitasi fungsi pencarian intuitif melalui kueri suara atau teks

  • meningkatkan aksesibilitas dan pengelolaan data video dengan menerjemahkan konten visual ke dalam bahasa yang mudah dipahami.

Integrasi LLM dengan platform analitik video memperkaya interaksi pengguna dan meningkatkan otomatisasi peringkasan konten, membuat data video lebih mudah dicari, diakses, dan ditindaklanjuti untuk beragam aplikasi mulai dari keamanan hingga analisis perilaku pelanggan ritel dan seterusnya.

Interpretasi Mendalam dengan Memanfaatkan TinyML dan LLM Bersama-sama

Seperti yang kami pamerkan baru-baru ini di NVIDIA GTC 2024, kami menyatukan kemampuan TinyML dengan penerapan LLM, menghadirkan sistem AI ringan yang canggih dengan analisis mendalam dan sadar konteks yang dapat diperluas dari edge ke cloud:
●TinyML hadir melalui sensor daya sangat rendah, termasuk kamera dan perangkat yang menangkap data lingkungan dan otoritas. Sensor ini memasukkan data yang diproses dan disederhanakan langsung ke LLM kami.
●Berjalan pada perangkat edge yang didukung oleh Jetson Orin NX , LLM memberikan wawasan canggih dan sadar konteks serta respons waktu nyata, meningkatkan persepsi pemandangan dengan lapisan kompleksitas.
●AWS mendukung sistem ini, menyediakan infrastruktur yang diperlukan untuk penerapan, manajemen, dan skalabilitas. Secara paralel, Node-RED menyediakan antarmuka kohesif yang menyatukan komponen dan layanan yang berbeda, membentuk jaringan perangkat yang kohesif.

Dapatkan Pengalaman Langsung Jetson Orin untuk Mengalami TinyML & LLM

ML kecil

Untuk menangani tugas deteksi AI penglihatan sederhana, tinyML dengan komponen AI tertanam dapat menghemat banyak biaya! Lihat SSCMA kami – proyek sumber terbuka yang mengumpulkan algoritme AI yang dioptimalkan yang dirancang untuk berjalan secara efektif pada perangkat kelas bawah sambil mempertahankan kecepatan dan akurasi yang mengesankan. Algoritme ini mencakup berbagai aplikasi mulai dari deteksi abnormal hingga estimasi pose dan bahkan identifikasi khusus yang disesuaikan dengan kebutuhan spesifik. Bagi mereka yang tertarik untuk mengeksplorasi solusi AI ini, SSCMA tersedia di GitHub , bersama dengan kebun binatang model yang komprehensif untuk akses langsung.

Hidup Llava

Perangkat Jetson Orin edge meningkatkan kemampuan ini lebih jauh dengan memproses dan menyimpulkan bingkai utama yang diidentifikasi dengan kelainan atau peristiwa penting melalui gambar atau aliran video langsung. Dengan memanfaatkan Live Llava pada Jetson AGX Orin , pengembang dapat memperoleh pemahaman yang lebih mendalam tentang berbagai situasi melalui jalur multimoda dan Vision and Language Models (VLM). Pengaturan ini memungkinkan analisis konten video yang lebih bernuansa dan komprehensif, mengekstraksi informasi penting untuk pencarian dan interpretasi konten tingkat lanjut.

TinyML x LLM lokal – Bangun Pusat Kontrol Rumah Pintar Anda

Menggabungkan LLM ke dalam tumpukan teknologi ini membuka kemungkinan baru untuk aplikasi di dunia nyata. Misalnya, dengan menggunakan LLM, kita dapat menginterpretasikan dan menjalankan perintah suara untuk mengendalikan sistem pencahayaan dalam ruangan, yang menunjukkan kegunaan praktis dari model canggih ini dalam skenario sehari-hari. Integrasi TinyML dan LLM yang mulus dengan perangkat canggih seperti Jetson Orin ini merupakan contoh teknologi AI mutakhir, yang menjembatani kesenjangan antara kecerdasan digital dan aplikasi dunia fisik.

Kesimpulan

Integrasi AIoT dengan analitik video, memanfaatkan LLM dan tinyML, menandai lompatan signifikan dalam mengubah data video menjadi wawasan yang dapat ditindaklanjuti. Integrasi ini meningkatkan pengambilan keputusan dan keamanan di berbagai sektor, dengan teknologi seperti yang dikembangkan oleh Seeed Studio yang menunjukkan potensi masa depan. Seiring dengan kemajuan yang kita capai, kemajuan dengan penerapan Jetson Edge ini menjanjikan untuk merevolusi cara kita berinteraksi dengan dan mengelola konten video, menyiapkan panggung untuk ekosistem yang lebih cerdas, lebih efisien, dan lebih privat.