Mengembangkan Aplikasi Vision AI dengan NVIDIA DeepStream Graph Composer

Pelajari cara membangun aplikasi Vision AI secara efisien menggunakan NVIDIA DeepStream Graph Composer—alat visual untuk menyusun pipeline AI di perangkat edge berbasis NVIDIA Jetson.

Seeed Studio AIoT Marketing and Partnership Diterjemahkan oleh : Digiware

4/9/20252 min baca

Bayangkan alur kerja saat mengembangkan aplikasi video analytics—dalam pikiran Anda pasti sudah tergambar pipeline pemrograman: mulai dari mengolah input stream, mendekodenya, mengirim ke proses inferensi, mengecek seberapa tinggi fps yang bisa dicapai, hingga akhirnya menampilkan hasil videonya. Proses yang mungkin berhasil, tapi sangat melelahkan 🙂 karena bisa memakan waktu berminggu-minggu, bahkan berbulan-bulan untuk menyelesaikan seluruh tahapan dan mengatasi berbagai kendala yang muncul.

Sedikit Tentang Graph Composer

NVIDIA Graph Composer: Solusi Visual untuk Membangun Pipeline Aplikasi AI

NVIDIA Graph Composer hadir sebagai metode visual programming yang kuat untuk membangun pipeline aplikasi AI melalui antarmuka grafis yang mudah digunakan. Alat low-code ini memungkinkan Anda membuat pipeline video analytics yang kompatibel dengan DeepStream cukup dengan menggabungkan komponen secara drag-and-drop.

Saat ini, NVIDIA telah menyediakan sejumlah model pra-latih yang siap digunakan langsung dalam pipeline Anda, seperti:

Untuk pengenalan orang/objek & analisis perilaku:

  • ClassDetectorModel

  • AudioClassifier

  • Facial Landmark

  • Gesture Recognition

  • ActionRecognitionNet

Untuk pemantauan lalu lintas & manajemen parkir:

  • VehicleMakeClassifier

  • VehicleTypeClassifier

  • CarColorClassifier

  • CarDetector360d

Membangun Aplikasi Video Analytics di Perangkat Edge

Sekarang, mari kita masuk ke demonstrasi nyata tentang deteksi lalu lintas orang untuk melihat secara langsung bagaimana Graph Composer memberikan manfaat nyata bagi para pengembang!

Kita mulai dengan single source input yang dapat berupa file video maupun RTSP stream. Input ini kemudian dihubungkan dengan Stream Muxer—komponen yang mampu menangani banyak input video secara bersamaan (seperti kita ketahui, bahkan perangkat edge sekecil Jetson Nano dapat memproses hingga 8 input streaming video sekaligus).

Muxer akan meneruskan sumber video tersebut ke tahap video inferencing, di mana kita memilih algoritma deteksi objek menggunakan model PeopleNet dari NGC model registry untuk diaplikasikan ke input video. Output dari tahap ini kemudian dibagi ke komponen Object Counter, yang berfungsi menghitung dan mengakumulasi jumlah setiap objek yang terdeteksi secara real-time.

Sementara itu, komponen On Screen Display (OSD) memungkinkan kita menggambar bounding box di atas objek-objek yang terdeteksi. Seluruh alur ini akhirnya mengarah ke NVIDIA Video Renderer, yang akan menampilkan hasilnya dalam bentuk visual. Anda juga dapat memantau kinerja analisis secara langsung melalui komponen FPS Measurement untuk melihat hasil eksekusi berdasarkan frame per second.

Setelah mengikuti seluruh alur kerja ini, Anda akan melihat betapa fleksibel dan mudahnya proses pengembangan menggunakan Graph Composer. Lingkungan pengembangan yang menyerupai IDE memungkinkan pengembang membangun aplikasi secara cepat, melakukan iterasi dengan mudah, dan menguji hasilnya secara langsung.