Edge AI Đột Phá: Những Điểm Nổi Bật từ Embedded Vision Summit 2024
Khám phá trọng tâm của Embedded Vision Summit 2024 về tiềm năng cách mạng của AI đa phương thức và công nghệ biên.
Bài phát biểu chính của Yann LeCun tại Embedded Vision Summit cách đây một thập kỷ đã giới thiệu sức mạnh đột phá của mạng lưới thần kinh sâu (DNN) cho thị giác máy tính. Tác động của DNN đối với lĩnh vực này mang tính biến đổi. Ngày nay, chúng ta đang đứng trước một cuộc cách mạng khác với sự ra đời của mạng biến đổi, mô hình ngôn ngữ lớn (LLM), mô hình ngôn ngữ thị giác và mô hình đa phương thức lớn. Những công nghệ này hứa hẹn sẽ tạo ra các sản phẩm và hệ thống có khả năng cao hơn, thích ứng hơn, an toàn hơn và dễ sử dụng hơn trong hầu hết các ngành công nghiệp.
Embedded Vision Summit 2024, một sự kiện quan trọng dành cho các nhà đổi mới về thị giác máy tính và Edge AI, sẽ đi sâu vào tiềm năng biến đổi của các mô hình ngôn ngữ đa phương thức biên. Sự kiện năm nay hứa hẹn sẽ là nơi trưng bày những tiến bộ đột phá và ứng dụng thực tiễn.
Yong Jae Lee, phó giáo sư tại Đại học Wisconsin-Madison, sẽ có bài phát biểu chính về việc tạo ra các hệ thống thông minh có thể hiểu được thế giới đa phương thức với sự giám sát tối thiểu của con người. Bài trình bày của ông sẽ tập trung vào các hệ thống hiểu hình ảnh và văn bản và sẽ đề cập đến video, âm thanh và LiDAR. Những hiểu biết của Lee về các kỹ thuật mới nổi này sẽ giải quyết các nút thắt trong việc đào tạo mạng lưới thần kinh, tạo điều kiện cho các loại nhận thức máy đa phương thức mới và cho phép nhiều ứng dụng mới.
Jilei Hou, Phó chủ tịch Kỹ thuật và trưởng bộ phận Nghiên cứu AI tại Qualcomm Technologies, sẽ có bài phát biểu chuyên sâu. Ông sẽ phác thảo tầm nhìn của Qualcomm về các cơ hội do AI tạo sinh hiệu quả tại biên mang lại. Hou sẽ nêu ra những trở ngại chính của ngành và chia sẻ về những nỗ lực nghiên cứu và phát triển sản phẩm của Qualcomm. Bài phát biểu của ông sẽ đề cập đến việc thực thi hiệu quả trên thiết bị của LLM, mô hình thị giác lớn và mô hình đa phương thức, cũng như các phương pháp điều phối mô hình lớn tại biên và các phương pháp thích ứng và cá nhân hóa.
Một phiên thảo luận nhóm rất được mong đợi có tiêu đề “Multimodal LLMs at the Edge: Are We There Yet?”, bao gồm các chuyên gia từ Meta Reality Labs, Qualcomm Technologies, Useful Sensors và các nhà nghiên cứu. Họ sẽ khám phá vai trò đang phát triển của LLM đa phương thức trong các ứng dụng nhận thức máy móc tại biên, những thách thức khi vận hành và khả năng của phần cứng biên ngày nay. Những người tham dự có thể mong đợi một cuộc thảo luận sôi nổi và sâu sắc về tương lai của các LLM đa phương thức trong các ứng dụng thực tế.
Hội nghị thượng đỉnh cũng sẽ gồm một loạt các cuộc thảo luận về các ứng dụng thực tế của AI tạo sinh và LLM. István Fehérvári, nhà khoa học trưởng tại Ingram Technologies, sẽ có một bài nói chuyện về sức mạnh của các mô hình ngôn ngữ lớn đa phương thức trong AI nhận thức. Ông sẽ giải thích những nguyên tắc cơ bản của LLM, sự phát triển của chúng để tích hợp hiểu biết trực quan và bối cảnh hiện tại của các LLM đa phương thức. Fehérvári cũng sẽ thảo luận về các ứng dụng được kích hoạt bởi việc triển khai các mô hình này tại biên và những rào cản chính khi hiện thực hóa điều này.
Mehrsan Javan, CTO tại Sportlogiq,
sẽ trình bày một nghiên cứu trường hợp về việc sử dụng các hệ thống thị giác, mô hình tạo sinh và học tăng cường cho phân tích thể thao. Ông sẽ chia sẻ những thách thức gặp phải trong việc điều chỉnh các phân tích nâng cao cho các giải đấu chuyên nghiệp để tạo ra một sản phẩm cho thị trường thể thao dành cho giới trẻ. Những người tham dự sẽ tìm hiểu về cách Sportlogiq sử dụng các hệ thống thị giác, mô hình tạo sinh và học tăng cường để phát triển các sản phẩm cho thể thao dành cho giới trẻ và những bài học kinh nghiệm trong quá trình này.
Embedded Vision Summit 2024 sẽ tập trung vào AI tạo sinh và các mô hình ngôn ngữ đa phương thức. Với các diễn giả chuyên gia và các phiên thảo luận chuyên sâu, những người tham dự sẽ có được cái nhìn toàn diện về tiến bộ, thách thức và cơ hội mới nhất trong lĩnh vực đang phát triển nhanh chóng này. Các nhà đổi mới, nhà sáng tạo sản phẩm và kỹ sư sẽ có cơ hội tìm hiểu sâu về công nghệ tiên tiến cũng như những hiểu biết sẽ định hình tương lai của thị giác nhúng và AI.