我們很高興地宣佈 OpenCV 空間 Al 競賽 由英特爾贊助 結果。我們相信贏得比賽的人不僅是一些才華橫溢的 Al 工程師,而且是引領世界變得更美好的開拓者。祝賀所有獲獎者!
從眾多優秀作品中選出最佳作品並非易事,因此我們決定在金獎、銀獎和銅獎類別中分別選出兩位獲獎者。
我們的六位大獎得主
$3,000
通用手控
$3,000
$2,000
$2,000
居家鍛鍊助手
$1,000
自動割草機導航
$1,000
我們很高興看到來自所有
人工智慧和機器學習專家的眾多投稿。我們很高興向大家介紹參賽者提交的最佳專案,如下所示
視障人士視覺系統
團隊:Jagadish Mahendran
使命
這裡的重點是提供一個可靠的智慧感知系統,以幫助盲人和視障人士使用 OAK-D 感測器在各種室內和室外環境中安全行走。
解決方案
在這個專案中,該團隊為視障人士開發了一個全面的視覺系統,用於室內和室外導航,以及場景理解。開發的系統簡單、時尚,並且不易被察覺為輔助裝置。使用可以在低計算能力下執行的先進感知任務來解決常見的挑戰,例如交通標誌、懸掛障礙物、人行橫道檢測、移動障礙物和高程變化(例如樓梯檢測、路緣進入/退出)以及定位。方便的使用者友好的語音介面允許使用者控制和與系統互動。經過在加州蒙羅維亞市中心及其周邊地區進行數小時的測試後,我們相信該專案解決了視障人士面臨的常見挑戰。
"我要感謝 Daniel T. Barry 在整個專案中提供的幫助、支援和建議,感謝 Breean Cox 不斷提供的寶貴意見、標記以及對視障人士面臨的挑戰進行教育,感謝我的妻子 Anita Nivedha 的鼓勵,並與我一起不懈地收集資料集,幫助進行測試,"
作者筆記
專案動機
早在 2013 年,當我開始攻讀人工智慧碩士學位時,開發視覺輔助系統的想法就出現在我的腦海中。我甚至與一位教授分享了一個提議。當時使用智慧感測器的不可行性,再加上深度學習技術和邊緣 AI 在計算機視覺領域尚未普及,使得這個專案難以取得進展。過去 5 年,我一直是一名 AI 工程師。今年早些時候,當我遇到我的視障朋友 Breean Cox 時,我感到諷刺的是,當我一直在教機器人如何看時,還有很多人無法看到需要幫助。這更促使我構建視覺輔助系統。OpenCV 空間 AI 競賽的時機再好不過了,它為我構建這個系統並將這個想法變為現實提供了完美的渠道。
注意:我們正在撰寫一份更新的研究論文,其中將提供更多關於我們使命和我們建立的解決方案的見解,我們將在部落格上儘快釋出該論文。
通用手控
團隊:Pierre Mangeot
使命
解決方案
目前,OAK-D 用作 RGBD 感測器,但模型在主機上執行。一旦 Gen2 管道可用,模型將能夠在裝置本身執行。有關 Gen2 管道的詳細資訊和狀態,請關注下方給出的 GitHub 連結。
我們感謝 PINTO 的模型動物園儲存庫在開發這個專案中的幫助,該儲存庫幫助我們有效地調整了訓練模型的結果。
包裹分類和尺寸測量
團隊:Abhijeet Bhatikar、Daphne Tsatsoulis、Nils Heyman-Dewitte、William Diggin
使命
- 許多貨運公司沒有使用最新技術大規模準確測量貨物。他們最多隻描述貨物的寬度、高度和深度。在許多情況下,會使用手動捲尺進行這些估計。
- 即使他們以更精細的級別測量貨物,他們也總是將長方體放在不規則形狀的物體上。例如,圓柱形桶的尺寸是適合該桶的最近的 3D 立方體(寬度 x 長度 x 高度)。
解決方案
該團隊構建了一個端到端的概念驗證,用於測量貨物並將其裝入集裝箱。該解決方案利用 DepthAI USB3(OAK-D)相機來準確確定形狀,然後計算貨物運輸包裝的寬度、長度和高度。所有這些都可以由軟體工具(3D 集裝箱堆疊軟體)管理,該工具根據集裝箱的尺寸找到一批包裝的最佳排列方式。
自動叉車的即時感知
團隊:Kunal Tyagi、Kota Mogami、Francesco Savarese、Bhuvanchandra DV
使命
使用現代自動叉車的一個缺點是,由於在裝卸貨物時視野不佳,任何技術部件都可能發生故障。在很多情況下,自動叉車的技術故障將導致大量等待時間。
解決方案
該團隊提出了一個絕妙的解決方案,即用於自動叉車的即時感知,這將有助於解決這個問題。它將增強先進感測器以及視覺和地理引導技術的效能。許多行業以外的人不知道,物流中的自動車輛已經承擔了物流工作流程的重要部分。自動叉車在倉庫區域裝載、解除安裝和運輸貨物,透過相互連線形成靈活的輸送帶。因此,必須找到一種解決方案,可以提高自動叉車的整體效能,避免頻繁故障,並使其以全部潛力發揮作用。
"特別感謝 Ayush Gaud、Luong Pham、Kousuke Yunoki 和 Yu Okamoto
幫助完成這個專案。"作者筆記
居家鍛鍊助手
團隊:Daniel Rodrigues Perazzo、Gustavo Camargo Rocha Lima、
Natalia Souza Soares、Victor Gouveia de Menezes Lyra
使命
我們觀察到,由於今年健身房和公共場所的關閉,在保持社交距離的同時進行體育活動成為一項挑戰。然而,獨自鍛鍊也可能很複雜甚至很危險,有時甚至會導致可能的肌肉損傷。
解決方案
該團隊開發了一個家庭健身房系統運動分析 (MAHGS),以幫助使用者在居家鍛鍊時進行鍛鍊。在這個解決方案中,它會估算人的 3D 人體姿勢,並分析骨骼的運動,返回適當的反饋,以幫助使用者正確地進行鍛鍊。
該系統由兩個主要模組組成
- 3D 人體姿勢估計 - 它使用 OAK-D 的神經推理功能和 DepthAI 庫開發。人體姿勢估計模組將執行在與 OAK-D 連線的 PC/樹莓派 4 上,因為它還沒有 Wi-Fi 或藍牙。
- 運動分析 - 這是使用稱為 Ikapp 的技術實現的。運動分析模組將在智慧手機上執行,使用 TCP/IP 協議和 ZeroMQ 框架在這些裝置之間進行通訊。
自動割草機導航
團隊:Jan Lukas Augustin
使命
- 殺死刺蝟等小型動物。
- 傷害兒童、貓、狗等。
- 駛入土丘並撞擊“未連線電線”的障礙物,如樹木。
解決方案
- 在英特爾 Movidius Myriad X 上進行物體檢測的神經推理和 4K RGB 攝像頭。
- 基於單目攝像頭進行視差/深度流的點雲分類。
- 基於視差和校正後的右流的視差影像分類。
- 使用校正後的右流進行運動估計。
- 點雲(用於異常值檢測的橢圓包絡線)
- 視差(支援向量機)
- 物體(用於物體檢測的 Mobilenet-SSD)
我們感謝英特爾在邊緣 AI 方面的技術領導地位以及對本次比賽的贊助。
OpenCV



