距離我們上次釋出文章已經幾周了,但 OpenCV AI 競賽 2021 的熱度絲毫未減!這篇文章中我們將分享一些亮點,以及對這場全球競賽中另外兩支優秀團隊的採訪。
在這篇文章中,我們將分享與一些團隊的簡短問答,這些團隊在 OpenCV AI 競賽 2021 中使用 #OAK2021 標籤在網上釋出了有趣的內容。非常感謝 EyeCan 和 Clara 團隊這次接受了我們的採訪!如果您想讓您的團隊出現在這裡,請透過 phil @ opencv.org 與我聯絡。如果您錯過了之前釋出的幾期系列文章,這些文章展示了來自競賽的團隊和精彩影片,請返回閱讀第 1 部分,第 2 部分 和 第 3 部分!
來自 #OAK2021 標籤的一些亮點

很多團隊都是第一次釋出內容,我們非常高興看到這一點!本次更新是我們迄今為止一次性看到最多新內容的更新。感謝大家的分享。
- Roc4t 團隊對牛的跟蹤和姿態估計
- Big Orange 機器人使用 SLAM 和 YOLO v4 將物品遞送給指定房間中以姓名識別的特定人員
- Calgary Storm 團隊使用 OAK-D 和 Jetson Nano 即時顯示 3D 物體
- Kauda 團隊展示了用於協作和工人安全的 Spatial MoveNet + Blaze Hands
- Cortic 團隊展示了多個 OAK-D 協同工作以提供即時駕駛反饋
- Cortic 團隊的魔鏡概念,他們一直在忙碌!
- SHL Robotics 自行駕駛機器人及其 2D 導航標記 展示了語義分割
- Deepflow Tesseract 團隊的四足農業機器人 獲得了 OAK-D 機器人手臂
- Calcutta Devs 團隊的即時瑜伽姿勢識別和估計
- Getafe Musarañas 團隊的多攝像頭左右 + 彩色 + 深度
與 EyeCan 團隊的問答

你們的專案是什麼?簡要描述一下你們的問題陳述和提出的解決方案
標記資料是當今調整基於 AI 的視覺系統的主要問題之一。eyecan.ai 正是解決這個問題的,它擁有一個已獲得專利的解決方案,可以利用機器人完全自動地標記資料。然而,在這個挑戰中,我們想知道是否可以使用簡單的傳送帶利用物體的運動和 RGB-D 感測器來做到這一點,以便在沒有人工干預的情況下生成用於訓練目標檢測器的標籤。我們的解決方案基於 TrinocularStereo 網路,直接部署在 OAK 晶片上,以便獲得在傳送帶上移動的物體的密集 3D 重建。透過 3D 重建,我們能夠單獨分割物體並生成標籤(邊界框和/或掩碼),然後訓練檢測器來識別它們。由於 OAK 的實用性(體積小且光學器件通用),我們可以以動態的方式(隨意移動它到場景中)使用這種型別的感測器,而不是傳統的一次性固定且無法移動的工業相機。
你們的團隊有有趣的“起源故事”嗎?你們是怎麼走到一起的?
我們是一支來自 eyecan.ai 和同一所大學的計算機視覺研究小組的團隊。我們一直都在處理目標檢測和立體視覺,在 OAK-D 中,我們找到了這兩個世界的完美結合體!
你們是如何決定要解決什麼問題的?
我們的問題來自市場需求。AI 的採用率很低,特別是在工業界,因為收集和標記資料的耗時長。雖然有許多初創公司在做資料標記,但工業界非常保守,不接受將影像公開給外部人員進行標註。另一個問題是,如果在資料標註迴圈中有人工參與,則時間會長得多,最終的系統肯定會包含錯誤,這會影響其效能。
#OAK2021 對你們來說最激動人心的部分是什麼?
這個挑戰讓我們認識了一些很棒的計算機視覺團隊和應用程式,這些是我們以前從未想到過的。看到許多團隊在挑戰期間開源了一些程式碼,儘管存在競爭,但仍然如此,這讓我們非常鼓舞,這也促使我們效仿!
當你們得知自己入選第二階段時,有什麼想法或感受嗎?
我們為入選感到非常自豪,因為這意味著我們的想法得到了認可,我們迫不及待地想要試用這款裝置,因為我們知道很多公司都渴望擁有它,而不是我們 🙂
到目前為止,這場比賽有什麼讓你們感到意外的嗎?
我們對其他團隊的創造力和計算機視覺在幾乎所有領域的應用感到非常驚訝
你們對其他參賽者有什麼想說的話嗎?
有太多團隊值得獲勝,我祝他們好運,對我們來說,真正的勝利是成為這個社群的一部分,並能夠與之分享。
讀者應該在哪裡關注你們,以便更好地瞭解你們的進展?(推特、領英等)
在領英上:https://www.linkedin.com/company/eyecan-ai
與 Clara 團隊的問答

你們的專案是什麼?簡要描述一下你們的問題陳述和提出的解決方案
我們的專案是為幫助演奏/學習特雷門的系統奠定基礎。特雷門的困難之處在於,至少從初學者角度來看,它沒有關於“音符”位置的任何物理反饋(與鋼琴、吉他,甚至小提琴之類的絃樂器相比)。這使得很難找到放置手指的位置來發出音符。如果在 AI 的幫助下,我們可以得到關於如何演奏樂器的提示,那該多好。這就是計算機視覺進入我們專案和我們為比賽提出的想法的地方。我們發現,這比我們最初想象的要困難一些。
你們的團隊有有趣的“起源故事”嗎?你們是怎麼走到一起的?
艾麗莎和我是多年的朋友。我們在大學裡認識,但只是泛泛之交。幾年後,我們再次相遇。她是職業音樂家,曾指揮樂隊和合唱團,而我正是其中一個合唱團的成員。我不是音樂家,但我對計算機音樂的愛好將我們聯絡在一起。
你們是如何決定要解決什麼問題的?
我們都對音樂感興趣。艾麗莎是音樂家和音樂教育家。我對計算機音樂很感興趣。特別是在我嘗試了很多年後,我仍然無法彈鋼琴,這讓我一直很沮喪。起初,當我看到比賽公告時,我想到了我一直都在思考的一個想法。它關於使用計算機視覺來衡量鋼琴學習者的表現(指法、動作、表現力等)。儘管如此,我進行了一些研究,發現這個問題對於一個為期 3 個月的比賽來說太難了。我原本打算放棄,但後來我想到了特雷門,我一直想嘗試的一種樂器。這時,我告訴艾麗莎我的想法,我們一起設法改變了專案的範圍和性質,並將其提交參賽。
#OAK2021 對你們來說最激動人心的部分是什麼?
這讓我有機會(和藉口)更多地瞭解 OpenCV 庫,學習如何使用 OAKD 裝置,同時意識到它為愛好者打開了多少可能性。在比賽的過程中,我提出了一些想法,我想在比賽結束後進一步開發。我們正在學習一些 Supercollider(一個計算機音樂框架),我想要測試 OAKD 在聲音設計中的使用者介面實驗。
當你們得知自己入選第二階段時,有什麼想法或感受嗎?
這是我第一次聽說 OpenCV 主辦的比賽,我以前也沒有為任何比賽提交過想法。所以我不知道結果會如何。我們能夠進入第二階段,這讓我很驚訝。當我們的工具包到達時,我們很興奮能贏得一些東西。
到目前為止,這場比賽有什麼讓你們感到意外的嗎?
首先,這場比賽的參賽數量非常驚人。這表明 AI 和 CV 越來越受到關注,併為想要開始嘗試的人群帶來了動力。另一方面,我發現 CV 中的一些事情比最初想象的要難。這時,一個支援性社群(主要是透過 Discord 頻道)對於培養一批強大的使用者至關重要。我認為我們都在學習和嘗試一些全新的東西,這真的很棒。
你們對其他參賽者有什麼想說的話嗎?
有時事情並不像預期的那樣進行,你可能會花幾個小時嘗試除錯或尋找解決方法。我的建議是:不要放棄。如果你卡住了,暫時停止思考這個專案,過一段時間你會發現自己有了新的想法。同時,發展那些與你個人興趣和愛好相輔相成的想法。對我們來說,就是關於音樂和教育。
讀者應該在哪裡關注你,以便最好地瞭解你的進展?
- 有關進度的新聞,請關注我們的 https://instagram.com/stories/elisa.andrade.fernandez/ (我們很快就會發布)
- 專案原始碼,目前位於 https://github.com/fortachong/clara
更多內容即將推出
感謝您閱讀我們團隊簡介系列的第四篇文章。這些只是參加這場大型比賽的 200 多個團隊中的一部分,我們祝他們一切順利!如果您是希望加入這場酷炫活動的人工智慧創作者,為什麼不從 OpenCV 商店 購買一個 OAK-D 呢?
敬請關注更多簡介,並在 Twitter 和 LinkedIn 上關注 #OAK2021 標籤,以獲取來自這些優秀團隊的持續更新。別忘了 訂閱 OpenCV 新聞稿 ,以便在釋出新文章時收到通知,並獲取來自我們合作伙伴的獨家折扣和優惠。
下次再見!






