コンピューター ビジョン (CV) は、人工知能の分野のサブドメインであり、機械がデジタル ビデオや画像のコンテンツを識別して理解できるようにすることを目的としています。簡単に言えば、CV により、マシンは人間と同じように世界を「見て」、その知識を使用して人間の努力を強化できるようになりました。この技術は、人間の目の代わりにカメラとコンピューターを使用して、さらなる画像処理のためにターゲットを識別、追跡、測定します。
コンピュータ ビジョン アプリケーションの例としては、複数のカメラを使用して他の車、自転車、歩行者、障害物などの周囲の環境を認識し、人間の介入なしに周囲をナビゲートする自動運転車や、iPhone が顔認識を使用する方法などがあります。携帯電話のロックを解除するのが本当にあなたであることを確認するため。コンピューター ビジョンは、世界中で研究開発が活発に行われている分野であり、より優れた CV アルゴリズム、ハードウェア プロセッサ、およびホスティング環境がほぼ毎週発表されています。
前述のように、CV によってマシンは人間と同じように世界を認識することができますが、マシンはマシンであるため、24 時間 365 日、人間よりもはるかに高速で非常に高速に動作し、人間の偏見や見落としなしで客観的に動作することができます。より高い精度でそれを行うことさえできます。また、テクノロジーの進歩に伴い、CV アプリケーションをエッジ デバイスで実行することも安価になり、世界中で広く採用されています。
CV は幅広いアプリケーションで使用されており (この記事の残りの部分ではユース ケースを詳しく説明します)、技術が成熟するにつれて、より多くのアプリケーションがすぐに使用可能になります。 Verified Market Researchの 2021 年のレポートによると、コンピューター ビジョンにおける AI の市場規模は 2020 年に 70 億米ドルと評価され、2028 年までに 1,440 億米ドルに達すると予測されており、2021 年から 2028 年にかけて 45% という驚異的な CAGR で成長すると予測されています。
企業は CV を使用して、反復的で、時間がかかり、主観的で、骨の折れる、退屈なタスクを自動化し、機械が客観的かつ非侵襲的な方法で適切に処理し、24 時間 365 日実行できるタスクに変換することで、コストを削減し、運用効率を高めることができます。休憩のためにいつでも停止する必要があり、あらゆる規模で展開されます。企業は、人間が実行できないペースと規模で、より優れた品質管理プロセスを実装できます。 CV を使用することで、企業は生産性を大幅に向上させ、売り上げを伸ばし、大幅に少ないリソースで指数関数的に短い時間でより多くのことを達成できます。
Edge CV は、エッジ デバイスで CV 計算を実行するだけです。クラウド コンピューティングとは対照的に、エッジ コンピューティングはワークロードをユーザーやデータ ソースに近づけます。そうすることで、リアルタイムのデータ処理と分析 (データがクラウド サーバーとの間を行き来する必要がないため、ネットワーク遅延の問題を回避できるため)、ネットワーク帯域幅の消費を最小限に抑え、エネルギー消費を削減し、計算効率を向上させるという大きな利点が得られます。 、サイバーセキュリティ体制を改善します。従来、エッジ デバイスは CV 計算に十分なほど強力ではなかったため、ほとんどの処理をクラウド内のマシンのクラスターに委任する必要がありました。しかし、最近のエッジ テクノロジーの進歩により、処理能力は飛躍的に向上し、エネルギー効率も向上しています。さらに、エッジのコンピューター ビジョンは、データがエッジ デバイスから決して離れないことを保証することで、プライバシーに関する懸念に対処し、世界中のプライバシー規制の状況を変えるのに役立ちます。
実店舗の小売業界は常に、顧客に最高の店内体験を提供して、バスケット サイズを最大化し、顧客を獲得および維持し、最終的に顧客ロイヤルティを高めようとしています。 CV を使用すると、時間のかかる技術を必要とせずに、自動化された方法で重要な洞察と分析を生成できます。人間のオブザーバーや高価な物理追跡デバイスを使用し、ダウンタイムやミスなしで 24 時間体制で実行できます。リピートの獲得にはニーズがあります… 店舗のオーナーは、来店数、顧客のタイプ (年齢、性別、グループのサイズなど) を知りたいと考えており、店舗で過ごす時間を最大化し、バスケットのサイズを最大化できるように関連付けます。
人数カウント:顧客のトラフィックを分析するために、リアルタイム ビデオで個々の人物を検出して追跡します。 COVID-19 のパンデミックで人数を数える方法が特に人気になり、パンデミックの拡大を防ぐために店舗内の人数が制限されました。ピープル カウントは、列に並んで待っている人の数を数えたり、ステーションをチェックアウトするためにより多くの人を割り当てるようマネージャーに通知したりするためにも使用できます。
顧客行動分析:顧客が店舗の特定のセクションに滞在し、特定のアイテムを閲覧する時間 (滞留時間) を追跡します。履歴書ベースのアプリケーションを使用して、関心のある領域または境界に注釈を付けたり、境界を越えた人の数、関心のある領域で過ごした時間を追跡したり、人々が店内をどのように移動するかを視覚化してどこに行くのかを追跡したりすることもできます。 .このような洞察により、ピーク時間とボトルネックも明らかになります。このような指標がすべての店舗に存在するようになると、管理者はさまざまな場所で主要な指標の比較を開始して、店舗のパフォーマンスを特定して改善できます。
人のヒートマップ: 時間の経過に伴う物理空間での個人の動きの視覚化を指します。他のエリアと比べて動きが多いエリアに色を割り当て、それを等高線図として視覚化することで、店舗の所有者は、他のエリアと比較してどのセクションがより多くの人出があるかをよりよく理解し、その情報を使用して製品の配置を最適化したり、ボトルネックを軽減したりできます。
労働安全:製造現場は、移動する機械、機器、および人で構成されており、事故のホットスポットです。 CV アプリケーションは、労働者の安全性を高め、危険な状況を特定し、事故をリアルタイムで防止すると同時に、生産性と効率を高め、業務中断のリスクを軽減するのに役立ちます。たとえば、CV は人間のぎこちない姿勢を検出するのに役立ち、怪我を防ぐために通知して修正することができます。
PPE (個人用保護具) の検出: CV を使用して、ヘルメット、目の保護具、ベストの検出などの使用を検出および監視できます。
掘削機、クレーン、発電機、トラクターなどの重建設機械の位置を特定し、作業員がそのような危険なエリアで作業していることを検出します。これらの自動検出は文書化することができ、違反を記録することができます。これにより、再発する違反者をより適切に訓練したり、解雇したり、工場や建設現場での安全プロトコルを更新したりできます。
世界中の政府は、人々の安全を確保し、犯罪者や加害者を検出し、公共施設やサービスをより簡単かつ便利に利用できるようにするために、テクノロジーを使用しようとしています。
ナンバー プレート認識 (LPR): CV テクノロジを使用して、リアルタイムでビデオ フィードから車両のナンバー プレートを読み取ります。 LPR 技術の最新の進歩により、複雑なシーンや照明の下で高速走行している車両でもナンバー プレートを読み取ることが可能になりました。 LPR は、料金収受システムや駐車場管理システム、交通違反の検出と特定、より多くのアプリケーションを使用した法執行機関、世界中で開発されている高性能でスケーラブルで低コストのソリューションですでに広く使用されています。
最適化された信号機:タイマーベースのロジックに頼る代わりに、CV を使用して、交通量の動きを自動的に検出し、キュー内の車両をカウントすることで交通量の動きを促進することができます。これにより、信号機を動的に最適化して、ピーク時のトラフィック スループットと非トラフィック スループットを向上させることができます。ピーク時間。
放棄された不審なオブジェクトの検出: CV テクノロジを使用して、公共の場所に置き去りにされた不審なオブジェクトを特定し、当局に警告を発して、必要に応じて人々を避難させ、人命や財産を失うことなくエリアを確保することができます。銃やナイフなどの武器もリアルタイムで検出でき、当局は迅速な対応と人命の損失について即座に警告を受けます。
駐車場の占有率: CV テクノロジを使用して車両をカウントすることで、駐車場をオンラインにすることができるため、車が駐車場に入る前に駐車場の空室状況を把握できるため、特にラッシュアワーの際に、無限ループや駐車スペースを探すのに膨大な時間を費やす必要がなくなります。このような情報は中継され、一般の人々が検索できるようになり、より効率的な交通の流れと予測可能な輸送につながるでしょう。
人と人員の安全、重要なインフラストラクチャ、および機器の保護のために物理的な空間を監視することは、CCTV 監視カメラ システムの古い用途の 1 つです。 CV は、人間の介入なしにリアルタイムで侵入を自律的に検出して対応することにより、システムの能力を大幅に強化しました。最新の物理的セキュリティ システムは、緊急サービスの派遣を自動的に要求したり、混乱が生じた場合は人間による検証を要求したりできるほどインテリジェントです。
人物と車両の検出:カメラ (またはクラウド) で実行される CV アルゴリズムは、カメラが捉えたすべてのオブジェクト (人物または車両) を自動的に検出してタグ付けできます。これには、人物のスナップショットの保存も含まれます。オペレータは、1 人または複数の人または車両を対象人物 (PoI) または対象車両 (VoI) としてタグ付けできます。次に人や車両がカメラに映ったときに、オペレーターは適切な対応を自動的に警告されます。
属性ベースの検索:服の色、性別、身に着けているアクセサリー、車の色、メーカー、モデルで人物を検索できるため、何日にもわたる映像をスクロールする代わりに、記録された映像から人物を簡単に見つけることができます。
複数のカメラでの検索: CV テクノロジを使用すると、場所にあるすべてのカメラで人や車両を検索できます。これは、迅速な調査解決のためにイベントのフォレンジック タイムラインを作成するのに非常に役立ちます。
顔の一致: CV モデルを使用して顔を一致させ、類似性を判断し、2 つの写真が同一人物のものかどうかを識別できます。これを使用して、特定の人物が CCTV カメラによって数日間にわたって発見されたすべてのインスタンスを見つけることができます。
顔のぼかし:スマートな顔のぼかしを使用して、セキュリティ テープ内の関係のないすべての人物の顔を検出してぼかし、プライバシーを保護できます。
CV は、スマート ファームや牧場を実現する上で重要な役割を果たします。特に、家畜の検出、追跡、さらには健康状態の監視にも使用されます。限られた土地と資源に対して、拡大する世界人口を養い続けなければならないという圧力が高まっています。同時に、持続可能な畜産物に対する需要は、労働コストの急速な上昇と労働者不足と相まって、より高い運用効率を実現できる技術に対する需要を大幅に高めています。従業員ベースを大幅に縮小し、低コストで生産性を向上させます。複数の静的カメラを使用したり、UAV を使用したりすることもできます。それは、監視する領域のサイズに依存します
CV は、患者の健康状態のモニタリングから環境分析、フィットネス、トレーニング、ワークアウト コーチングなどの商用利用まで、幅広いヘルスケア アプリケーションで大きなメリットをもたらします。利点は、これが 24 時間 365 日、就寝中の係員、人間の監視、深夜労働を心配することなく実行できることです。何よりも、オンデバイス処理によって患者のプライバシーを保護し、いつでもカメラから映像を残すことができません。
転倒検知:転倒は世界的に大きな問題であり、転倒の 30% が重傷を引き起こしているため、今日の高齢化社会で転倒検知が急速に採用されているのは当然のことです。病室にカメラを設置し、転倒や滑りなどの急な変化を含めた患者の動きを監視。転倒が検出された場合、事故を把握するために人間の入力や定期的なチェックインに頼る代わりに、担当者にすぐに通知できるため、迅速な治療と迅速な回復につながります。何よりも、CV ベースの落下検出は、セットアップや高価なウェアラブルを必要とせず、それらのデバイスが侵襲的であるか、充電が必要であるか、単に忘れられているかを心配する必要がありません.
姿勢認識:横になっている、寝ている、座っている、歩いている、立っているなど、さまざまな姿勢で人体を検出します。健康と活動に関する総合的なレポートを作成するために、歩く、座る、立つなどのさまざまな活動に費やされた時間を測定する必要がある医療アプリケーション。
社会的距離の監視とマスクの検出:最近のパンデミックにより、ほとんどの政府および規制機関は、公共の場で 6 フィートの距離を維持し、マスクを着用することを推奨しました。履歴書ベースのテクノロジーは、これらの規制に対する人間の違反を簡単に検出し、関係者に警告したり、当局に自動的に警告したりできます。
フィットネスおよびオンライン ワークアウト コーチング:最近の家庭用ワークアウト デバイスの急増は、さまざまなワークアウト中の姿勢を検出し、怪我を防ぎ、ワークアウトを最大限に活用するための修正を推奨するために CV に依存しています。
リアルタイムで顔を検出してぼかす: CV を使用して人間の顔を検出し、プライバシーを保護するために選択的にぼかすことができます。このようなツールは、インシデントに関与していない人のプライバシーが保護されるように、ビデオや証拠を当局と共有する際のインシデント対応に非常に役立ちます。