TLDR: वे किसी भी कंपन सतह पर कैमरों और एक लेजर बीम का उपयोग करके ध्वनि का पुनर्निर्माण करते हैं, जिससे वे संगीत वाद्ययंत्रों को अलग कर सकते हैं, एक विशिष्ट स्पीकर पर ध्यान केंद्रित कर सकते हैं, परिवेशी शोर को हटा सकते हैं, और कई और अद्भुत अनुप्रयोग।
►पूरा लेख पढ़ें: https://www.louisbouchard.ai/cvpr-2022-best-paper /
शीनिन, मार्क और चैन, डोरियन और ओ'टोल, मैथ्यू और नरसिम्हन,
श्रीनिवास जी, 2022, डुअल-शटर ऑप्टिकल वाइब्रेशन सेंसिंग, प्रोक। आईईईई
सीवीपीआर।
प्रोजेक्ट पेज: https://imaging.cs.cmu.edu/vibration/
►माई न्यूज़लेटर (आपके ईमेल को साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/
0:00
इस साल मुझे cvpr . पर आने का मौका मिला
0:02
व्यक्तिगत रूप से और अद्भुत सर्वश्रेष्ठ में भाग लें
0:05
इसके साथ पेपर अवार्ड प्रेजेंटेशन
0:07
शानदार कागज़ पर मुझे कवर करना था
0:09
चैनल को ड्यूल शटर ऑप्टिकल कहा जाता है
0:12
मार्क शानिन डोरियन द्वारा कंपन संवेदन
0:15
चान मैथ्यू ओ'टोल और श्रीनिवास
0:18
नरसिम्हन एक वाक्य में वे
0:21
कैमरों का उपयोग करके ध्वनि का पुनर्निर्माण करें a
0:23
किसी भी कंपन सतह पर लेजर बीम
0:26
उन्हें संगीत को अलग करने की अनुमति देता है
0:28
उपकरण एक विशिष्ट वक्ता पर ध्यान केंद्रित करते हैं
0:30
परिवेशी शोर और बहुत कुछ हटा दें
0:33
अद्भुत अनुप्रयोग आइए जानें कैसे
0:35
वे इसे हासिल करते हैं और कुछ पागल सुनते हैं
0:37
परिणाम लेकिन पहले मुझे एक मिनट का समय दें
0:40
आपका समय एक से आपका परिचय कराने का है
0:41
शानदार कंपनी इसका प्रायोजक है
0:44
वीडियो असेंबली एआई असेंबली एआई है a
0:47
कंपनी जो के लिए सटीक एपीआई प्रदान करती है
0:49
टेक्स्ट और ऑडियो इंटेलिजेंस के लिए भाषण
0:52
आप स्वचालित रूप से उनके एपिस का उपयोग कर सकते हैं
0:54
ऑडियो को ट्रांसक्राइब करें और समझें और
0:56
कोड की कुछ ही पंक्तियों में वीडियो डेटा
0:58
और स्वचालित रूप से अतुल्यकालिक रूपांतरित करें
1:00
और टेक्स्ट में लाइव ऑडियो स्ट्रीम
1:03
करने के लिए बेहद चुनौतीपूर्ण कुछ
1:05
और आम तौर पर मजबूत और की आवश्यकता होती है
1:07
महंगा मॉडल बेशक यह रुकता नहीं है
1:10
यहां असेंबली एआई भी आपकी प्रक्रिया करेगी
1:12
ऑडियो डेटा और सूचनात्मक सुविधा है
1:15
प्रतिनिधित्व आपको आसानी से करने की अनुमति देता है
1:17
टेक्स्ट-आधारित सुविधाएँ जोड़ें जैसे
1:19
सारांश सामग्री मॉडरेशन विषय
1:21
पता लगाने और अधिक सभी एक में यदि आप
1:24
ऑडियो को समझने या ट्रांसक्रिप्ट करने की आवश्यकता है
1:26
या वीडियो डेटा के साथ विधानसभा एआई का प्रयास करें
1:29
पहला लिंक नीचे
1:33
आइए इस उदाहरण को सुनकर शुरू करते हैं
1:35
विधि क्या हासिल कर सकती है
1:38
[संगीत]
1:53
आप दोनों को स्पष्ट रूप से सुन सकते हैं
1:54
प्रत्येक ऑडियो ट्रैक में अलग-अलग गिटार
1:57
यह रिकॉर्ड की गई ध्वनि का उपयोग करके नहीं बनाया गया था
2:00
लेकिन एक लेजर और दो कैमरों से लैस
2:02
रोलिंग और वैश्विक शटर सेंसर के साथ
2:05
क्रमशः ऐसा लगता है कि इससे निपटने के लिए
2:08
दृष्टि के माध्यम से कार्य इसे बहुत आसान बनाता है
2:10
ऑडियो ट्रैक को विभाजित करने की कोशिश करने के बजाय
2:12
रिकॉर्डिंग के बाद इसका मतलब यह भी है कि हम कर सकते हैं
2:15
चश्मे के माध्यम से और से कुछ भी रिकॉर्ड करें
2:18
यहाँ कोई भी कंपन करने वाली वस्तु जिसका वे उपयोग करते हैं
2:21
वक्ताओं पर उनकी विधि स्वयं
2:23
बाएँ और दाएँ वक्ताओं को अलग करने के लिए
2:25
जबकि एक माइक्रोफ़ोन स्वचालित रूप से होगा
2:27
दोनों को रिकॉर्ड करें और ऑडियो ट्रैक्स को ब्लेंड करें
2:41
[संगीत]
2:45
आमतौर पर इस तरह की जासूसी तकनीक
2:48
जिसे विजुअल वाइब्रोमेट्री की आवश्यकता होती है
2:51
सही प्रकाश व्यवस्था की स्थिति और
2:52
उच्च गति वाले कैमरे जो एक जैसे दिखते हैं
2:54
उच्च गति पर कब्जा करने के लिए छलावरण स्नाइपर
2:56
यहाँ 63 किलोहर्ट्ज़ तक के कंपन
3:00
वे समान परिणाम प्राप्त करते हैं
3:02
केवल 60 और 130 हर्ट्ज़ के लिए बनाए गए सेंसर
3:06
और इससे भी बेहतर वे प्रक्रिया कर सकते हैं
3:08
एक साथ कई वस्तुएँ अभी भी यह है a
3:11
बहुत चुनौतीपूर्ण कार्य जिसमें बहुत अधिक की आवश्यकता होती है
3:13
इसे बनाने के लिए इंजीनियरिंग और महान विचार
3:16
ऐसा होता है कि वे केवल रिकॉर्ड नहीं करते हैं
3:18
उपकरण और वीडियो को a . पर भेजें
3:20
मॉडल जो स्वचालित रूप से बनाता है और
3:22
उस ऑडियो को अलग करता है जिसकी उन्हें सबसे पहले आवश्यकता होती है
3:24
उनके द्वारा प्राप्त लेजर को समझें और
3:26
इसे सही ढंग से संसाधित करें वे एक लेज़र को उन्मुख करते हैं
3:29
सतह पर सुनने के लिए तो यह
3:32
लेज़र सतह से a . में उछलता है
3:34
फोकस प्लेन यह फोकस प्लेन है जहां हम
3:37
से हमारी जानकारी नहीं लेंगे
3:39
यंत्र या वस्तुएं स्वयं तो हम
3:42
के छोटे कंपनों का विश्लेषण करेंगे
3:44
लेजर के माध्यम से रुचि की वस्तुएं
3:46
प्रतिक्रिया एक प्रतिनिधित्व बनाने की तरह
3:49
यह
3:50
यह द्वि-आयामी लेजर प्रतिक्रिया
3:52
हमारे कैमरों द्वारा काटे गए पैटर्न को a . कहा जाता है
3:54
धब्बेदार को तब विश्व स्तर पर संसाधित किया जाता है
3:58
और स्थानीय रूप से हमारे दो कैमरों का उपयोग करते हुए हमारे
4:01
स्थानीय कैमरा या रोलिंग शटर
4:03
कैमरा केवल 60 . पर फ़्रेम कैप्चर करेगा
4:06
एफपीएस तो यह कई तस्वीरें लेगा
4:08
और उन्हें y-अक्ष पर घुमाकर a . प्राप्त करें
4:11
वास्तव में शोर और गलत 63 किलोहर्ट्ज़
4:14
प्रतिनिधित्व यह वह जगह है जहाँ वैश्विक
4:16
शटर कैमरा आवश्यक है क्योंकि
4:18
धब्बेदार इमेजिंग में यादृच्छिकता
4:21
वस्तु के खुरदरेपन के कारण
4:23
सतह और उसके आंदोलनों यह होगा
4:25
मूल रूप से का वैश्विक स्क्रीनशॉट लें
4:27
उसी धब्बेदार छवि का उपयोग हमने अपने . के साथ किया
4:29
पहला कैमरा और इस नई छवि का इस्तेमाल किया
4:32
केवल अलग करने के लिए एक संदर्भ फ्रेम
4:34
रोलिंग से प्रासंगिक कंपन
4:37
शटर कैप्चर
4:38
रोलिंग शटर कैमरा नमूना करेगा
4:40
एक उच्च के साथ पंक्ति से दृश्य पंक्ति
4:42
आवृत्ति जबकि वैश्विक शटर
4:44
कैमरा पूरे दृश्य का नमूना लेगा
4:47
एक बार संदर्भ फ्रेम के रूप में काम करने के लिए और
4:49
हम इस प्रक्रिया को पूरी तरह से दोहराते हैं
4:51
वीडियो
4:52
और वोइला इस तरह से वे सक्षम हैं
4:55
एक रिकॉर्डिंग निकालने से विभाजित ध्वनि
4:57
केवल एक ही उपकरण परिवेश को हटाता है
5:00
शोर या यहां तक कि भाषण का पुनर्निर्माण
5:02
चिप्स के एक बैग का कंपन
5:05
मरियम के पास एक छोटा मेमना था यह पत्ता था
5:08
बर्फ की तरह सफेद बेशक यह सिर्फ एक है
5:10
इस महान पेपर का सरल अवलोकन और
5:12
मैं आपको इसे पढ़ने के लिए दृढ़ता से आमंत्रित करता हूं
5:14
अधिक जानकारी के लिए बधाई
5:16
माननीय उल्लेख के लिए अधिकारियों i
5:18
कार्यक्रम में शामिल होकर खुशी हुई
5:21
प्रस्तुति लाइव मैं इसके लिए बहुत उत्साहित हूं
5:23
भविष्य के प्रकाशन यह पेपर करेंगे
5:25
प्रेरित करें मैं आपको दोगुना करने के लिए भी आमंत्रित करता हूं
5:27
चिप्स के सभी बैगों की जांच करें
5:29
एक खिड़की के पास छोड़ दो या अन्यथा कुछ
5:31
लोग आपकी बात सुन सकते हैं धन्यवाद
5:34
आप पूरा वीडियो देखने के लिए और
5:36
मुझे पता है कि आप इस तकनीक को कैसे लागू करेंगे
5:38
और यदि आप कोई संभावित जोखिम देखते हैं या
5:40
रोमांचक उपयोग के मामले जिन पर मैं चर्चा करना पसंद करूंगा
5:42
ये आपके साथ और विशेष धन्यवाद
5:45
सीवीपीआर मुझे उस कार्यक्रम में आमंत्रित करने के लिए जो यह था
5:47
न्यू ऑरलियन्स में वहां रहना वाकई अच्छा है
5:49
सभी शोधकर्ताओं और कंपनियों के साथ i
5:52
अगले हफ्ते दूसरे के साथ मिलेंगे
अद्भुत कागज