Mô hình mới này của Google Research và Đại học Tel-Aviv thật đáng kinh ngạc. MyStyle là một mô hình deepfake rất mạnh mẽ có thể làm bất cứ điều gì về cơ bản.
Chụp hàng trăm bức ảnh của bất kỳ người nào và bạn có mã hóa cá tính của người đó để sửa, chỉnh sửa hoặc tạo ra bất kỳ bức ảnh thực tế nào bạn muốn.
Điều này vừa đáng kinh ngạc vừa đáng sợ, nếu bạn hỏi tôi, đặc biệt là khi bạn nhìn vào kết quả. Xem video để biết thêm kết quả và hiểu cách hoạt động của mô hình!
►Đọc toàn bộ bài viết: https://www.louisbouchard.ai/mystyle/
►Nitzan, Y., Aberman, K., He, Q., Liba, O., Yarom, M., Gandelsman, Y.,
Mosseri, I., Pritch, Y. và Cohen-Or, D., 2022. MyStyle: A Personalized
Tạo trước. arXiv bản in trước arXiv: 2203.17272.
► Liên kết dự án: https://mystyle-personalized-prior.github.io/
►Code (sắp ra mắt): https://mystyle-personalized-prior.github.io/
►Bản tin của tôi (Một ứng dụng AI mới được giải thích hàng tuần cho email của bạn!): Https://www.louisbouchard.ai/newsletter/
0:00
mô hình mới này do nghiên cứu của google và
0:02
trường đại học tel aviv thật tuyệt vời bạn
0:05
có thể xem nó là một loại sâu rất mạnh
0:07
giả mà có thể làm bất cứ điều gì mất một trăm
0:10
hình ảnh của bất kỳ người nào và bạn có
0:12
nhân viên được mã hóa để sửa chữa chỉnh sửa hoặc tạo
0:15
bất kỳ hình ảnh thực tế nào bạn muốn đây là
0:18
cả tuyệt vời và đáng sợ nếu bạn hỏi tôi
0:20
đặc biệt là khi bạn nhìn vào kết quả
0:23
chỉ cần dành một giây để chiêm ngưỡng họ
0:36
[Âm nhạc]
0:50
mô hình chỉ đơn giản là sử dụng một
0:52
phong cách kiến trúc súng mà tôi đã đề cập
0:54
trong nhiều video nên tôi sẽ không tham gia
0:56
chi tiết của mạng này nhanh chóng được đánh dấu sao
0:58
súng có một hình ảnh mã hóa nó bằng cách sử dụng
1:01
mạng nơ-ron phức hợp và là
1:03
được đào tạo để tạo lại cùng một hình ảnh nếu
1:05
điều này nghe giống như một ngôn ngữ khác đối với bạn
1:08
chỉ cần dành hai phút để xem video
1:10
tôi đã chế tạo súng theo phong cách bao trùm
1:12
sau đó khi bạn đã được đào tạo tốt với
1:15
một tập hợp dữ liệu lớn của nhiều người mà bạn có thể
1:17
dạy nó biến đổi hình ảnh trực tiếp
1:20
từ không gian được mã hóa như tôi đã giải thích trong
1:22
video của tôi nên bạn không cần phải làm mờ nó
1:24
hình ảnh nữa mà bạn có thể chỉ cần chơi với
1:27
những gì chúng tôi gọi là máy phát điện, điều này có nghĩa là
1:29
bạn có thể dạy nó để thay đổi toàn bộ
1:31
hình ảnh như một sự chuyển giao phong cách
1:33
ứng dụng mà bạn muốn làm ví dụ
1:35
chụp một bức ảnh thực tế và mã hóa nó
1:38
hoặc bắt đầu ngay từ mã hóa và
1:40
biến nó thành một anime giống như kỹ thuật số
1:43
hình ảnh được đào tạo và thao tác đúng cách
1:45
bạn cũng có thể chỉ thay đổi một số địa phương
1:48
các đặc điểm như màu tóc hoặc
1:50
bất kỳ chỉnh sửa nào khác để làm cho bạn trông giống như bạn
1:52
tốt nhất
1:53
vì vậy mô hình mới này được gọi là phong cách của tôi sử dụng
1:56
mô hình cơ sở súng phong cách và sửa đổi nó
1:59
để đạt được không chỉ chuyển giao phong cách
2:01
nhiệm vụ nhưng bất kỳ nhiệm vụ nào có thể được liên kết
2:04
với khuôn mặt của bạn như tôi đã nói nó theo nghĩa đen
2:06
học cách bạn trông như thế nào và có thể làm đẹp
2:08
nhiều thứ trong bức tranh siêu
2:11
độ phân giải hoặc chỉnh sửa bức tranh tưởng tượng
2:13
là nơi bạn có một số đối tượng trong
2:15
bắn che mặt bạn và bạn sẽ loại bỏ
2:17
chủ đề từ bức tranh và làm cho
2:19
khuôn mặt của bạn xuất hiện trở lại giống như nếu bạn
2:22
kích hoạt tính minh bạch trong trò chơi điện tử để
2:24
nhìn xuyên qua bức tường của họ hình ảnh siêu
2:27
giải quyết là một thách thức vô cùng
2:29
nhiệm vụ khi cố gắng tổng quát hóa cho nhiều
2:31
những khuôn mặt khác nhau nhưng dễ dàng hơn nhiều khi bạn
2:33
tập trung vào một người ở đây mục tiêu là
2:36
chụp một hình ảnh có độ nét rất thấp và
2:38
nâng cấp nó lên độ phân giải cao để
2:41
về cơ bản bạn có một hình ảnh mờ
2:43
của chính bạn và bạn cố gắng làm cho nó trông
2:46
như thế này, bạn có thể thấy hai cái này như thế nào
2:48
ứng dụng khá khó khăn cho một
2:50
máy vì nó cần hiểu
2:52
người để lấp đầy khoảng trống lớn hoặc
2:55
thêm pixel để làm cho khuôn mặt trông sắc nét hơn
2:57
về cơ bản mô hình phải vừa là
2:59
người bạn rất thân của bạn và là một người tuyệt vời
3:02
nghệ sĩ đồng thời khi nó cần
3:04
biết khuôn mặt của bạn trông như thế nào từ bất kỳ
3:06
góc cũng như có thể vẽ nó
3:08
thực tế trong khi tôi sẽ luôn làm
3:11
hầu hết tôi có thể trở thành người bạn tốt nhất
3:13
có thể quên tôi vẽ một
3:15
phiên bản chính xác của khuôn mặt của bạn nếu bạn
3:17
muốn kết quả tốt đây chỉ là một
3:19
cấp độ để lấy cơ sở súng phong cách này
3:22
đào tạo với một tập dữ liệu chung khổng lồ về
3:24
hàng ngàn người và một trăm
3:26
hình ảnh của bạn phong cách của tôi sẽ học
3:29
một không gian được mã hóa duy nhất đối mặt với bạn
3:32
về cơ bản sẽ tìm thấy bạn trong
3:35
đại diện cho tất cả các khuôn mặt và được
3:37
được đào tạo lại để thúc đẩy mô hình tập trung vào
3:39
các tính năng khác nhau của bạn thì bạn sẽ
3:42
có thể cho nó ăn không đầy đủ hoặc không thành công
3:44
hình ảnh của bạn và yêu cầu nó sửa chữa
3:46
đối với bạn nó tuyệt vời như thế nào mà nó đòi hỏi
3:49
khá nhiều hình ảnh của bạn nhưng một
3:52
trăm bức tranh chỉ có nghĩa là một ngày trọng đại
3:54
bên ngoài với một người bạn và điện thoại của bạn để
3:56
có kết quả tốt hơn nhiều so với
3:58
các mô hình chung cố gắng tổng quát hóa thành
4:00
mọi người nó cũng rẻ hơn nhiều so với
4:02
thuê một chuyên gia về photoshop và
4:05
yêu cầu chỉnh sửa tất cả các hình ảnh trong tương lai của bạn
4:08
bạn vẫn có thể thấy loại mô hình này như thế nào
4:10
có thể gây nguy hiểm cho những người nổi tiếng hoặc
4:12
những người có nhiều hình ảnh trên instagram
4:15
ai đó có thể sử dụng chúng để đào tạo một người mẫu
4:17
và về cơ bản tạo ra siêu thực tế
4:19
hình ảnh của bạn trong việc thỏa hiệp
4:21
đây là lý do tại sao tôi thường nói như vậy
4:24
chúng tôi không thể tin tưởng những gì chúng tôi nhìn thấy nữa
4:26
đặc biệt là trên internet, chúng ta đừng
4:29
nghĩ về tất cả các vấn đề có thể xảy ra khi
4:31
nó cũng sẽ có trong thế giới thực với
4:33
Tuy nhiên, kính thực tế tăng cường
4:36
kết quả thật tuyệt vời và nhiều
4:38
tốt hơn những gì chúng ta đã thấy trước đây
4:40
xem xét nó chỉ cần một trăm
4:43
hình ảnh của bạn thay vì hàng giờ
4:45
quay video cho khuôn mặt sâu cũ hơn và
4:48
có ít hiện vật hơn nhiều
4:50
yêu cầu ít hình ảnh hơn chỉ thực hiện một
4:53
nhiệm vụ duy nhất và vớira đây là cách của tôi
4:57
tạo kiểu cho một mô hình mới từ nghiên cứu của Google
4:59
và trường đại học tel aviv có thể
5:01
thực hiện hình ảnh bức tranh siêu
5:04
độ phân giải và chỉnh sửa hình ảnh bằng cách sử dụng
5:06
kiến trúc đơn và sơ đồ đào tạo
5:09
so với các cách tiếp cận khác vì nó
5:11
tập trung vào con người thay vì
5:13
nhiệm vụ chính nó làm cho nó nhiều hơn
5:16
thực tế chính xác và có thể khái quát được
5:18
bạn, tôi hy vọng bạn thích video này, hãy để tôi
5:21
biết bạn nghĩ gì về điều này ngắn hơn và
5:22
định dạng đơn giản hơn nếu bạn thích hay không
5:25
tất nhiên đây chỉ là một cái nhìn tổng quan về điều này
5:27
giấy mới và tôi thực sự khuyên bạn nên
5:29
đọc báo để tốt hơn
5:31
hiểu biết về chương trình đào tạo của họ
5:33
và người mẫu tôi sẽ gặp bạn vào tuần tới
5:35
với một bài báo tuyệt vời khác
[Âm nhạc]