paint-brush
Tưởng tượng: Chỉnh sửa hình ảnh AI từ các lệnh văn bảntừ tác giả@whatsai
30,897 lượt đọc
30,897 lượt đọc

Tưởng tượng: Chỉnh sửa hình ảnh AI từ các lệnh văn bản

từ tác giả Louis Bouchard6m2022/10/23
Read on Terminal Reader
Read this story w/o Javascript

dài quá đọc không nổi

Imagic có một mô hình dựa trên sự khuếch tán như vậy có thể lấy văn bản và tạo hình ảnh từ đó và điều chỉnh mô hình để chỉnh sửa hình ảnh. Bạn có thể tạo một hình ảnh và sau đó dạy người mẫu chỉnh sửa nó theo bất kỳ cách nào bạn muốn. Tưởng tượng: Chỉnh sửa hình ảnh thực dựa trên văn bản với mô hình khuếch tán. Bản in trước ArXiv arXiv: 2210.09276. Sử dụng nó với Khuếch tán ổn định: https: //: //: //www.louisbouchard.ai/imagic/

Company Mentioned

Mention Thumbnail
featured image - Tưởng tượng: Chỉnh sửa hình ảnh AI từ các lệnh văn bản
Louis Bouchard HackerNoon profile picture

Tờ giấy của tuần này có thể là mô hình yêu thích tiếp theo của bạn cho đến nay.

Nếu bạn nghĩ rằng các mô hình thế hệ hình ảnh gần đây như DALLE hoặc Stable Diffusion là tuyệt vời, bạn sẽ không tin rằng mô hình này đáng kinh ngạc như thế nào.

"Cái này" là Tưởng tượng.

Imagic có một mô hình dựa trên sự khuếch tán như vậy có thể lấy văn bản và tạo hình ảnh từ đó và điều chỉnh mô hình để chỉnh sửa hình ảnh. Chỉ cần nhìn vào đó ... Bạn có thể tạo một hình ảnh và sau đó dạy người mẫu chỉnh sửa nó theo bất kỳ cách nào bạn muốn.

Tìm hiểu thêm trong video bên dưới ...

Người giới thiệu:

►Đọc toàn bộ bài viết: https://www.louisbouchard.ai/imagic/
►Kawar, B., Zada, S., Lang, O., Tov, O., Chang, H., Dekel, T., Mosseri, I. và Irani, M., 2022. Hình ảnh: Hình ảnh thực dựa trên văn bản Chỉnh sửa với Mô hình khuếch tán. arXiv bản in trước arXiv: 2210.09276.
► Sử dụng nó với Khuếch tán ổn định: https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imagic.ipynb
►Bản tin của tôi (Một ứng dụng AI mới được giải thích hàng tuần cho email của bạn!): Https://www.louisbouchard.ai/newsletter/

Bản ghi video

0:24

nhìn vào đó bạn có thể tạo ra một hình ảnh

0:26

và sau đó dạy người mẫu chỉnh sửa nó bất kỳ

0:29

theo cách bạn muốn đây là một bước khá lớn

0:31

hướng tới việc có Photoshop của riêng bạn

0:33

nhà thiết kế miễn phí mô hình không chỉ

0:36

hiểu những gì bạn muốn thể hiện nhưng

0:38

nó cũng có thể duy trì tính thực tế

0:41

như giữ các thuộc tính của ban đầu

0:43

hình ảnh chỉ nhìn vào cách con chó ở lại

0:46

giống nhau trong tất cả các hình ảnh ở đây nhiệm vụ này là

0:49

được gọi là chỉnh sửa hình ảnh có điều kiện văn bản

0:51

điều này có nghĩa là chỉnh sửa hình ảnh bằng cách chỉ sử dụng

0:54

văn bản và một hình ảnh ban đầu là

0:57

khá nhiều không thể, thậm chí một năm

0:59

trước đây, bây giờ hãy nhìn vào những gì nó có thể làm, vâng, điều này

1:03

tất cả được thực hiện từ một hình ảnh đầu vào duy nhất

1:05

và một câu ngắn trong đó bạn thấy gì

1:07

bạn muốn có điều đó tuyệt vời như thế nào

1:09

điều duy nhất thú vị hơn là nó như thế nào

1:12

hoạt động, chúng ta hãy đi sâu vào nó nhưng trước tiên nếu

1:15

bạn hiện đang học AI hoặc muốn

1:17

bắt đầu học nó bạn sẽ thích điều này

1:19

cơ hội tôi biết nó có thể khó khăn như thế nào

1:22

đạt được tiến bộ thực sự khi học AI

1:24

đôi khi cấu trúc bổ sung và

1:26

trách nhiệm giải trình có thể là điều đề xuất bạn

1:29

cấp độ tiếp theo nếu điều đó nghe giống bạn

1:31

tham gia nhà tài trợ của video này Delta

1:33

Học viện tại Học viện Delta bạn học

1:36

tăng cường học tập bằng cách xây dựng trò chơi

1:38

AIS trong một nhóm thuần tập trực tiếp đi từ 0 đến

1:41

alphago thông qua xuất khẩu thủ công

1:43

hướng dẫn tương tác thảo luận trực tiếp

1:46

với các chuyên gia này và AI hàng tuần

1:48

xây dựng các cuộc thi nó không chỉ

1:51

một trang web spam khóa học khác, nó rất dữ dội

1:53

thực hành và tập trung vào chất lượng cao

1:56

được thiết kế bởi các chuyên gia từ deepmind Oxford

1:58

và Cambridge, đó là nơi các lập trình viên đến

2:01

Bằng chứng trong tương lai từ nhà cung cấp dịch vụ của họ từ

2:03

tiến bộ của AI và tận hưởng niềm vui với

2:06

cộng đồng sống của các đồng nghiệp và chuyên gia để

2:08

thúc đẩy bạn về phía trước, bạn sẽ viết một biểu tượng

2:10

các thuật toán trong Python khác nhau, từ dqn đến

2:13

alphago một trong những chương trình thú vị nhất từ trước đến nay

2:16

đã tham gia với họ ngay bây giờ thông qua liên kết của tôi bên dưới

2:18

và sử dụng mã khuyến mãi AI để nhận

2:21

giảm 10

2:23

vậy iMagic hoạt động như thế nào như chúng tôi đã nói

2:26

lấy một hình ảnh và chú thích để chỉnh sửa

2:29

thiết lập hình ảnh và bạn thậm chí có thể tạo

2:31

nhiều biến thể của nó mô hình này

2:33

giống như phần lớn các bài báo

2:35

được phát hành những ngày này dựa trên

2:38

mô hình khuếch tán cụ thể hơn nó

2:41

lấy một mô hình trình tạo hình ảnh đã

2:43

đã được đào tạo để tạo hình ảnh từ

2:45

văn bản và điều chỉnh nó để chỉnh sửa hình ảnh trong

2:48

trường hợp của họ nó sử dụng Imogen mà tôi

2:51

được đề cập trong một video trước đó là một

2:53

mô hình sinh sản dựa trên khuếch tán có thể

2:55

tạo hình ảnh độ nét cao sau

2:57

được đào tạo về một tập dữ liệu khổng lồ về

3:00

cặp chú thích hình ảnh trong trường hợp của

3:02

iMagic họ chỉ cần đào tạo trước

3:05

mô hình imagen làm cơ sở và làm cho

3:08

sửa đổi nó để chỉnh sửa

3:10

hình ảnh được gửi dưới dạng đầu vào giữ hình ảnh

3:13

ngoại hình cụ thể chẳng hạn như của con chó

3:16

chủng tộc và danh tính và chỉnh sửa nó

3:18

theo văn bản của chúng tôi để bắt đầu chúng tôi có

3:21

để mã hóa cả văn bản và chữ viết đầu

3:23

hình ảnh Edge để nó có thể được hiểu

3:25

bằng mô hình Hình ảnh của chúng tôi khi việc này được thực hiện

3:28

chúng tôi tối ưu hóa văn bản mã hóa văn bản của chúng tôi

3:31

nhúng để phù hợp hơn với ban đầu của chúng tôi

3:33

hình ảnh về cơ bản lấy văn bản của chúng tôi

3:35

đại diện và tối ưu hóa nó cho

3:38

hình ảnh ban đầu được gọi là e tối ưu hóa để được

3:41

chắc chắn rằng nó hiểu rằng trong ví dụ này

3:43

chúng tôi muốn tạo ra cùng một loại

3:45

hình ảnh với một con chim trông giống nhau và

3:48

nền tảng sau đó chúng tôi tham gia đào tạo trước của chúng tôi

3:51

trình tạo hình ảnh để tinh chỉnh ý nghĩa của nó

3:53

rằng chúng tôi sẽ đào tạo lại hình ảnh và mô hình

3:55

giữ các bản nhúng văn bản được tối ưu hóa mà chúng tôi

3:58

vừa được sản xuất giống nhau nên hai cái này

4:01

các bước được sử dụng để nhúng văn bản

4:03

gần hơn với hình ảnh nhúng bằng cách

4:06

đóng băng một trong hai và nhận được

4:08

khác gần hơn sẽ đảm bảo rằng chúng tôi

4:10

tối ưu hóa cho cả văn bản và tên viết tắt

4:12

hình ảnh không chỉ một trong hai hình ảnh bây giờ

4:15

mô hình của chúng tôi hiểu hình ảnh ban đầu

4:17

trong văn bản của chúng tôi và hiểu rằng họ

4:19

tương tự như vậy, chúng ta cần dạy nó

4:21

tạo các biến thể Hình ảnh Mới cho điều này

4:24

văn bản tia lửa này siêu đơn giản văn bản của chúng tôi

4:27

nhúng và hình ảnh được tối ưu hóa

4:29

nhúng rất giống nhau nhưng vẫn

4:32

không giống hệt điều duy nhất chúng tôi làm

4:34

đây là chúng tôi thực hiện nhúng hình ảnh

4:36

trong không gian được mã hóa của chúng tôi và di chuyển nó một chút

4:39

về phía nhúng văn bản vào lúc này

4:42

nếu bạn yêu cầu mô hình iMagic tạo

4:45

một hình ảnh sử dụng văn bản được tối ưu hóa nó

4:47

sẽ cung cấp cho bạn hình ảnh giống như của bạn

4:49

đầu vào hình ảnh để nếu bạn di chuyển nhúng

4:52

một chút về phía văn bản của bạn nhúng nó

4:55

cũng sẽ chỉnh sửa hình ảnh một chút về phía

4:58

bạn muốn cái gì thì bạn càng chuyển nó vào

5:00

không gian này càng nhiều chỉnh sửa sẽ càng lớn

5:02

và bạn sẽ càng đi xa

5:05

hình ảnh ban đầu của bạn nên điều duy nhất bạn

5:07

cần phải tìm ra bây giờ là kích thước của

5:10

bước này bạn muốn thực hiện đối với

5:12

nhắn tin và thì đấy khi bạn tìm thấy

5:15

sự cân bằng hoàn hảo bạn có một mô hình mới

5:17

có thể tạo ra nhiều biến thể như

5:20

bạn muốn bảo tồn hình ảnh quan trọng

5:22

chế độ xem thuộc tính trong khi chỉnh sửa cách

5:25

bạn muốn tất nhiên kết quả không

5:27

hoàn hảo như bạn có thể thấy ở đây, nơi

5:30

mô hình không chỉnh sửa đúng cách

5:32

hoặc có sửa đổi hình ảnh ngẫu nhiên đối với

5:35

hình ảnh ban đầu như cắt xén hoặc

5:37

phóng to không thích hợp nó vẫn ở

5:40

khá ấn tượng nếu bạn hỏi tôi, tôi thấy

5:42

tốc độ của quá trình tạo hình ảnh

5:44

tiến bộ đáng kinh ngạc và đó là cả hai

5:47

tuyệt vời và đáng sợ đồng thời tôi cũng muốn

5:50

thích biết ý kiến của bạn về những loại này

5:52

tạo hình ảnh và chỉnh sửa hình ảnh

5:54

bạn có nghĩ rằng họ là một mô hình tốt hay

5:57

điều tồi tệ là những loại hậu quả bạn

5:59

có thể nghĩ rằng từ những mô hình như vậy trở thành

6:02

ngày càng mạnh mẽ hơn, bạn có thể tìm thấy thêm

6:04

chi tiết về các thông số cụ thể họ

6:06

sử dụng để đạt được những kết quả này trong

6:08

giấy mà tôi chắc chắn mời bạn

6:10

đọc tôi cũng mời bạn xem hình ảnh của tôi

6:13

và video nếu bạn muốn biết thêm thông tin

6:14

về phần tạo hình ảnh và

6:17

hiểu cách nó hoạt động rất lớn nhờ

6:20

những người bạn của tôi tại Học viện Delta đã làm việc

6:22

về việc làm cho việc học AI trở nên thú vị với tôi

6:26

đam mê hãy thử

6:28

và cho tôi biết bạn nghĩ gì

6:30

cá nhân yêu thích cách dạy này và

6:33

Tôi chắc chắn bạn cũng sẽ cảm ơn bạn vì

6:35

hỗ trợ công việc của tôi bằng cách kiểm tra

6:37

trang web và bằng cách xem toàn bộ video

6:39

và tôi hy vọng bạn thích nó, tôi sẽ gặp bạn

6:42

tuần tới với một bài báo tuyệt vời khác