paint-brush
Cách sử dụng Hasdx để tạo sách tô màu dành cho người lớn do AI tạotừ tác giả@mikeyoung44
4,743 lượt đọc
4,743 lượt đọc

Cách sử dụng Hasdx để tạo sách tô màu dành cho người lớn do AI tạo

từ tác giả Mike Young9m2023/08/02
Read on Terminal Reader

dài quá đọc không nổi

Cách sử dụng AI để tạo sách tô màu dành cho người lớn bằng mô hình Hasdx và công cụ nâng cấp.
featured image - Cách sử dụng Hasdx để tạo sách tô màu dành cho người lớn do AI tạo
Mike Young HackerNoon profile picture
0-item

Sách tô màu dành cho người lớn mang đến một cách thư giãn, mang tính thiền định đã trở nên phổ biến trong những năm gần đây. Tuy nhiên, việc lựa chọn trong các cửa hàng có xu hướng tập trung vào các mẫu và hình dạng chung.


Và, nếu bạn có ý tưởng của riêng mình cho một số nội dung thú vị, thì bạn không có cách nào dễ dàng để tạo cuốn sách tô màu của riêng mình, chẳng hạn như cho bạn bè, trừ khi bạn sẵn sàng thuê một họa sĩ hoặc tự mình tạo ra từng bức vẽ chi tiết.


Chà, nếu tôi nói với bạn rằng thực sự có một cách giải quyết vấn đề đó thì sao?


Đặt mua hoặc theo tôi trên Twitter để biết thêm nội dung như thế này!


Hóa ra là có. Các mô hình tạo ảnh AI mới như DALL-E 2 , giữa hành trình , Và khuếch tán ổn định cung cấp một cách dễ dàng để tạo vô số trang sách tô màu độc đáo dành cho người lớn được cá nhân hóa theo bất kỳ chủ đề hoặc sở thích nào.


Với mô hình phù hợp (hoặc chuỗi mô hình... sẽ nói thêm về điều đó sau) và lời nhắc phù hợp, bạn có thể có được những hình ảnh chi tiết hoàn hảo cho ý tưởng sách tô màu của mình.


Trong bài viết này, chúng ta sẽ khám phá cách tận dụng sức mạnh của AI để tạo ra những cuốn sách tô màu tùy chỉnh mà người lớn sẽ yêu thích.


Chúng ta sẽ xem xét kỹ mô hình Hasdx đối với ứng dụng này, hãy khám phá một số lời nhắc ví dụ, nghiên cứu đầu vào và đầu ra của mô hình, thử với nó bằng cách sử dụng giao diện người dùng web và xem cách chúng tôi có thể kết hợp nó với một công cụ nâng cấp như Real-ESRGAN, GFPGAN hoặc Codeformer để có được kết quả tốt hơn nữa.


Chúng ta cũng sẽ xem cách chúng ta có thể sửa đổi lời nhắc để thay đổi mức độ phức tạp của hình ảnh, điều chỉnh hiệu quả mô hình của chúng ta cho phù hợp với trình độ kỹ năng của người lớn (hoặc trẻ em) đang cầm bút chì màu.


Đi thôi.


Tổng quan và Giới thiệu về Hasdx

Các mô hình AI gần đây như DALL-E 2, Midjourney và Stable Diffusion sử dụng nhiều kỹ thuật AI khác nhau để tạo ra hình ảnh đa dạng và chân thực rõ rệt từ lời nhắc văn bản. Họ được đào tạo về bộ dữ liệu khổng lồ gồm hình ảnh và văn bản để "học" các mối liên hệ giữa từ ngữ và khái niệm hình ảnh.


Bằng cách nhập đúng dấu nhắc, bạn có thể hướng dẫn các mô hình này tạo các hình minh họa tùy chỉnh phù hợp với sách tô màu.


Đối với dự án sách tô màu dành cho người lớn của chúng tôi, chúng tôi sẽ sử dụng Hasdx (ban đầu trên Civilitai). Chúng ta sẽ xem xét cụ thể việc triển khai Hasdx được tạo bởi cjww và lưu trữ trên sao chép .


Tôi đặc biệt chọn Hasdx vì đây là phiên bản tinh chỉnh của Ổn định khuếch tán, cho phép nó tạo ra những hình ảnh đa dạng, chất lượng cao, hoàn hảo cho sách tô màu.



Hasdx đã được phát triển như thế nào? Tại sao sử dụng nó?

khuếch tán ổn định , được phát triển thông qua sự hợp tác giữa các nhà nghiên cứu học thuật và các tổ chức phi lợi nhuận, đã tạo ra một cuộc cách mạng trong việc tạo hình ảnh AI.


Khi những người sáng tạo bắt đầu thử nghiệm với Khuếch tán ổn định, các mô hình chuyên biệt đã xuất hiện nhằm tìm cách nâng cao các khía cạnh như chất lượng hình ảnh và kiểm soát đào tạo.


Một mô hình như vậy là HuggingFace Khuếch tán Vintedois V0 1 mô hình của người sáng tạo 22h , cũng có trên sao chép . Bằng cách tinh chỉnh Khuếch tán ổn định trên một tập dữ liệu đa dạng, 22h đã phát triển một mô hình đa năng linh hoạt có kỹ năng tạo hình ảnh chi tiết.


Cũng trong khoảng thời gian đó, hai mô hình trạm kiểm soát đã được công nhận về khả năng nghệ thuật của chúng - sxd-berrymix-hợp nhất handas-3dkx10b . Sxd-berrymix-merge, do nghệ sĩ AI EMAD thực hiện, đã kết hợp các điểm kiểm tra Khuếch tán ổn định trước đó và áp dụng đào tạo chính xác bổ sung tập trung vào việc cải thiện các đặc điểm trên khuôn mặt, ánh sáng và độ chân thực của màu sắc.


Kết quả là, nó vượt trội về hình ảnh con người chân thực. Trong khi đó, handas-3dkx10b, được tạo bởi nghệ sĩ kỹ thuật số handas2077, sử dụng các kỹ thuật lập mô hình 3D để đạt được độ chính xác và chi tiết vượt trội.


Xác định cơ hội cho sức mạnh tổng hợp, nhà phát triển người gây nhiễu tốt nhất hợp nhất các mô hình này. Bằng cách kết hợp tính linh hoạt của Vintedois Diffusion với khả năng vẽ chân dung của sxd-berrymix-merge và độ chính xác của handas-3dkx10b, bestjammer đã tạo ra Hasdx - một mô hình 7,2 GB cân bằng khả năng chung với tính nghệ thuật chuyên biệt.


Không giống như những người tiền nhiệm phức tạp của nó, Hasdx nhấn mạnh vào sự đơn giản, tính linh hoạt và kết quả có độ trung thực cao. Điều này khiến nó trở nên hấp dẫn đối với các ứng dụng sáng tạo như tạo hình minh họa sách tô màu dành cho người lớn, nơi các thiết kế phức tạp có thể hưởng lợi từ chi tiết của Hasdx mà không yêu cầu lời nhắc dài dòng.


Đối với người dùng ở các cấp độ kỹ năng, Hasdx đã mang đến khả năng tạo hình ảnh cấp độ chuyên nghiệp trong tầm tay.

Cách tương tác với Hasdx bằng giao diện người dùng demo sao chép

Nếu bạn muốn làm theo các bước trong hướng dẫn này và thử tạo hình ảnh sách tô màu dành cho người lớn bằng Hasdx cùng với tôi, thì cách nhanh nhất và đơn giản nhất để bắt đầu là sử dụng Replicate UI demo. Đây là cách truy cập nó:


  • Đi đến trang chi tiết mô hình cho Hasdx trên AImodels.fyi


  • Trong cột bên phải, tìm liên kết Replicate demo ( "Model Link" -> "View on Replicate" )


  • Tạo một tài khoản Sao chép và chọn tab "Demo" trên trang Hasdx


  • Tương tác trực tiếp với các trường nhắc khi cần và nhấp vào "tạo" để kiểm tra đầu vào của bạn.


Bạn cũng có thể đọc thêm về cách tương tác với mô hình trong hoàn thành hướng dẫn mô hình Hasdx .

Đầu vào và đầu ra Hasdx

Khi sử dụng Hasdx cho dự án sách tô màu dành cho người lớn, bạn có thể điều chỉnh một số đầu vào chính. Chúng ta sẽ tập trung vào lời nhắc trong phần tiếp theo, nhưng để hiểu rõ hơn, đây là danh sách tất cả các tham số mà bạn có thể sử dụng.


  • lời nhắc - Đây là nơi bạn cung cấp lời nhắc văn bản mô tả những gì bạn muốn AI tạo ra. Đối với một cuốn sách dành cho người lớn, hãy tập trung vào các chủ đề và chi tiết phức tạp.


  • negative_prompt - Chỉ định bất kỳ thứ gì bạn muốn hình ảnh tránh, chẳng hạn như văn bản hoặc các đối tượng nền gây mất tập trung.


  • chiều rộng/chiều cao - Hasdx hoạt động tốt nhất ở độ phân giải cao như 768x768. Kích thước cao hơn nắm bắt chi tiết hơn.


  • num_inference_steps - Khoảng 80 bước hiển thị chi tiết đẹp mắt mà không mất quá nhiều thời gian.


  • hướng dẫn_scale - Giữ mức này cao, chẳng hạn như 9-10, để kết quả đầu ra tuân thủ chặt chẽ lời nhắc.


  • hạt giống - Thay đổi hạt giống để nhận biến thể giữa các lời nhắc giống hệt nhau.


Đầu ra chính từ Hasdx sẽ là hình ảnh PNG có độ phân giải cao phù hợp với các chi tiết nhắc nhở. Với lời nhắc phù hợp (hiển thị bên dưới), AI sẽ tạo ra các hình minh họa sắc nét, phức tạp, hoàn hảo cho các trang sách tô màu dành cho người lớn có thể in được.


Nếu bạn đang sử dụng Bản sao để tương tác với mô hình (như chúng ta sẽ thực hiện trong ví dụ này), đầu ra sẽ như sau:


 { "type": "array", "items": { "type": "string", "format": "uri" }, "title": "Output" }

Chế tạo Lời nhắc

Chìa khóa để tạo ra những hình ảnh tuyệt vời với AI là tạo ra lời nhắc văn bản một cách cẩn thận. Đối với sách tô màu, chúng tôi muốn các hình vẽ đường đen trắng đơn giản với đường viền dày.


Đây là một cấu trúc nhắc hoạt động tốt, lấy cảm hứng từ Chase Lean's Chủ đề Twitter về cách tạo bản vẽ sách dành cho trẻ em bằng Midjourney.


 adult coloring book, cartoon, [theme], intricate details, advanced patterns, black and white


Thay thế [chủ đề] bằng bất cứ thứ gì bạn muốn minh họa - động vật, xe cộ, thức ăn, v.v. Hãy thử một số ví dụ:


  • sách tô màu dành cho người lớn, phim hoạt hình, những bông hoa tinh tế, chi tiết phức tạp, hoa văn nâng cao, đen trắng


  • sách tô màu dành cho người lớn, phim hoạt hình, chiến binh xinh đẹp, chi tiết phức tạp, hoa văn cao cấp, đen trắng


  • sách tô màu dành cho người lớn, phim hoạt hình, tòa nhà trang trí nghệ thuật, chi tiết phức tạp, hoa văn nâng cao, đen trắng


Bạn cũng sẽ thu được nhiều lợi ích bằng cách đặt dấu nhắc tiêu cực. Đây là cái tôi đã sử dụng:

  • màu, hình chụp, số fax, Ảnh chụp màn hình, biên giới, mờ, Có hạt


Bạn có thể đặt các thông số khác mà tôi đã đánh giá ở trên. Đây là một ví dụ đầy đủ mà tôi nghĩ có một đầu ra rất hay.


  • Gợi ý: sách tô màu dành cho người lớn, phim hoạt hình, chiến binh xinh đẹp, chi tiết phức tạp, hoa văn cao cấp, đen trắng
  • Lời nhắc tiêu cực: ảnh, fax, ảnh chụp màn hình, đường viền, mờ, nổi hạt
  • Chiều rộng: 512
  • Chiều cao: 512
  • Số đầu ra: 1
  • Số bước suy luận: 185
  • Quy mô hướng dẫn: 12
  • Trình lập lịch biểu: DPMSolverMultistep
  • Hạt giống: không có (trống)



Điều chỉnh độ phức tạp

Chúng tôi cũng có thể điều chỉnh độ phức tạp của hình ảnh được tạo. Đối với sách dành cho người lớn, các chi tiết phức tạp và hoa văn nâng cao được ưu tiên hơn. Mặt khác, sách dành cho trẻ em thường ưu tiên những hình ảnh đơn giản hơn do mức độ kỹ năng vận động tinh của độc giả.


Để tạo các hình minh họa cơ bản hơn cho sách dành cho trẻ em đơn giản hơn, hãy xem xét thay đổi lời nhắc để có các phần tử gọi ra các kiểu đơn giản hơn:

 b/w outline art for kids coloring book page, rabbit, Kids coloring pages, full white, kids style, white background, whole body, Sketch style, full body (((((white background))))), only use outline. , cartoon style, line art, coloring book, clean line art, white background, Sketch style


(Lời nhắc gốc từ prompthero )



Thử nghiệm với các giá trị phong cách khác nhau để có được mức độ chi tiết phù hợp. Nhưng hãy nhớ rằng, hầu hết người lớn đều thích sự phức tạp nâng cao.

Nâng cấp hình ảnh

Bạn có thể thấy hình ảnh thu được do Hasdx tạo ra hơi mờ, đặc biệt nếu bạn cần phóng to hình ảnh lên để lớn hơn cho cuốn sách mà bạn muốn in.


May mắn thay, bạn có thể chạy kết quả đầu ra của mình thông qua một mô hình khác để có được một tệp thậm chí còn tốt hơn. Các mô hình này được gọi là mô hình nâng cấp và có nhiều tùy chọn phổ biến:


  • ESRGAN : Mang lại kết quả vượt trội cho sự xuống cấp mô phỏng lý tưởng. Mô hình này sẽ hoạt động tốt để khôi phục các hình ảnh tổng hợp giống như những hình ảnh chúng tôi đang tạo bằng Hasdx.



  • Người viết mã: một mạnh mẽ thuật toán phục hồi khuôn mặt được thiết kế để hoạt động với cả ảnh cũ và khuôn mặt do AI tạo. Sẽ hoạt động tốt để dọn dẹp các đồ tạo tác kỳ lạ trong các thế hệ kiểu chân dung cho sách tô màu.



Đây là một ví dụ cho thấy cách chạy đầu ra ví dụ đầu tiên thông qua Real-ESRGAN dẫn đến hình ảnh chất lượng tốt hơn:



Kết quả khá tinh tế, nhưng khi bạn nhìn thấy hình ảnh được nâng cấp và hình ảnh gốc đặt cạnh nhau, bạn có thể thấy các đường được cải tiến giúp tô màu hình ảnh dễ dàng hơn như thế nào - ít vùng màu xám hơn và đường viền sắc nét hơn rất phù hợp cho loại ứng dụng này.

Tạo một cuốn sách hoàn chỉnh

Khi bạn đã hoàn thiện lời nhắc của mình và thực hành nâng cấp hình ảnh, về cơ bản bạn đã hoàn tất. Giờ đây, bạn có thể tạo toàn bộ hình minh họa cho cuốn sách của mình bằng cách thực hiện theo quy trình chung sau:


  • Lập danh sách các chủ đề và chủ đề bạn muốn đưa vào.


  • Tạo lời nhắc cho từng người bằng cách sử dụng công thức trên, điều chỉnh kiểu nếu cần. Cân nhắc sử dụng một hạt giống để giữ cho các kiểu nhất quán.


  • Tinh chỉnh bất kỳ hình minh họa nào không có đủ chi tiết. Sử dụng một upscaler để nâng cao chúng.


  • Sắp xếp các hình ảnh cuối cùng thành các trang có thể in bằng phần mềm xuất bản.


Vậy là xong - giờ bạn đã có một cuốn sách tô màu dành cho người lớn do AI tạo tùy chỉnh! Phạm vi rộng lớn của các hình ảnh chi tiết phức tạp mà các mô hình này có thể tạo ra giúp bạn dễ dàng điều chỉnh sách theo bất kỳ phong cách và chủ đề nào.

Phần kết luận

Sử dụng AI để tạo sách tô màu dành cho người lớn tùy chỉnh là một ứng dụng mới thú vị của các mô hình hình ảnh tổng quát. Như chúng ta đã thấy, các công cụ như Hasdx cung cấp nguồn vô tận các hình minh họa phức tạp, độc đáo để tạo ra những cuốn sách mang tính cá nhân hóa cao.


Dưới đây là một số bài học lớn sau khi xem qua toàn bộ quy trình này:

  • Các mô hình AI gần đây như Khuếch tán ổn định cho phép tạo hình ảnh tùy chỉnh thông qua lời nhắc văn bản được tạo cẩn thận. Tinh chỉnh tạo ra các mô hình chuyên biệt như Hasdx được điều chỉnh cho các nhu cầu sáng tạo cụ thể.


  • Hasdx cân bằng các khả năng chung với việc tập trung vào chủ nghĩa hiện thực và chi tiết. Điều này làm cho nó rất phù hợp với những hình ảnh chi tiết trong sách tô màu dành cho người lớn.


  • Cấu trúc lời nhắc cho phép bạn kiểm soát chính xác chủ đề và độ phức tạp của các hình minh họa được tạo. Lời nhắc tiêu cực giúp tránh các yếu tố không mong muốn.


  • Chạy đầu ra Hasdx thông qua các mô hình nâng cấp cải thiện chất lượng in. ESRGAN và những người khác làm sắc nét các chi tiết và đường nét.


  • Phạm vi rộng lớn của hình minh họa có thể làm cho sách tùy chỉnh dễ dàng điều chỉnh theo phong cách và sở thích cá nhân.


  • AI có vẻ sẵn sàng trở thành nhân tố thay đổi cuộc chơi trong việc cho phép người sáng tạo tạo ra những cuốn sách tô màu độc đáo và các sản phẩm dựa trên hình ảnh được cá nhân hóa khác.


Thế giới của AI tổng hợp đang phát triển nhanh chóng. Khi các mô hình tiếp tục cải thiện về khả năng và khả năng truy cập, chúng ta có thể thấy nhiều ứng dụng mới nổi hơn như sách tô màu tùy chỉnh dành cho người lớn. Tương lai có vẻ tươi sáng để thúc đẩy sự sáng tạo của AI! Cảm ơn vì đã đọc.


Đặt mua hoặc theo tôi trên Twitter để biết thêm nội dung như thế này!

Tài nguyên và đọc thêm

Dưới đây là một số tài nguyên hữu ích mà bạn có thể muốn xem khi thực hiện dự án sách tô màu dành cho người lớn dựa trên AI của mình:


  • mô hình Hasdx - Mô hình khuếch tán ổn định hỗn hợp được tối ưu hóa cho sự sáng tạo





  • GFPGAN - Mô hình phục hồi khuôn mặt AI




Cũng được xuất bản ở đây