paint-brush
Truyền sức mạnh cho doanh nghiệp của bạn với sự sáng tạo do AI hỗ trợby@fortuitapps
750
750

Truyền sức mạnh cho doanh nghiệp của bạn với sự sáng tạo do AI hỗ trợ

Fortuitapps6m2022/09/05
Read on Terminal Reader
Read this story w/o Javascript

Một nhóm nghiên cứu của Đại học Nam California (USC) do Giáo sư khoa học máy tính Laurent Itti dẫn đầu và các sinh viên Tiến sĩ Yunhao Ge, Sami Abu-El-Haija và Gan Xin, đã phát triển một mô hình AI hình dung một vật thể khác với bất kỳ vật thể nào khác từng thấy trước đây. Mục đích là để bắt chước một phần trực giác, trí tưởng tượng và sự đổi mới của con người. Disentanglement là một mô hình học máy (học không giám sát) chia nhỏ (chia cắt) bất kỳ đặc điểm nào của đối tượng và mã hóa chúng thành các kích thước riêng biệt.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - Truyền sức mạnh cho doanh nghiệp của bạn với sự sáng tạo do AI hỗ trợ
Fortuitapps HackerNoon profile picture


Một cách để truyền sức sáng tạo vào doanh nghiệp của bạn là tạo ra Máy sáng tạo do AI hỗ trợ. Đưa ra một tập hợp các đối tượng (sản phẩm), công cụ ML này “tưởng tượng” các đối tượng (sản phẩm) chưa từng thấy trước đây, mỗi đối tượng có một số đặc điểm khác nhau và một số đặc điểm giống nhau.


Về cơ bản, đây có thể được coi là một loại “Đổi mới tên miền chéo” tự động. Được sử dụng trong nhiều thế kỷ, Cross Domain Innovation nhằm mục đích tạo ra các ý tưởng, kinh nghiệm và giá trị đổi mới thông qua sự hội tụ của kiến thức từ các lĩnh vực khác nhau, khác nhau. Một ví dụ tuyệt vời về điều này là chim và tàu hỏa. Tàu cao tốc của Nhật Bản được lấy cảm hứng từ mỏ chim. Sự tương đồng là rõ ràng.


Tàu Bullet Train vs the Kingfisher của Nhật Bản: Tại sao phải tạo lại bánh xe khí động học?


Ghi nhận tác giả: pixabay.com

Ghi nhận tác giả: pixabay.com


Vì vậy, để thực hiện điều trên, một kỹ thuật AI được gọi là "disentanglement" được sử dụng. Mục đích là để bắt chước một phần trực giác, trí tưởng tượng và sự đổi mới của con người. Disentanglement không phải là một ý tưởng mới, và có thể được sử dụng trên bất kỳ loại kiến thức nào và áp dụng cho nhiều vấn đề trong thế giới thực.


Chính xác thì Disentanglement là gì?


Disentanglement là một mô hình học máy (học không giám sát) chia nhỏ (chia cắt) bất kỳ đặc điểm nào của đối tượng và mã hóa chúng thành các kích thước riêng biệt.


Để giải thích điều này bằng các thuật ngữ phi kỹ thuật, hãy tưởng tượng một nhà phát triển trang web cần thêm hình ảnh của mọi người vào trang web: nhưng không phải người thật để tránh bất kỳ loại xác nhận quyền sở hữu nào. Vì vậy, một mô hình AI được cung cấp với hình ảnh của một người đàn ông và đầu ra dự kiến là hình ảnh của một người tưởng tượng trông tương tự nhưng cao hơn nhiều. Nếu Mô hình AI đã học được kích thước 'chiều cao' một cách độc lập, thì kích thước này có thể được điều chỉnh cho phù hợp để có được bức ảnh về một người trông tương tự nhưng cao hơn. Thay vào đó, nếu chiều cao và giới tính được mã hóa cùng nhau thì yêu cầu đó sẽ dẫn đến hình ảnh một người phụ nữ cao hơn.


AI "Trí tưởng tượng" Mô hình Hiện đại của Nghệ thuật


Một nhóm nghiên cứu của Đại học Nam California (USC) do Giáo sư Khoa học máy tính Laurent Itti và Tiến sĩ. các sinh viên Yunhao Ge, Sami Abu-El-Haija và Gan Xin, đã phát triển một mô hình AI cho phép tưởng tượng một vật thể khác với bất kỳ vật thể nào khác từng thấy trước đây.


Báo cáo năm 2021 Tổng hợp Zero-shot với Học tập có Giám sát của Nhóm (Hội nghị về Đại diện Học tập) trình bày chi tiết về công việc này.


Các mô hình thú vị khác đã được tạo ra bởi OpenAI , một phòng thí nghiệm nghiên cứu trí tuệ nhân tạo (AI) (được thành lập tại San Francisco vào năm 2015 bởi Elon Musk và Sam Altman) tiến hành nghiên cứu AI nhằm thúc đẩy và phát triển “AI thân thiện theo cách có lợi nhân loại nói chung ”.


Hãy cùng khám phá một số lĩnh vực ứng dụng thực tế và tiềm năng của danh mục “trí tưởng tượng” AI này.


Loại bỏ thiên vị AI


Làm cho AI ít thành kiến hơn sẽ luôn được quan tâm. Trong một sự cố nghiêm trọng cách đây vài năm, cụm từ tìm kiếm “gorilla” đã bị dịch vụ nhận dạng hình ảnh của Google chặn sau khi nó bắt đầu gắn thẻ một số người không thuộc da trắng là “gorilla”.


Tương tự, các dịch vụ phân tích khuôn mặt của Microsoft và IBM đã thực hiện gần như hoàn hảo khi xác định hình ảnh của nam giới da trắng nhưng không tốt khi phân tích hình ảnh của phụ nữ da đen, phản ánh sự thiên vị trong tập hợp hình ảnh đào tạo.


Một cách để giải quyết những loại vấn đề này là trích xuất hoàn toàn các đặc điểm về chủng tộc và giới tính từ một mô hình nhận dạng hình ảnh bằng cách sử dụng kỹ thuật disentanglement.


Bán lẻ


Heinz có một số lượng lớn các sản phẩm và "giống". Mô hình Disentanglement có thể nhập thông tin về tất cả các sản phẩm và đề xuất các sản phẩm mới, biểu trưng và thậm chí cả dòng giới thiệu. Những thứ này sau đó sẽ được lọc, đưa vào danh sách chọn lọc và được xem xét để phát triển sản phẩm được hỗ trợ bởi AI .


Chăm sóc sức khỏe


Trong y học, việc tách rời các đặc tính của thuốc, chẳng hạn như đặc tính dược chính thay vì các đặc tính khác, sau đó tập hợp chúng lại để tạo ra các thông số kỹ thuật có thể được sử dụng để đề xuất các loại thuốc hoặc vắc xin tiềm năng mới.


Các môn thể thao


Soccer (hay bóng đá ở Anh) ra đời vào năm 1863 khi Hiệp hội bóng đá Anh được thành lập và đồng thời xác định một bộ quy tắc cho cả Bóng đá và Bóng bầu dục. Hôm nay, AKQA, một cơ quan sản phẩm kỹ thuật số, đã dạy Mô hình AI cách tạo một trò chơi thể thao mới bằng cách đào tạo nó trên hàng trăm trò chơi hiện có.


Kết quả là một trò chơi có tên “Speedgate”, do AI tưởng tượng và tạo ra. Nó kết hợp bóng đá, bóng bầu dục và ném đĩa (!) Trong một trò chơi mới chưa từng được nghĩ đến hoặc chơi trước đây. Thông tin thêm về điều này trong bài báo TechCrunch này.


Với Speedgate, hai đội đối lập gồm sáu cầu thủ chuyền, sút và / hoặc ném bóng qua 3 cổng ở hai đầu sân, nhưng không bao gồm cổng giữa (một cú xoay lấy cảm hứng từ AI).


Một cổng chỉ có thể được bảo vệ bởi 1 trong 3 hậu vệ đang chơi. 3 người chơi khác sẽ cố gắng đưa bóng qua các cửa. Không giống như Bóng bầu dục Mỹ, không được phép xô đẩy hoặc hạ gục một cầu thủ. Ngoài việc tạo ra trò chơi (và tất cả các quy tắc có liên quan), mô hình đã tạo ra Biểu trưng Speedgate và văn bản khẩu hiệu Speedgate (đó là ngoại hình "Đối mặt với quả bóng là quả bóng ở phía trên quả bóng" !)


Tuy nhiên, trong số các trò chơi được đề xuất bởi mô hình AI, một số trò chơi rõ ràng là không bắt đầu. Ví dụ: mô hình đã không tính đến thực tế là một chiếc đĩa bay không được phát nổ giữa không trung (một trò chơi được đề xuất điên rồ), hoặc người chơi không được treo lơ lửng trên cột. Vì vậy, đó sẽ luôn là nỗ lực của cả nhóm: AI và bộ phận R&D.


Âm nhạc


OpenAI's MuseNet (2019) là một mạng lưới thần kinh sâu dự đoán các nốt nhạc trong tệp nhạc. Nó tạo ra các bài hát với tối đa mười nhạc cụ khác nhau theo mười phong cách khác nhau.


OpenAI's Jukebox (2020) là một thuật toán nguồn mở tạo ra âm nhạc bằng giọng hát. Được đào tạo trên một triệu mẫu, hệ thống được cung cấp một thể loại, nghệ sĩ và một đoạn lời bài hát mà từ đó nó xuất ra các mẫu bài hát.


Còn bài hát đồng quê do AI tạo ra Nhạc đồng quê Alan Jackson Style thì sao?


Đang xử lý hình ảnh


DALL-E2 và CLIP của OpenAI


DALL-E2 là Mô hình máy biến áp tạo ra hình ảnh từ các mô tả bằng văn bản. CLIP làm ngược lại: nó tạo ra một mô tả cho một hình ảnh nhất định.


Tạo văn bản


OpenAI's Generative Pre-Trained Transformer 3 (GPT-3) là một mô hình ngôn ngữ tự phục hồi sử dụng học sâu để tạo ra văn bản giống như con người.


Chất lượng văn bản do GPT-3 tạo ra cao đến mức kinh ngạc, đến mức khó xác định được là do con người hay máy móc viết. Nhưng bối cảnh của những gì đang được viết là một câu chuyện khác.


Đó là nơi mà Cỗ máy Sáng tạo AI sẽ bước vào: để đảm bảo rằng những gì được viết bởi GPT-3 có giá trị thực sự về các khái niệm và ý tưởng đã được thảo luận. Thêm trong bài báo này của New York Times .


Vào ngày 22 tháng 9 năm 2020, Microsoft đã cấp phép sử dụng "độc quyền" GPT-3. API công khai vẫn có thể được sử dụng tự do, nhưng mô hình cơ bản không còn là nguồn mở nữa (:


Tổ chức Bionic


Martin Reeves, chủ tịch Viện BCG Henderson, đồng tác giả cuốn sách có tên “Cỗ máy tưởng tượng: cách khơi dậy ý tưởng mới và tạo ra tương lai cho công ty của bạn”, trong đó ông mô tả một doanh nghiệp sử dụng các mô hình AI tương tự như trên là “a tổ chức sinh học ”.


Bionics có nghĩa là sự tái tạo các hệ thống sinh học bằng các hệ thống cơ học hoặc điện tử. Thuật ngữ này được đặt ra vào năm 1958 bởi nhà nghiên cứu Jack Steele để định nghĩa việc nghiên cứu các sinh vật sinh học nhằm giải quyết các vấn đề kỹ thuật.


Ý tưởng này được phổ biến bởi loạt phim truyền hình hành động và khoa học viễn tưởng của Mỹ The Six Million Dollar Man (1973-1978), nơi một cựu phi hành gia, Đại tá Không quân Hoa Kỳ Steve Austin, do Lee Majors thể hiện, được xây dựng lại với sức mạnh, tốc độ và tầm nhìn siêu phàm. để cấy ghép sinh học.


Lấy đi


Sự sáng tạo nhất quán với tư cách là một quy trình kinh doanh cốt lõi là điều cuối cùng mang lại giá trị cho doanh nghiệp bằng cách giải quyết tương lai của doanh nghiệp về các dịch vụ sản phẩm mới.


Phòng Nghiên cứu của một công ty có thể sử dụng một hệ thống giống như hệ thống được tạo ra tại USC để bổ sung ý tưởng của các nhà nghiên cứu, lọc ra các đề xuất AI tốt nhất và cuối cùng giúp thúc đẩy thành công doanh nghiệp.


Nếu công ty của bạn không có bộ phận R&D hoặc không có cách để tạo, khám phá và sử dụng các Mô hình AI nâng cao, hãy liên hệ với chúng tôi tại Fortuitapps để có một số suy nghĩ đột phá.



Cũng được xuất bản ở đây.