paint-brush
AI를 얼마나 효율적으로 훈련할 수 있습니까?~에 의해@damocles
263 판독값

AI를 얼마나 효율적으로 훈련할 수 있습니까?

~에 의해 Antică Vlad12m2024/02/01
Read on Terminal Reader

너무 오래; 읽다

수학의 규칙을 배우는 AI를 상상해 보세요. 모든 개념, 아이디어, 상호 작용, 그리고 결국 수학 전체를 통과합니다.
featured image - AI를 얼마나 효율적으로 훈련할 수 있습니까?
Antică Vlad HackerNoon profile picture
0-item

AI를 훈련하는 데 사용되는 데이터의 크기와 함께 해당 데이터의 품질도 최종 그림에 영향을 미칩니다. 이제 데이터의 품질이란 무엇을 의미합니까?


사전에 모르시는 경우를 대비해 저는 합리화하는 데 사용하는 도구만을 토대로 글을 썼습니다. 나는 나가서 "데이터"가 실제로 무엇을 의미하는지에 대한 정의를 검색하지 않습니다. HDD와 SSD가 어떻게 작동하는지 알고 있지만 데이터를 전송하는 방법 등은 모릅니다.


지금 생각해보면, 이것들을 알면 내가 쓰는 정보의 질이 향상될 수 있을 것 같다. 아니면 도메인에 상관없이 적어도 새로운 아이디어가 떠오를 것입니다. 하지만 어쨌든 "데이터의 품질"이 무엇인지 조금 설명할 수 있었으면 좋겠습니다.

1부: 품질이 좋은/나쁜 요인 이상의 것입니까?

“요리”와 같은 특정 영역을 정의할 때. 조리법이 설명되는 일관성은 이해의 질로 볼 수 있습니다. 그런 다음 사람이 평가하는 레시피의 품질(맛, 준비의 용이성, 크기 등)이 나옵니다. 그래서 인간으로서 우리는 요리책의 품질에 대해 2개의 평가를 받았습니다. 우리는 그것을 얼마나 쉽게 이해합니까? 그것을 만드는 것이 얼마나 가치 있는 일인가.

시간이 지나면 우리는 전문 요리사가 되어 (가족의 관심사에 따라) 음식만으로 책을 평가하게 될 것입니다.


나중에 각 레시피에는 등급이 지정되며 책의 전체 등급에 영향을 미칩니다. 등급이 더 높은 요리법은 해당 책을 더 잘 대표하게 됩니다. 이런 식으로 이 책의 x, y, z 페이지에서 좋은 선택을 찾을 수 있다는 것을 기억할 것입니다. 어떤 요리법이 있는지 기억하지 못하더라도. 당신은 단지 "좋은 음식"이라는 범주로 기억할 것입니다.


AI는 이러한 부분을 "초보자"/"고급"/"전문가", "나쁜 음식"/"좋은 음식"/"건강에 좋은 음식"/"아기에게 좋은 음식"으로 간주합니다. 아기에게 좋은 음식. 어떤 이유로든 건강한 음식에 관심을 두지 않았다면 이제는 더 심각해졌습니다.


필요한 "윤리적 장벽" 없이 AI를 소유한 사람이 봇이 말하는 것을 신뢰하는 것을 어떻게 막을 수 있습니까? 나는 그의 작은 AI가 식품 전문가에 의해 훈련되지 않았다고 확신합니다. (이것은 제가 곧 논의하고 싶은 "오픈 소스 AI"라는 더 넓은 그림과 관련이 있습니다. 좋든 싫든 미래는 한 사람이 보기에는 너무 큽니다.)


이제... 질문으로 돌아가 보겠습니다. 품질이 좋은/나쁜 요인인가요?


보시다시피, 우리는 "좋은 품질"로 정의한 것을 기반으로 특정 기억을 기반으로 합니다. 이런 식으로 우리는 3권의 책을 분류할 수 있으며, 각 책에는 일정한 수의 "좋은 품질" 레시피가 포함되어 있습니다. '품질'이 '효율성'으로 바뀌는 것 같습니다.


안전과 관련하여 "효율성"에 대해 무엇을 말할 수 있습니까? 우리의 장기적인 건강과 웰빙은 무엇입니까? 여기서 "효율적"이라는 말이 너무 성급하게 들리는 이유는 무엇입니까? 왜냐하면 여기에는 증거가 필요하기 때문입니다. 우리의 건강이 중요하기 때문에 확신을 가져야 합니다. 그리고 나는 우리 모두가 그것에 대해 깊은 관심을 갖고 있다고 확신합니다. 그 게임을 또 어떻게 끝낼 수 있겠어? 아니면 친구들과 또 다른 밤을 보내나요?


우리는 단순히 "좋은" 것이 되기 위해 몇 가지가 필요합니다. 나쁜 것이 없는 좋은 것. 우리에게는 그 모든 나쁜 것을 제거할 힘이 있기 때문입니다.


그런데 나쁜 것 없이 좋은 것이 있을 수 있다면 그것이 정상이겠는가? 건강을 중요하게 생각하는 것이 정상이라는 것은 누구나 동의할 것입니다. 그러나 우리(적어도 흡연자)가 볼 수 있듯이 우리는 정상 수준에 약간 못 미치고 있습니다. 그럼에도 불구하고 우리는 그것이 좋다고 말합니다.


그리고 AI는 이것으로부터 무엇을 배울 수 있나요? 오해의 소지가 있는 정보를 농담으로 주는 것이 좋습니다. 그러나 특정 기준에서만 가능합니다. 하지만 봇은 감정이 없습니다. 그렇다면 그들은 무엇이 무엇과 관련되어 있는지 어떻게 진정으로 이해할 수 있습니까?


아무리 노력해도 결국 AI의 마음은 수학일 뿐입니다. 그리고 숫자는 뭔가 특이한 일을 할 수 있습니다. 그들은 언어의 영역 밖으로 이동할 수 있습니다.


각 단어에는 특정 값이 있습니다. 각 연결에는 특정 값이 있습니다. 각 개념은 전체적으로 특정 가치를 갖습니다. 당신이 구성하거나 해체할 수 있는 모든 것, 그리고 그 조각들, 심지어 그들이 형성하는 전체도 특정한 가치를 갖습니다. 그렇다면… 수학적 규칙과 유사한 기준에 따라 논리, 추론과 같은 특정 프로세스를 훈련할 수 있을까요?

파트 2: "완벽한 품질"을 정의할 수 있을까요?

수학의 규칙을 배우는 AI를 상상해 보세요. 모든 개념, 아이디어, 상호 작용, 그리고 결국 수학 전체를 통과합니다. 이 AI의 "마음"은 제자리에 고정되어 있습니다. 지금까지 알고 있는 단계만 따를 수 있습니다. 그러면 질문이 옵니다. 봇은 어떻게 우리 언어를 배울까요?


그는 문구, 단어, 아이디어 등을 정의하는 방법을 모르는 특정 기준으로 분할할 수 있습니다. 입력이 무작위로 보일 수 있으므로 출력도 무작위로 나타날 수 있습니다. 이 AI는 이론적으로는 무한한 이성을 갖고 있지만 이해력이 부족합니다.


그래서 "완벽한 품질"을 찾으려고 노력하다가 그 반대의 결과를 얻었을 수도 있습니다. 추론이 완벽하더라도 이해가 부족하면 그 잠재력이 낭비됩니다.


하지만 잠깐, "완벽한 품질"은 그 이상이라는 뜻입니다. 그 이유를 전달하려면 인간의 언어에 대한 이해가 필요하다. 그렇다면 '완벽한 품질'은 완벽한 추론과 완벽한 인간 언어 이해를 모두 의미한다고 가정할 수 있습니다. 요리책의 경우와 마찬가지로, '품질'은 우리에게 눈에 보이지 않는 한 달성되지 않습니다.


글쎄… 그 완벽한 추론이 우리에게 실제로 가능할까요?

파트 3: 완벽한 추론?

공포와 고통의 시대에. 우리의 두뇌가 다르게 행동하는 시기에는 내부 프로세스에서 평소보다 더 많은 에너지를 끌어옵니다. 그럴 때 우리는 여러 가지 가중치를 가질 수 있습니다. 우리는 우리의 상황이 위급하거나 위기에 가깝다는 것을 알기 때문에 훨씬 더 많은 것을 고려합니다. 우리가 수년에 걸쳐 배운 모든 것은 우리가 스스로 각인한 사고 방식을 통해 향상됩니다. 둘 다 결합되어 헌신이 어떤 느낌인지 보여줍니다. 어떻게 구멍에서 빠져나오려는 의지가 계단을 찾을 수 있게 해준다. 그리고 모두 감정에 기초합니다.


그렇다면 감정이 결여된 사람은 어떻게 생각할까요? 그 사람은 상황이 위급하다고 어떻게 판단하겠습니까? 그의 관찰을 바탕으로. 그는 항상 자신의 현재 상황을 의식적으로 염두에 두어야 할 것입니다. "저는 여자친구와 좋은 관계를 유지하고 있습니다." - 이런 느낌이나 다른 느낌을 전혀 느끼지 않는 사람은 의식적으로 "그녀에게는 괜찮습니다"라고 알고 자신의 작업에 주의할 것입니다. 감정에 감사하다는 뜻으로 “안녕하세요”라고 말하는 대신에 말이죠.


실제로 마지막 조치는 단순히 작업에 정신을 집중하는 조치보다 덜 결정적인 것 같습니다. 그러나 우리는 두 사람이 둘 다 무언가를 믿을 때 그 무언가가 둘 다 더 열심히 싸우게 만든다는 것을 알고 있습니다. 둘 다 관계를 더 많이 믿을수록 관계를 행복하게 만들겠다는 결심이 더 강해질 것입니다. 그러면 그들은 행복해지고 누군가를 행복하게 만들 것입니다.


감정이 이상해요. 그러나 또한 윤리와도 중요한 상관관계가 있습니다(또는 저는 믿습니다).

4부: 윤리란 무엇인가?

나는 윤리를 개념에 지나지 않는다고 봅니다. 웰빙에 담긴 협업과 공동 이익의 개념. 어쩌면… 좋은 것에 대한 더 큰 생각일 수도 있습니다. 왜냐하면 그것은 개인뿐만 아니라 전체를 닮기 때문입니다. 보호를 기하급수적으로 증가시키기 위해 약간의 행복이 소모됩니다. 이것이 가장 효율적인 지점은 내가 윤리를 정의하는 것입니다. 그러나 그것은 단순한 요점이 아닐 수도 있습니다.


아시다시피 윤리는 항상 존재합니다. 시간은 흐르고 시간과 함께 흐릅니다. 더 오랜 기간의 보호를 보장하려면 더 오랜 기간의 윤리를 보장해야 합니다. 따라서 모든 집단의 지속적인 상호 이익은 더 긴 기간의 윤리적 연결로 간주됩니다.


큐브 안의 선이 깜박이면 큐브를 어떻게 함께 유지할 수 있습니까? 전체 큐브를 볼 수 있도록 외부 부분을 표시하는 것과 숨기는 것 사이의 균형을 유지하려면 모든 선이 필요합니다. 4d(육체적으로가 아니라 정신적으로)로 가면 반대편에서도 이 세상과 똑같아 보인다는 사실을 깨닫게 될 것입니다. 그리고 윤리는 우리가 확인하면 안전함을 보장합니다.

5부: 윤리, 효율성 및 품질.

평가할 때 그들 모두는 감정과 관련될 수 있습니다. 그래서 우리는 그것이 우리 감정에 미치는 영향을 평가합니다. 효율성을 기준으로 평가할 수도 있습니다. x 결과를 얼마나 빨리 달성하는지. 효율성의 효율성에 대해 들어보셨나요? 나도 그랬지만, 나는 그것에 대해 생각해 왔습니다. 적어도 어느 정도. 그것이 무엇을 의미하는지 봅시다.


앞서 말했듯이 AI 훈련 과정에서 우리는 다양한 데이터 모듈을 접하게 됩니다. "요리", "낚시", "자기 개선", "개인 연설" 등(여기서부터 잠재력을 볼 수 있습니다). 각 모듈에 대해 데이터의 품질을 묘사할 수 있습니다. 학습 효율성과 상호작용의 질.


'완벽한 데이터 품질' 관점에서 보면 학습의 효율성이 가장 중요합니다. 여기서는 언어 이해에서 컴퓨팅 성능으로, 그리고 나중에는 창의성에서 파생되는 알고리즘 효율성으로 전환합니다. 자, 우리는 어떻게 창의성에 도달했습니까? 그리고 왜 흥미로운가요? 언어 이해와 AI 이해 및 정보 배포의 효율성을 결정하기 때문입니다. 그러나 우리는 두 가지 종류의 창의성에 대해 이야기하고 있습니다.

6부: 인간 이해력과 컴퓨터 이해력(6이 흥미로운 숫자라고 말씀드렸죠.)

이제 좀 쉴 수 있겠네요. 어느덧 이정표에 도달한 기분입니다. 왜? 여기에 도달하는 마법의 단어는 다음과 같습니다.


“장난스러움과 확률을 가지고 노는 것의 발견은 우리 세계를 형성하는 데 중요한 역할을 했습니다. 가젤을 찾기 위해 하루 종일 뛰어다닌 모습을 상상하며 우리의 뇌가 편안해지는 순간이 있었습니다. 이를 통해 우리는 너무 집중해서 포착할 수 없었기 때문에 수십 번의 실행 중에 놓쳤을 수 있는 정보를 수집할 수 있었습니다.


이제 상태가 좋아지면 먹이를 잡으려고 할 때 행동하는 데 에너지를 덜 사용하기 때문에 더 많은 생각을 할 수 있습니다. 덤불 속에서 그들을 놀라게 하거나 적어도 그들의 움직임 패턴을 배울 수도 있습니다.”


그래서 한 가지는 확실합니다. 인간은 정신적으로뿐만 아니라 육체적으로도 적응합니다. 우리는 균형이 신체에서 정신으로 그리고 뒤로 어떻게 이동하는지 봅니다. 두뇌와 신체가 모두 더 빠르고 빠르게 작동하도록 허용합니다. 정신적 과정과 육체적 과정이 필요한 작업 분야에 적응합니다. 자, 우리는 그러한 정신적 과정을 어떻게 훈련시켰습니까?


물론 수학으로 말이죠. 그러나 문제가 있습니다. 우리는 그동안 수학을 우리 방식대로 보아왔을 것입니다. 우리는 낙상, 정신력 증가 등의 영향을 느끼고 보았습니다. 우리는 로켓, 자율주행차, 총기 등을 만들 수 있기 때문에 숫자를 매우 잘 이해하고 있다고 믿습니다. 그러나 우리는 저울 역할을 하는 정신적 사다리를 만들 만큼 충분히 숫자를 이해하고 있습니까? 100만과 1의 진정한 차이를 이해할 수 있을까요? 100만, 1조는 어떻습니까? 그런데 100만이 1을 기준으로 현실적인 규모를 갖는다는 조건에서 1조 100만은 2초 전의 100만과 비교했을까요?


보시다시피, 우리의 마음은 특정 개념을 이해하도록 되어 있지만 규모 이해에는 실패할 수 있습니다. 그리고 이해한다면 그 규모를 통해 우리는 주변 세계를 더 잘 이해할 수 있을 것입니다.


나는 이것에 대해 생각할 때마다 소수가 규모 자체를 설명하는 데 중요한 역할을 한다는 것을 말할 수밖에 없습니다. 그리고 제가 이 주제를 열었기 때문에: 보편적인 스케일 팩터가 존재할 수 있습니까? 어느 곳에서나 동일하고 동일한 성장을 지시하는 것? 프라임은 분명히 성장하고 있습니다.


소수의 전체 아이디어는 1과 자기 자신으로만 나누어진다는 것입니다. 물론 현실에도 분할할 수 없는 측면이 있습니다. 원자로 쪼개야만 똑같이 분리될 수 없는 모양. 아이디어 하나라도 빼면 무너지는 개념들.


내 진행 상황을 "전체"로 표현하기가 어렵습니다. 예를 들어, 동일한 아이디어를 바탕으로 두 개의 기사를 시작하고 각 기사에서 서로 다른 경로를 택할 수 있습니다. 아니면 하나의 기사로 시작하여 두 기사의 전체가 되었을 내용을 쓰고 또 쓸 수도 있지만 동일한 수준의 복잡성을 통해 연결되는 대신 아이디어 구축으로 연결됩니다. 그리고 그들의 결말도 순간의 흐름과 영감에 따라 결정되는 아이디어의 규칙과 배열에 따라 위치가 변경됩니다. 이는 시작부터 현재까지의 기울기의 결과이기도 합니다.

7부: 범용 규모

시작부터 현재까지의 기울기입니다. 아마도… 단 네 단어로 설명하기에는 너무 빈약한 것 같습니다.


행성에 직선을 그리기 시작한다고 상상해 보세요. 많이 그릴수록 시작점에서 멀어집니다. 출발선이 출발점이 될 때까지 움직이고 또 움직입니다. 어느 정도 거리에서는 각도의 차이가 거의 눈에 띄지 않아 선을 완벽하게 직선으로 유지합니다. 이러한 변수는 선을 그리는 공간에 따라 변경됩니다. 3D 큐브의 2D 정사각형 부분인지 구인지 여부. (구체와 유사한 2차원 공간을 어떻게 표현해야 할지 모르겠습니다)


따라서 시작부터 현재까지의 기울기는 선을 더 그려야 하는 방향을 아는 데 필요한 각도를 제공할 수 있는 전체 정보입니다.


잠시 도형의 세계로 떠나보자. 우리의 첫 만남은 이상한 모양이다. 구와 정육면체를 모두 포함하기 때문에 이상합니다. 구와 정육면체는 모두 완벽하게 정렬되어 정육면체의 대각선이 구의 지름이기도 합니다. 큐브가 구의 각 대각선에 앞면에서 왼쪽 아래에서 뒷면에서 오른쪽 위로 대각선으로 매달려 있다고 상상해 보세요. 뒤-왼쪽-위에서 앞-오른쪽-아래까지의 다른 대각선도 구의 대각선이어야 합니다. 그렇죠?


큐브를 첫 번째 대각선 주위의 단일 축으로만 회전한다고 가정하면 구 주위를 전체적으로 회전하는 반대 대각선이 있음을 알 수 있습니다(대각선의 반대쪽 가장자리는 항상 구에 닿습니다). 이는 두 번째 축 정보의 외부 지점을 사용하여 첫 번째 축을 중심으로 큐브를 회전시키는 가장 효율적인 방법을 찾았음을 의미합니다.


그러나 다른 정보를 알지 못한 채 전체 회전 동안 균형이 유지되었는지 어떻게 알 수 있습니까? 구의 측면이 남긴 흔적은 항상 동일하다는 점에 유의하세요. 우리는 전체 구를 가로지르는 하나의 직선을 가지고 있습니다.


그래서... 우리는 정육면체의 두 번째 대각선의 길이만 알면 구의 크기를 알 수 있습니다. 그러나 회전 각도도 마찬가지입니다. 구의 경우 항상 360이지만, 정육면체의 대각선 길이를 통해 구의 전체 그림을 볼 수 있습니다. 이런 식으로 우리는 해당 큐브가 나타나기에 완벽한 구에 필요한 잠재적 공간을 나타낼 수 있습니다.


그리고 그 큐브는 항상 회전하고 있기 때문에 구체가 나타날 때 아무 것도 없을 것이라고 확신할 수 있습니다. 그러나 이것이 완전히 사실이 되려면 반대 대각선으로 회전하여 두 번째 대각선을 앵커로 설정하고 그 주위를 회전해야 합니다. 그리고 다양한 차원에서 각도를 계속해서 변경합니다(구에는 결국 무한한 대각선이 있습니다).


시작부터 현재까지의 기울기는 구가 처음 나타나기 전의 크기를 추측하는 데 점점 더 가까워지는 개념입니다. 많은 것 중에서 가장 효율적인 경로를 선택하도록 만들어진 알고리즘에서 양자 상태가 붕괴되는 것과 같습니다. (그리고 이 아이디어는 이 개념을 다른 수준으로 끌어올립니다.)


어디로 가고 싶은지 확실히 잊어버렸고 시간도 내 편이 아니지만 여전히 시간을 좋아합니다. 단순히 행복할 때 사람들이 생각해 낼 수 있는 경이로움을 보여줍니다. (또는 창의적이라고 생각합니다.)

부분(2n+1/2n-1): 끝?

나에게 있어서 세상의 아름다움은 공유되어야 한다. 하지만 조심해서 그렇게 해야 합니다. 잘못된 정보, 오해의 가능성, 정보의 유해성 등 우리는 우리의 행복을 보장해야 합니다. 우리가 안 하면 누가 하겠어요?


양자 혁명이 우리에게 가르쳐 준 것처럼. 그것이 사실이라면 우리는 그것을 알게 될 것입니다. 그렇지 않으면 우리는 그것이 사실이라고 믿습니다. 알려진 확률이 100% 이를 향하고 있는 경우에도 마찬가지입니다. 다른 문자열이 연결되어 있으면 어떻게 되나요? 이는 100% 확률이 반드시 사실을 의미하지 않는 이유를 설명합니다.


그리고 결국, 첨부된 문자열은 단순히 이 정보가 지금 나타나는 것이 안전하지 않은 이유일 수도 있습니다. 이런 식으로 그들은 상대방에게 의존하고 단순히 우리의 관점을 바꾸라고 말할 것입니다. 그들을 안전하게 만들기 위해. (어쩌면 중력, 상호 작용 등에서 발견되는 우주의 법칙에 따라 "안전"에 대한 구체적인 정의가 있을 수도 있습니다.)


결론적으로, 우리 자신을 더 좋게 만들면 우리 주변의 모든 것을 더 좋게 만들 수 있습니다. 그러나 이번에는 단지 인간과 인간의 경험에 관한 것이 아닙니다. 그것은 또한 우리가 창조하기 시작한 세계의 경험에 관한 것이기도 합니다.