paint-brush
Python의 보급률: 57%가 Python을 데이터 과학 도구로 선택~에 의해@jessblaq
1,127 판독값
1,127 판독값

Python의 보급률: 57%가 Python을 데이터 과학 도구로 선택

~에 의해 Jessica Blaquiere5m2023/04/19
Read on Terminal Reader
Read this story w/o Javascript

너무 오래; 읽다

HackerNoon 커뮤니티는 가장 인기 있는 옵션 중 일부를 바탕으로 주력 데이터 과학 도구가 무엇인지 물었고 374명이 응답했습니다. 50% 이상의 독자가 데이터 과학을 위한 도구로 Python을 선택했습니다. RStudio는 응답자의 9%만이 선택했습니다.
featured image - Python의 보급률: 57%가 Python을 데이터 과학 도구로 선택
Jessica Blaquiere HackerNoon profile picture
0-item
1-item


특집 이미지는 "비단뱀이 승리합니다, 디지털 판타지 아트"라는 메시지와 함께 Midjourney Diffusion을 통해 생성되었습니다.


데이터 과학에 대하여

데이터 과학은 통계, 프로그래밍, 커뮤니케이션이 교차하는 분야입니다. 데이터 과학자는 질문을 하고 데이터를 사용하여 다양한 복잡성의 메커니즘을 통해 해당 질문에 답합니다. 그들은 각 데이터 유형에 어떤 테스트와 방법을 적용할지 알 수 있는 지식과 툴킷을 갖추고 있습니다. 그리고 데이터에서 답변을 추출하고 일반적인 일상 커뮤니케이션 형태로 해당 답변을 전달할 수 있는 능력이 있습니다.


데이터의 범위는 단순한 것부터 매우 복잡한 것까지 다양합니다. '깨끗'할 수도 있고 '지저분'할 수도 있습니다. 때로는 질문이 있지만 데이터가 없습니다. 데이터 과학자 및/또는 분석가는 전문 도구를 사용하여 지저분한 데이터를 깨끗한 데이터로 변환해야 합니다. 그들은 또한 '개발할 수 있다' 긁기 ' 질문에 답하는 데 필요한 것이 없는 경우 데이터를 가져오도록 설계된 프로그램입니다. 데이터가 얻어지고 사용 가능한 형태가 되면 Python, RStudio 등과 같은 프로그램 및 도구를 통해 통계 테스트 및 모델로 푸시됩니다. 그러나 어떤 도구가 가장 좋습니까?


HackerNoon 독자 여러분


출처 : Giphy


HackerNoon의 주간 여론 조사 (2023년 10월 4일부터 2023년 4월 16일까지)는 독자들이 이 주제에 대해 어디에 속하는지 평가하는 데 사용되었습니다. HackerNoon 커뮤니티는 가장 인기 있는 옵션 중 일부를 바탕으로 주력 데이터 과학 도구가 무엇인지 물었고 374명이 응답했습니다. 결과는 아래 이미지에서 확인할 수 있습니다.



  • [ ] 주로 기술 커뮤니티에 속한 HackerNoon 독자의 50% 이상이 Python을 데이터 과학 도구로 선택했습니다. 이것은 그다지 놀라운 일이 아닙니다. 파이썬 모든 사람이 액세스할 수 있는 오픈 소스입니다 🙂🙃🙂🙃🙂🙃🙂🙃🙂🙃🙂🙃


출처 : Giphy


  • [ ] 18% 선택됨 뛰어나다 최고의 데이터 과학 도구로 선택되었습니다.
  • [ ] 설문 조사 응답자의 9%만이 Power BI를 선택했습니다**.**
  • [ ] 또한 오픈 소스 도구인 RStudio 득표율은 9%에 불과했다.
  • [ ] 마지막으로 단 5%만이 선택했습니다. 태블로 데이터 과학을 위한 도구로



도구

선택할 수 있는 도구가 왜 그렇게 많습니까? 이 필드 시간이 지남에 따라 복잡성이 증가함에 따라 도구 선택도 자연스럽게 이루어졌습니다. 데이터 과학의 흐름이 너무 많아서 각 개인이 자신에게 적합한 도구를 스스로 결정해야 합니다. 그리고 현실적으로는 여러 도구를 동시에 사용하게 됩니다.


설문 조사에서 각 도구의 주요 내용을 살펴보겠습니다. 물론 여기서 논의되지 않은 도구도 더 있습니다 😆


뛰어나다

❌ 오픈소스.

✅ Microsoft 방식으로 사용자 친화적입니다!

❌ 복잡한 데이터 과학 프로젝트에는 충분히 발전되지 않았습니다.

✅ 쉽게 내보낼 수 있는 세련된 차트와 그래프를 생성합니다.


이번 여론조사만 빼고요! 출처 : Giphy


우리 모두 엑셀에 익숙합니다. 물론 데이터 조작, 정리, 시각화와 같은 일상적인 작업에는 적합하지만 고급 프로젝트에는 적합하지 않습니다. 대시보드와 보고서를 만드는 데 능숙할 수 있으며 Excel 내에서 특수 API를 설정할 수도 있습니다.


알스튜디오

✅ 오픈 소스.

❌ 상당한 학습 곡선이 있습니다.

✅ 깔끔하고 사용자 정의 가능한 그래프, 표, 출력을 생성할 수 있습니다.

❌ 일부 고급 기계 학습 도구에서는 제한될 수 있습니다.

✅ 통계 기반 문제에 특화되어 있습니다.


데이터 분석 및 데이터 과학에 탁월한 다용도 오픈 소스 프로그램은 RStudio , 이제 빛나는 새 이름으로 바뀌었습니다. 가정 .


** “우리의 임무는 데이터 과학, 과학 연구, 기술 커뮤니케이션을 위한 오픈 소스 소프트웨어를 만드는 것입니다. 우리는 경제적 수단에 관계없이 모든 사람의 지식 생산과 소비를 향상시키기 위해 이를 수행합니다.” -- Posit \ Python과 유사하게 R 프로그래밍 언어의 다양성은 방대하므로 데이터 과학자가 여러 접근 방식을 사용하여 복잡한 작업을 수행할 수 있습니다. 프로그래머가 활용할 수 있는 전문적인 작업을 수행하기 위해 라이브러리와 패키지가 지속적으로 개발되고 있습니다. 그리고 원하는 패키지가 없다면 직접 개발하세요 !


R과 Python을 함께 사용할 수 있습니다. R 및 Python 프로그래머와 공동 프로젝트를 진행 중이라면 이 점을 살펴보세요.


파워 BI

❌ 오픈소스.

✅ 아름다운 보고서를 만듭니다.

❌ 사용하기 쉬워 보이지만 숨겨진 복잡성이 있습니다.

✅ 데이터 논쟁 및 조작에 적합합니다.

❌ 복잡한 데이터 과학 프로젝트에는 제한된 능력이 있습니다.

✅ 다양한 소스에서 데이터를 긁어낼 수 있습니다.


Power BI는 정말 빛납니다. 데이터 시각화 및 보고서 도구 데이터 과학을 위한 주력 도구가 아닙니다. 정규식 등과 같은 맞춤형 코딩 작업을 통해 전문적인 데이터 조작을 수행할 수 있는 기능을 갖추고 있습니다. 그러나 복잡한 데이터 과학 프로젝트를 진행하는 경우 프로젝트 마지막 단계에서 Power BI를 더 많은 용도로 사용할 가능성이 있습니다. 프레젠테이션 도구 중 하나입니다.


파이썬

✅ 오픈 소스.

❌ 상당한 학습 곡선이 있습니다.

✅ 깔끔한 그래프, 표, 출력을 생성할 수 있습니다.

✅ TensorFlow, Scikit-learn, NumPy, Pandas, PyTorch 등과 같은 수많은 데이터 과학 라이브러리가 있습니다.

✅ 학습 노력을 더욱 발전시킬 수 있는 다목적 프로그래밍 언어입니다.


파이썬 객체지향, 다목적 프로그래밍 언어이다. 배우기 쉽고 다양한 프로그래밍 언어로 알려져 있습니다. 다재다능함으로 인해 대규모 프로그래머 커뮤니티가 있으므로 교육 리소스는 끝이 없습니다. 엄청나게 많다 데이터 과학 도서관 사용할 준비가 된 것입니다.


Python으로 작업하려면 가상 환경을 설정하는 방법을 배우고 작업을 수행할 Jupyter Notebook 과 같은 컴퓨팅 플랫폼을 선택해야 할 것입니다.


태블로

❌ 오픈소스.

✅ 아름다운 대시보드를 만듭니다.

❌ 정리, 랭글링 등 데이터 전처리 능력이 제한되어 있습니다.

✅ 데이터 분석에 적합합니다.

❌ 복잡한 데이터 과학 프로젝트에는 제한된 능력이 있습니다.

✅ 보고서와 대시보드는 다른 사람과 쉽게 공유할 수 있습니다.


태블로 비용으로 인해 대규모 팀에서 자주 사용되는 뛰어난 데이터 분석 및 시각화 소프트웨어입니다. 데이터의 다양한 측면을 강조할 수 있는 아름답고 직관적인 프레젠테이션 스타일 대시보드를 만들 수 있습니다. 그러나 이는 데이터 프로젝트의 시작 및 중간 단계가 아닌 보고 단계에 더 전문화되어 있기 때문에 확실히 유용한 도구는 아닙니다.



마지막 생각들

우리의 여론 조사에 따르면 Python이 데이터 과학 도구에 대한 선택 항목 중 1위에 올랐습니다. 데이터 과학 분야 안팎에서 다양성을 고려하면 이는 놀라운 일이 아닙니다. Python은 배우기 쉬운 프로그래밍 언어로 알려져 있습니다. 솔직히 말하자면, 컴퓨터 코딩의 완전한 초보자라면 처음에는 " 쉽지 " 않을 것이지만, 연습을 하면 결국에는 제2의 천성이 될 것입니다.



댓글로 여러분의 생각을 공유해 주시고 다른 HackerNoon 설문조사 에도 참여해 주세요.