paint-brush
Dữ liệu lớn: 70 nguồn dữ liệu miễn phí đáng kinh ngạc bạn nên biết cho năm 2020từ tác giả@skieer2016
147 lượt đọc

Dữ liệu lớn: 70 nguồn dữ liệu miễn phí đáng kinh ngạc bạn nên biết cho năm 2020

từ tác giả Octoparse10m2020/07/14
Read on Terminal Reader
Read this story w/o Javascript

dài quá đọc không nổi

70 nguồn dữ liệu miễn phí bạn nên biết cho năm 2020: 70 sự thật đáng kinh ngạc bạn nên biết cho năm 2020. Dữ liệu về chính phủ, tội phạm, y tế, dữ liệu tài chính và kinh tế, tiếp thị và xã hội, báo chí và truyền thông, bất động sản, danh mục, đánh giá doanh nghiệp, v.v. . Mỹ. Cục điều tra dân số, CIA World Factbook, Cổng dữ liệu mở của Liên minh châu Âu và Socrata đều là các trang dữ liệu mở.

People Mentioned

Mention Thumbnail
Mention Thumbnail

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - Dữ liệu lớn: 70 nguồn dữ liệu miễn phí đáng kinh ngạc bạn nên biết cho năm 2020
Octoparse HackerNoon profile picture

Vui lòng nhấp vào bài viết gốc: http://www.octoparse.es/blog/70-fuentes-de-datos-gratuitas-en-2020

Tất cả trực quan hóa dữ liệu tuyệt vời đều bắt đầu với dữ liệu tốt, rõ ràng. Hầu hết mọi người tin rằng việc thu thập dữ liệu lớn sẽ là một công việc khó khăn, nhưng điều đó đơn giản là không đúng. Có hàng nghìn bộ dữ liệu miễn phí có sẵn trực tuyến, sẵn sàng để bất kỳ ai phân tích và trực quan hóa. Tại đây, chúng tôi đã thu thập 70 nguồn dữ liệu miễn phí cho năm 2020 về dữ liệu chính phủ, tội phạm, y tế, tài chính và kinh tế, tiếp thị và truyền thông xã hội, báo chí và truyền thông, bất động sản, danh mục, đánh giá doanh nghiệp , v.v.

Nguồn dữ liệu miễn phí: Chính phủ

Data.gov : Đây là giai đoạn đầu tiên cung cấp thông tin miễn phí về khí hậu và tội phạm trên web từ chính phủ Hoa Kỳ.

Data.gov.uk : Tại đây có các bộ dữ liệu từ tất cả các cơ quan trung ương của Vương quốc Anh, cũng như nhiều cơ quan công quyền và địa phương khác. Nó hoạt động như một cổng thông tin cho tất cả các loại thông tin về mọi thứ, bao gồm kinh doanh và kinh tế, tội phạm và công lý, quốc phòng, giáo dục, môi trường, chính phủ, y tế, xã hội và giao thông.

Cục điều tra dân số Hoa Kỳ : Trang web này chứa số liệu thống kê mới nhất của chính phủ về cuộc sống của công dân Mỹ, bao gồm dân số, kinh tế, giáo dục, địa lý, v.v.

CIA World Factbook : Dữ liệu về tất cả các nước trên thế giới; tập trung vào các vấn đề lịch sử, chính phủ, dân số, kinh tế, năng lượng, địa lý, thông tin liên lạc, giao thông, quân sự và xuyên quốc gia cho 267 quốc gia.

Socrata : Socrata là một công ty phần mềm định hướng sứ mệnh, là một nơi thú vị khác để khám phá dữ liệu liên quan đến chính phủ bằng một số công cụ trực quan tích hợp. Dữ liệu của nó như một dịch vụ đã được hơn 1.200 cơ quan chính phủ áp dụng cho dữ liệu mở, quản lý hiệu suất và quản trị dựa trên dữ liệu.

Cổng dữ liệu mở của Liên minh Châu Âu : Cổng dữ liệu mở của Liên minh Châu Âu: là điểm truy cập duy nhất vào phạm vi dữ liệu ngày càng tăng từ các tổ chức và các cơ quan khác của Liên minh Châu Âu. Tăng cường dữ liệu bao gồm phát triển kinh tế trong EU và tính minh bạch trong các tổ chức EU, bao gồm dữ liệu địa lý, địa chính trị và tài chính, số liệu thống kê, kết quả bầu cử, hành vi pháp lý và dữ liệu về tội phạm, y tế, môi trường, giao thông và điều tra khoa học. Chúng có thể được sử dụng lại trong các cơ sở dữ liệu và báo cáo khác nhau. Và hơn thế nữa, nhiều định dạng kỹ thuật số khác nhau có sẵn từ các tổ chức EU và các cơ quan EU khác. Cổng thông tin này cung cấp một danh mục được tiêu chuẩn hóa, một danh sách các ứng dụng và công cụ web sử dụng lại dữ liệu này, trình soạn thảo truy vấn điểm cuối SPARQL và quyền truy cập vào API còn lại cũng như lời khuyên về cách sử dụng trang web một cách tốt nhất.

Dữ liệu mở Canada là một dự án thí điểm với nhiều bộ dữ liệu không gian địa lý và chính phủ. Giúp bạn khám phá cách Chính phủ Canada tạo ra sự minh bạch, trách nhiệm giải trình cao hơn, tăng cường sự tham gia của người dân và thúc đẩy đổi mới và cơ hội kinh tế thông qua dữ liệu mở, thông tin mở và đối thoại cởi mở.

Datacatalogs.org - Cung cấp dữ liệu mở từ chính phủ Hoa Kỳ, EU, Canada, CKAN và nhiều hơn nữa.

Trung tâm Thống kê Giáo dục Quốc gia Hoa Kỳ : Trung tâm Thống kê Giáo dục Quốc gia (NCES) là cơ quan liên bang chính thu thập và phân tích dữ liệu liên quan đến giáo dục ở Hoa Kỳ/các quốc gia khác.

Dịch vụ Dữ liệu Vương quốc Anh : Bộ sưu tập Dịch vụ Dữ liệu Vương quốc Anh bao gồm các cuộc khảo sát lớn do chính phủ Vương quốc Anh tài trợ, khảo sát xuyên quốc gia, nghiên cứu theo chiều dọc, dữ liệu điều tra dân số Vương quốc Anh, tổng hợp quốc tế, dữ liệu thương mại và dữ liệu định tính.

Nguồn dữ liệu miễn phí: Tội phạm

Báo cáo tội phạm thống nhất : Chương trình UCR là điểm khởi đầu cho các nhà điều hành thực thi pháp luật, sinh viên, nhà nghiên cứu, thành viên của giới truyền thông và công chúng tìm kiếm thông tin về tội phạm ở Hoa Kỳ.

Thống kê tội phạm của FBI : Các báo cáo thống kê tội phạm và các ấn phẩm thống kê nêu chi tiết các tội phạm cụ thể và mô tả các xu hướng để hiểu các mối đe dọa tội phạm ở cấp địa phương và quốc gia.

Cục Thống kê Tư pháp : thông tin về mọi thứ liên quan đến hệ thống tư pháp hình sự Hoa Kỳ, bao gồm các trường hợp tử vong liên quan đến bắt giữ, điều tra dân số tù nhân, khảo sát quốc gia về phòng thí nghiệm tội phạm DNA, cơ quan điều tra thực thi pháp luật, v.v.

Tìm kiếm tội phạm tình dục quốc gia là một nguồn tài nguyên an toàn công cộng chưa từng có cho phép công chúng truy cập vào dữ liệu tội phạm tình dục trên toàn quốc. Trình bày thông tin cập nhật nhất được cung cấp bởi mỗi khu vực pháp lý.

Nguồn dữ liệu miễn phí: Sức khỏe

Cục Quản lý Thực phẩm & Dược phẩm Hoa Kỳ : Tại đây bạn sẽ tìm thấy tệp dữ liệu nén từ cơ sở dữ liệu Drugs@FDA. Drugs@FDA được cập nhật hàng ngày và tệp dữ liệu này được cập nhật mỗi tuần một lần vào Thứ Ba.

UNICEF : UNICEF thu thập bằng chứng về tình hình trẻ em và phụ nữ trên toàn thế giới. Các bộ dữ liệu bao gồm dữ liệu chính xác, mang tính đại diện trên toàn quốc từ các cuộc khảo sát hộ gia đình và các nguồn khác.

Tổ chức Y tế Thế giới : Thống kê về dinh dưỡng, bệnh tật và sức khỏe ở hơn 150 quốc gia. Healthdata.gov – Dữ liệu chăm sóc sức khỏe của Hoa Kỳ trong 125 năm, bao gồm dữ liệu Medicare ở cấp độ yêu cầu bồi thường, dịch tễ học và thống kê dân số.

Trung tâm Thông tin Chăm sóc Xã hội và Sức khỏe NHS : Bộ dữ liệu sức khỏe của Dịch vụ Y tế Quốc gia Vương quốc Anh. Tổ chức này sản xuất hơn 260 ấn phẩm thống kê chính thức và quốc gia. Điều này bao gồm dữ liệu so sánh quốc gia về các mục đích sử dụng thứ cấp, được phát triển từ số liệu thống kê dài hạn của bệnh viện có thể giúp những người ra quyết định ở địa phương cải thiện chất lượng và hiệu quả của dịch vụ chăm sóc tuyến đầu.

Nguồn dữ liệu miễn phí: dữ liệu tài chính và kinh tế

Dữ liệu mở của Ngân hàng Thế giới : Thống kê giáo dục về mọi thứ từ tài chính đến các chỉ số cung cấp dịch vụ.

Dữ liệu kinh tế IMF : Một nguồn thông tin cực kỳ hữu ích bao gồm báo cáo ổn định tài chính toàn cầu, báo cáo kinh tế khu vực, thống kê tài chính quốc tế, tỷ giá hối đoái, phương hướng kinh doanh và hơn thế nữa.

Cơ sở dữ liệu UN Comtrade : Truy cập miễn phí vào dữ liệu thương mại toàn cầu chi tiết bằng hình ảnh trực quan. UN Comtrade là kho lưu trữ số liệu thống kê thương mại quốc tế chính thức và các bảng phân tích có liên quan. Tất cả dữ liệu có thể được truy cập thông qua API.

Dữ liệu Tài chính Toàn cầu : Với dữ liệu về hơn 60.000 công ty trong 300 năm, Dữ liệu Tài chính Toàn cầu cung cấp một nguồn đặc biệt duy nhất để phân tích những biến động của nền kinh tế toàn cầu.

Google Finance : Báo giá và biểu đồ chứng khoán theo thời gian thực, tin tức tài chính, chuyển đổi tiền tệ hoặc danh mục đầu tư được theo dõi

. Google Public Data Explorer : Google Public Data Explorer cung cấp dữ liệu công khai và dự báo từ nhiều tổ chức quốc tế và cơ sở học thuật, bao gồm Ngân hàng Thế giới, OECD, Eurostat và Đại học Denver. Chúng có thể được hiển thị dưới dạng biểu đồ đường, biểu đồ thanh, sơ đồ mặt cắt hoặc trên bản đồ.

Cục Phân tích Kinh tế Hoa Kỳ : Số liệu thống kê ngành và kinh tế vĩ mô chính thức của Hoa Kỳ, chủ yếu báo cáo về tổng sản phẩm quốc nội (GDP) của Hoa Kỳ và các đơn vị khác nhau. Họ cũng cung cấp thông tin về thu nhập cá nhân, lợi nhuận doanh nghiệp và chi tiêu của chính phủ trong Tài khoản Sản phẩm và Thu nhập Quốc gia (NIPA).

Công cụ tìm kiếm dữ liệu tài chính tại OSU : Có nhiều liên kết phong phú đến mọi thứ liên quan đến tài chính, cho dù ít người biết đến, bao gồm Chỉ số Phát triển Thế giới Trực tuyến, Dữ liệu Mở của Ngân hàng Thế giới, Dữ liệu Tài chính Toàn cầu, Cơ sở dữ liệu Thống kê của Quỹ Tiền tệ Quốc tế và Thông tin EMIS .

Cục Nghiên cứu Kinh tế Quốc gia : Dữ liệu vĩ mô, dữ liệu ngành, dữ liệu năng suất, dữ liệu thương mại, tài chính quốc tế, dữ liệu và hơn thế nữa.

Ủy ban Chứng khoán và Giao dịch Hoa Kỳ : Bộ dữ liệu hàng quý về thông tin được trích xuất từ các vật chứng cho báo cáo tài chính doanh nghiệp nộp cho Ủy ban.
Trực quan hóa kinh tế : Trực quan hóa dữ liệu về nền kinh tế.

Thời báo Tài chính : Thời báo Tài chính cung cấp nhiều thông tin, tin tức và dịch vụ cho cộng đồng doanh nghiệp toàn cầu.

Nguồn dữ liệu miễn phí: Tiếp thị và truyền thông xã hội

Amazon API : Khám phá bộ dữ liệu công khai của Amazon Web Services theo danh mục để có được nhiều thông tin. Amazon API Gateway cho phép các nhà phát triển kết nối an toàn các ứng dụng web và thiết bị di động với các API chạy trên Amazon Web (AWS) Lambda, Amazon EC2 hoặc các dịch vụ web có thể truy cập công khai khác được lưu trữ bên ngoài AWS.

Hiệp hội Đại lý Du lịch Hoa Kỳ : ASTA là hiệp hội các chuyên gia du lịch lớn nhất thế giới. Cung cấp thông tin cho các thành viên, bao gồm các đại lý du lịch và các công ty có sản phẩm họ bán, chẳng hạn như các tour du lịch, du lịch trên biển, khách sạn, cho thuê xe, v.v.

Social Mention : Social Mention là một nền tảng phân tích và tìm kiếm trên mạng xã hội tổng hợp nội dung do người dùng tạo từ khắp nơi trên thế giới thành một luồng thông tin duy nhất.

Google Trends – Google Trends hiển thị tần suất nhập các cụm từ tìm kiếm cụ thể bằng nhiều ngôn ngữ khác nhau so với tổng lượng tìm kiếm trên toàn thế giới.

API Facebook : Tìm hiểu cách đăng và truy xuất dữ liệu từ Facebook bằng API đồ thị.

API Twitter : Nền tảng Twitter kết nối trang web hoặc ứng dụng của bạn với cuộc trò chuyện toàn cầu diễn ra trên Twitter. API Instagram : Nền tảng API Instagram có thể được sử dụng để xây dựng các ứng dụng và dịch vụ tự động, xác thực, chất lượng cao.

API Foursquare : API Foursquare cung cấp cho bạn quyền truy cập vào cơ sở dữ liệu địa điểm đẳng cấp thế giới của chúng tôi và khả năng tương tác với người dùng và người bán Foursquare.

HubSpot : Kho lưu trữ dữ liệu tiếp thị khổng lồ. Bạn có thể tìm thấy số liệu thống kê và xu hướng tiếp thị mới nhất tại đây. Nó cũng cung cấp các công cụ để tiếp thị truyền thông xã hội, quản lý nội dung, phân tích trang web, trang đích và tối ưu hóa công cụ tìm kiếm.

Moz : Thông tin SEO bao gồm nghiên cứu từ khóa, xây dựng liên kết, kiểm tra trang web và thông tin tối ưu hóa trang nhằm giúp doanh nghiệp có cái nhìn rõ hơn về vị trí họ xếp hạng trong công cụ tìm kiếm và cách cải thiện thứ hạng của họ.

Viện Tiếp thị Nội dung : Tin tức, nghiên cứu mới nhất về tiếp thị nội dung.

Nguồn dữ liệu miễn phí: Báo chí và truyền thông

Mạng lưới Nhà phát triển Thời báo New York – Tìm kiếm các bài viết của Times từ năm 1851 đến ngày nay, truy xuất các tiêu đề, tóm tắt và liên kết đến đa phương tiện liên quan. Bạn cũng có thể tìm kiếm các bài đánh giá sách, danh sách sự kiện ở New York, bài đánh giá phim, những câu chuyện hàng đầu có hình ảnh, v.v.

API báo chí liên kết : API nội dung AP cho phép bạn tìm kiếm và tải xuống nội dung bằng các công cụ biên tập của riêng bạn mà không cần phải truy cập vào cổng AP. Cung cấp quyền truy cập vào AP, hình ảnh và video do thành viên sở hữu và bên thứ ba do AP sản xuất và các bên thứ ba được chọn.

Trình xem Ngram Sách của Google : Đây là một công cụ tìm kiếm trực tuyến ghi lại tần số của bất kỳ tập hợp chuỗi tìm kiếm nào được phân cách bằng dấu phẩy bằng cách sử dụng số lượng n-gram hàng năm được tìm thấy trong các nguồn in từ năm 1500 đến năm 2008 trong tập hợp văn bản của Google.

Cơ sở dữ liệu Wikipedia : Wikipedia cung cấp bản sao miễn phí của tất cả nội dung có sẵn cho người dùng quan tâm.

FiveThirtyEight : Đây là một trang web tập trung vào phân tích các cuộc thăm dò ý kiến, blog chính trị, kinh tế và thể thao. Dữ liệu và mã trên Github đằng sau câu chuyện và sự tương tác của FiveThirtyEight.

Google Scholar : Google Scholar là một công cụ tìm kiếm trên web truy cập miễn phí, lập chỉ mục toàn bộ văn bản hoặc siêu dữ liệu của tài liệu học thuật ở nhiều định dạng và nguyên tắc xuất bản khác nhau. Bao gồm hầu hết các tạp chí và sách học thuật trực tuyến được bình duyệt, tài liệu hội nghị, luận văn và luận án, bản in trước, bản tóm tắt, báo cáo kỹ thuật và các tài liệu học thuật khác, bao gồm cả ý kiến của tòa án và bằng sáng chế.

Nguồn dữ liệu miễn phí: Bất động sản

Castles : Castles là một cơ quan độc lập thuộc sở hữu tư nhân thành công. Được thành lập vào năm 1981, họ cung cấp một dịch vụ toàn diện bao gồm bán nhà ở, cho thuê và quản lý cũng như khảo sát và định giá.

Realestate.com : RealEstate.com đóng vai trò là nguồn tài nguyên tốt nhất cho người mua nhà lần đầu, cung cấp các công cụ dễ hiểu và lời khuyên của chuyên gia ở mọi giai đoạn của quy trình.

Gumtree – Gumtree là trang rao vặt miễn phí đầu tiên ở Anh. Mua và bán các mặt hàng, ô tô, tài sản và tìm kiếm hoặc cung cấp việc làm trong khu vực của bạn đều có sẵn trên trang web.

James Hayward : Cung cấp cách tiếp cận cơ sở dữ liệu sáng tạo để bán, cho thuê và quản lý nhà ở.

Lifull Home's : Trang web bất động sản của Nhật Bản.

Immobileiare.it : Trang web bất động sản của Ý.

Subito : Trang web bất động sản của Ý.

Immoweb : Trang web bất động sản hàng đầu của Bỉ.

Nguồn dữ liệu miễn phí: Danh bạ và đánh giá doanh nghiệp

LinkedIn : LinkedIn là một dịch vụ mạng xã hội định hướng kinh doanh và việc làm hoạt động thông qua các trang web và ứng dụng di động. Nó có 500 triệu thành viên ở 200 quốc gia và bạn có thể tìm thấy danh bạ doanh nghiệp tại đây.

OpenCorporate : OpenCorporate là cơ sở dữ liệu mở lớn nhất về các công ty và dữ liệu công ty trên thế giới, với hơn 100 triệu công ty ở số lượng khu vực pháp lý tương tự. Mục tiêu chính của chúng tôi là làm cho thông tin về các công ty trở nên dễ sử dụng hơn và phổ biến rộng rãi hơn vì lợi ích công cộng, đặc biệt là giải quyết việc sử dụng các công ty cho mục đích tội phạm hoặc chống xã hội, ví dụ như tham nhũng, rửa tiền và tội phạm có tổ chức.

Trang vàng : Nguồn ban đầu để tìm và kết nối với thợ sửa ống nước, thợ sửa ống nước, thợ cơ khí, luật sư, nha sĩ, v.v.

Craigslist : Craigslist là một trang web quảng cáo được phân loại của Mỹ với các phần dành riêng cho công việc, nhà ở, cá nhân, để bán, các mặt hàng mong muốn, dịch vụ, cộng đồng, hợp đồng biểu diễn, sơ yếu lý lịch và diễn đàn thảo luận.

GAF Master Elite Contractor : Được thành lập vào năm 1886, GAF đã trở thành nhà sản xuất tấm lợp dân dụng và thương mại lớn nhất ở Bắc Mỹ (Nguồn: nghiên cứu của Fredonia Group). Thành công của chúng tôi trong việc phát triển công ty lên doanh thu gần 3 tỷ USD là kết quả của việc không ngừng theo đuổi chất lượng, kết hợp với kiến thức chuyên môn hàng đầu trong ngành và các giải pháp lợp mái toàn diện. Jim Schnepper là chủ tịch của GAF, một công ty con đang hoạt động của Standard Industries. Khi bạn đang tìm cách bảo vệ những thứ bạn coi trọng nhất, đây chỉ là một số lý do chúng tôi nghĩ bạn nên chọn GAF.

Chắc chắnTeed : Tại đây bạn có thể tìm thấy các nhà thầu, người tu sửa, người lắp đặt hoặc nhà xây dựng ở Hoa Kỳ và Canada cho dự án khu dân cư hoặc thương mại của bạn.

Các công ty ở California : Tất cả thông tin về các công ty ở California.

Manta : Manta là một trong những nguồn tài nguyên trực tuyến lớn nhất cung cấp sản phẩm, dịch vụ và cơ hội giáo dục. Thư mục của Manta có hàng triệu khách truy cập mỗi tháng đang tìm kiếm cơ sở dữ liệu toàn diện về từng công ty, phân khúc ngành và danh sách địa lý cụ thể.

EU-Startups : Thư mục về các công ty khởi nghiệp ở EU.、

Hiệp hội luật sư Kansas : Danh mục luật sư. Hiệp hội Luật sư Kansas (KBA) được thành lập vào năm 1882 với tư cách là một hiệp hội tự nguyện dành cho các chuyên gia pháp lý tận tâm và có hơn 7.000 thành viên, bao gồm luật sư, thẩm phán, sinh viên luật và trợ lý luật sư.

Nguồn dữ liệu miễn phí: Các trang web cổng thông tin khác

Capterra : Thư mục và đánh giá phần mềm doanh nghiệp.

Monster : Nguồn dữ liệu về việc làm và cơ hội nghề nghiệp.

Glassdoor : Danh mục công việc và thông tin nội bộ của công ty với các đánh giá của nhân viên, công cụ tính lương được cá nhân hóa, v.v.

Đề án Garage Tốt : Danh mục về Dịch vụ Ô tô, Bộ GTVT hoặc Sửa chữa Ô tô

OSMOZ : Thông tin về hương thơm.

Octoparse : Một công cụ trích xuất dữ liệu miễn phí để thu thập trực tuyến tất cả dữ liệu web nêu trên.