当前位置: 首页 > news >正文

Kaggle的[公共数据集平台]

Kaggle的公共数据集平台上提供了大量可直接用于机器学习实战的趣味性和练习性数据集。

以下是我们团队实际评测后精选的推荐清单,这些数据集都经过(基本)清理,可直接用于分析!

二元分类

  • 印度肝病患者记录
  • 欺诈检测合成金融数据
  • 商业与行业报告
  • 产品缺货预测挑战
  • 深空系外行星搜寻
  • 成年人口普查收入预测

多类别分类

  • 鸢尾花物种分类
  • 中国跌倒检测数据
  • 骨科患者生物力学特征

回归分析

  • 含评分数据的电子游戏销售记录
  • 纽约房产交易数据
  • 动态混合气体下的传感器阵列数据

自然语言处理

  • 安然公司邮件数据集
  • Ubuntu对话语料库
  • 历史报纸文本:HC语料库精选子集
  • 语音口音档案库
  • 博客作者身份语料库

时间序列分析

  • 加密货币历史价格
  • 深空系外行星搜寻(兼有时间序列特性)

图像处理

  • YouTube人脸关键点数据集
  • Fashion-MNIST服装分类数据集

地理空间预测

  • 西雅图警方911事件响应
  • 巴尔的摩市911报警电话
  • 芝加哥犯罪记录
  • 费城犯罪数据
  • 伦敦犯罪数据

大型数据集

  • 爱荷华州酒类销售记录
  • 西雅图图书馆借阅记录

(注:所有超链接已保留原始地址,分类标题根据数据集特性进行了专业术语转换,同时确保中文表达符合技术文档的规范要求)

There are lots of machine learning ready datasets available to use for fun or practice on Kaggle's Public Datasets platform. Here is a short list of some of our favorites that we've already had the chance to review. They're all (mostly) cleaned and ready for analysis!

Binary Classification

  • Indian Liver Patient Records
  • Synthetic Financial Data for Fraud Detection
  • Business and Industry Reports
  • Can You Predict Product Backorders?
  • Exoplanet Hunting in Deep Space
  • Adult Census Income

Multiclass Classification

  • Iris Species
  • Fall Detection Data from China
  • Biomechanical Features of Orthopedic Patients

Regression

  • Video Game Sales with Ratings
  • NYC Property Sales
  • Gas Sensor Array Under Dynamic Gas Mixtures

NLP

  • The Enron Email Dataset
  • Ubuntu Dialogue Corpus
  • Old Newspapers: A cleaned subset of HC Corpora newspapers
  • Speech Accent Archive
  • Blog Authorship Corpus

Time Series Analysis

  • Cryptocurrency Historical Prices
  • Exoplanet Hunting in Deep Space

Image Processing

  • YouTube Faces with Facial Keypoints
  • Fashion MNIST

Mapping and Prediction

  • Seattle Police Department 911 Incident Response
  • Baltimore 911 Calls
  • Crimes in Chicago
  • Philadelphia Crime Data
  • London Crime

Large Datasets

  • Iowa Liquor Sales
  • Seattle Library Checkout Records
http://www.hskmm.com/?act=detail&tid=9608

相关文章:

  • UE5 MPCook 时序图
  • P7435 简单的排列计数
  • Nexpose 8.21.0 for Linux Windows - 漏洞扫描
  • slurm启动验证命令
  • 天上的乌云不见了,但是没有下雨,那它们都去哪了呢?
  • 深入解析:多模态大模型3:TAViS
  • 基于STM32F103C8T6与DS18B20的温度测量系统
  • afx100.dll afrvidwindowmanager.dll afresu.dll afrcomputeserver.dll afckernel.dll aexplore_view. - 详解
  • UE5 增量 Cook
  • Oxygen Forensic Detective 18.0 发布,新增功能简介
  • Windows如何美化cmd窗口
  • MX Round 7 解题报告
  • RenderPass与 SubPass 理论
  • 信号处理相关
  • k8s系列--组件说明
  • VMware ESXi 8.0U3g macOS Unlocker OEM BIOS 2.7 Dell HPE Lenovo 定制版 2025 年 9 月更新
  • 详细介绍:AWS WAF 防护敏感配置文件泄露完整指南
  • 梗棋
  • javax.imageio.IIOException: Cant create output stream! 解决方法 验证码出不来
  • 【转载】在Vue3中引用Vue2组件
  • JUC 学习笔记
  • pytorch读书报告
  • 券多多系统-开发记录
  • SpringBoot
  • Redis笔记
  • MYSQL 笔记
  • Java笔记
  • 分布式 笔记
  • Windows Server 2019 中文版、英文版下载 (2025 年 9 月更新)
  • Windows Server 2016 中文版、英文版下载 (2025 年 9 月更新)