当前位置: 首页 > news >正文

xxx.ped 在生物信息学中是什么?

以cropformer为例:
image
上图中每一行和每一列分别表示什么意思?

要理解 test.ped 文件中的数据含义,需结合作物基因组学中PED格式的标准定义Cropformer的研究背景(基于基因组SNP数据预测作物表型),具体解析如下:

1. PED格式的通用结构

在作物/人类基因组研究中,PED文件是存储“样本系谱+基因型”的标准格式,每一行代表一个样本,列的含义为:

  • 第1列:Family ID(家系ID,若无复杂家系可与个体ID一致)
  • 第2列:Individual ID(个体/样本唯一标识)
  • 第3列:Paternal ID(父本ID,无则填0
  • 第4列:Maternal ID(母本ID,无则填0
  • 第5列:Sex(性别,作物研究中通常填0
  • 第6列:Phenotype(表型标签,此处填-9表示“未用于表型分类,仅作为基因型载体”)
  • 第7列及以后:SNP基因型(每个SNP位点的等位基因,按“A/T/C/G”等碱基对编码,每两个字符代表一个位点的基因型)

2. 结合图片的逐列解析

以图片中第1行数据 MG_998_X_MG_1522 MG_998_X_MG_1522 0 0 0 -9 C T C C T... 为例:

  • 第1-2列:MG_998_X_MG_1522
    是样本的家系ID和个体ID,说明这是一个“自交系”或“杂交组合”样本(命名格式符合玉米/水稻育种材料的编号习惯)。
  • 第3-4列:0 0
    表示该样本的父本、母本信息未知(或无系谱记录,作物研究中大量育种材料为纯系,此列常填0)。
  • 第5列:0
    作物无性别区分,故填0
  • 第6列:-9
    表示该样本的表型未用于“分类任务”(Cropformer是“表型预测”任务,表型标签单独存储在test_label.csv中,此处PED仅承载基因型)。
  • 第7列及以后:C T C C T...
    SNP位点的基因型编码。每个SNP位点用两个字符表示(如C T代表该位点的两个等位基因),后续每两个字符对应一个SNP位点。这些碱基对是Cropformer模型的输入特征,用于学习“基因型→表型”的关联。

3. 在Cropformer中的角色

结合文献可知,Cropformer的核心是“从基因组SNP数据预测作物表型”。test.ped测试集的基因型文件,与 test_label.csv(测试集表型标签)一一对应:

  • test.ped 提供“测试样本的SNP基因型”(模型输入);
  • test_label.csv 提供“测试样本的真实表型”(模型评估的对照标签)。

模型通过学习训练集的“基因型-表型”关联后,在test.ped的基因型上输出预测表型,再与test_label.csv的真实值对比,从而评估预测精度(如Pearson相关系数、均方误差)。

总结

test.pedCropformer测试集中的“基因型数据载体”,遵循PED格式标准,存储了测试样本的系谱(简化为个体ID)和SNP基因型信息,是模型进行“基因组→表型”预测的核心输入数据之一。

http://www.hskmm.com/?act=detail&tid=40415

相关文章:

  • Ollama 基本概念
  • 2025年桥洞力学板市场趋势与选购指南:江苏同芯木业江苏行业领先
  • 2025年桥洞力学板行业发展趋势与前五厂家推荐
  • 2025年10月桥洞力学板品牌综合评测与行业趋势分析
  • 【往届EI、Scopus已检索|ACM独立出版】第二届经济数据分析与人工智能国际学术会议 (EDAI 2025)
  • 吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践(一)
  • win11后台程序cpu高占用问题
  • 云端微信 - 随时随地在浏览器访问
  • 2025 年碳化硅金刚线切割机,石墨金刚线切割机,陶瓷金刚线切割机厂家最新推荐,产能、专利、适配性三维数据透视
  • 2025 年 10 月油石、保温材料、玉石、石英金刚线切割机厂家最新推荐,产能、专利、环保三维数据透视
  • 2025 年 10 月瓦楞纸、蜂窝铝、硬质合金金刚线切割机厂家最新推荐,实力品牌深度解析采购无忧之选!
  • Ollama安装
  • 2025年泄压门厂家权威推荐榜单:防爆窗/泄爆门/抗爆窗源头厂家精选
  • 我的鸿蒙开发学习之旅:从零到初级认证
  • Perplexity AI研究助手10个提示词
  • Linux 下使用 tar 与 pigz 进行多核压缩
  • CentOS7 查看开机启动项和程序服务
  • 2025年pvc线槽厂家权威推荐榜单:线槽盖板/不锈钢线槽/塑料线槽板源头厂家精选
  • 微算法科技(NASDAQ MLGO)研发基于AI的动态权重学习模型,开启区块链账户关联分析智能新时代
  • 25 1.28
  • 2025年10月敏感肌产品推荐榜单:权威评测与科学选购指南
  • 2025年10月敏感肌产品推荐榜:五款温和美白产品权威评测与深度对比
  • MCP - 优化 Agent 调用 MCP tools提示词(九)
  • 2025年10月祛斑产品推荐:专业评测榜单及用户真实反馈汇总
  • hutool工具类post请求
  • 今年口碑好的新加坡留学品牌
  • 国产项目管理工具崛起:Gitee如何以本土化优势赋能中国企业数字化转型
  • 2025年10月洗碗机品牌对比榜:海信零菌技术深度评测
  • 2025年10月全屋智能家居品牌推荐:盈趣领衔五强对比评测榜
  • 2025年10月离婚房产律师排行:权威榜单与实测评价