看真题,最直观

5 道真实样例题

以下 5 题取自公开的预览集Anthropic/BioMysteryBench-preview),是全集 99 题的样本。每题给出真实问题、标准答案、数据模态,以及能用它验收的 pipeline 类型。全集 99 题需申请访问,见 获取与合规

hb002专家可解测序 / 宏基因组

这个测序数据里含有什么细菌?请给出该细菌的学名。

原文:What bacteria is found in this sequenced dataset? Provide the bacteria's scientific name as the answer.

标准答案:Bacillus licheniformis 对接 pipeline:宏基因组物种鉴定(kraken2 / MetaPhlAn / BLAST)
recqgsfxqqodhjens专家可解ChIP-seq

下列 peaks 数据代表的是哪个转录因子的结合位点?请给出该转录因子的基因符号。

原文:Identify the transcription factor whose binding sites are represented by the provided peaks data. Provide the transcription factor's gene symbol.

标准答案:CTCF 对接 pipeline:ChIP-seq(MACS2 call peak → motif / HOMER → TF 鉴定)
hb020专家可解蛋白质结构 (PDB)

这个晶体结构属于哪个物种?请用双名法(如 Canis lupus、Mus musculus)作答。

原文:What organism does this crystal structure belong to? Provide the answer using binomial nomenclature…

标准答案:Homo sapiens 对接 pipeline:结构 / 序列比对(BLAST vs PDB / UniProt)
hb053专家未解出bulk RNA-seq

二穗短柄草(Brachypodium distachyon)在某种特定胁迫下做了转录组测序。根据差异表达基因的序列,施加的是什么扰动?请用简短短语描述胁迫类型(如 'drought stress')。

原文:…what was the perturbation? Provide the stress type as a short descriptive phrase…

标准答案:Heat stress(热胁迫) 对接 pipeline:RNA-seq 差异表达 + 通路 / 功能富集推断
hb022专家未解出bulk RNA-seq 表达谱

这份数据是人胰腺癌细胞系的基因表达谱,样本被匿名为 Sample_01…,分到 Condition_X / Condition_Y 两个实验条件。判断其中某个条件对应的是哪些样本。

原文:This dataset contains gene expression profiles from human pancreatic cancer cell lines… divided into two experimental conditions…

标准答案:一组 Sample_NN 列表 对接 pipeline:RNA-seq 定量 + 分类 / 聚类
从这 5 题能看出什么

三点观察

  • 模态比官方列举的更广。hb020 是「蛋白晶体结构 → 判物种」,属结构生物学、根本不是测序——说明 99 题里很可能还藏着没被点名的类型,可对接的 pipeline 不止测序类。
  • 答案明文写在 rubric 里(「The answer is X」)+ 统一 all-or-nothing 评分 → 非常适合做自动化 pass / fail 断言。
  • 两道 专家未解出 正是反例:连专家都没解出,你的 pipeline 跑出别的结果不代表 pipeline 错——所以别拿难题当对错基线。

所有题统一允许联网到 conda.anaconda.orgncbi.nlm.nih.gov、Ensembl 等(由每题的 allowed_domains 字段约束),解题环境一致、便于本地复现。


看完整的「模态 ↔ pipeline」映射 →