5 道真实样例题
以下 5 题取自公开的预览集(Anthropic/BioMysteryBench-preview),是全集 99 题的样本。每题给出真实问题、标准答案、数据模态,以及能用它验收的 pipeline 类型。全集 99 题需申请访问,见 获取与合规。
这个测序数据里含有什么细菌?请给出该细菌的学名。
原文:What bacteria is found in this sequenced dataset? Provide the bacteria's scientific name as the answer.
下列 peaks 数据代表的是哪个转录因子的结合位点?请给出该转录因子的基因符号。
原文:Identify the transcription factor whose binding sites are represented by the provided peaks data. Provide the transcription factor's gene symbol.
这个晶体结构属于哪个物种?请用双名法(如 Canis lupus、Mus musculus)作答。
原文:What organism does this crystal structure belong to? Provide the answer using binomial nomenclature…
二穗短柄草(Brachypodium distachyon)在某种特定胁迫下做了转录组测序。根据差异表达基因的序列,施加的是什么扰动?请用简短短语描述胁迫类型(如 'drought stress')。
原文:…what was the perturbation? Provide the stress type as a short descriptive phrase…
这份数据是人胰腺癌细胞系的基因表达谱,样本被匿名为 Sample_01…,分到 Condition_X / Condition_Y 两个实验条件。判断其中某个条件对应的是哪些样本。
原文:This dataset contains gene expression profiles from human pancreatic cancer cell lines… divided into two experimental conditions…
三点观察
- 模态比官方列举的更广。
hb020是「蛋白晶体结构 → 判物种」,属结构生物学、根本不是测序——说明 99 题里很可能还藏着没被点名的类型,可对接的 pipeline 不止测序类。 - 答案明文写在 rubric 里(「The answer is X」)+ 统一 all-or-nothing 评分 → 非常适合做自动化 pass / fail 断言。
- 两道 专家未解出 正是反例:连专家都没解出,你的 pipeline 跑出别的结果不代表 pipeline 错——所以别拿难题当对错基线。
所有题统一允许联网到 conda.anaconda.org、ncbi.nlm.nih.gov、Ensembl 等(由每题的 allowed_domains 字段约束),解题环境一致、便于本地复现。