從理想設計、現實限制到有依據的科學決策
國家生物模式中心 (National Center for Biomodels)
國家實驗研究院 (National Institute of Applied Research)
June 30, 2026
experimental unit 是什麼?| 時間 | 主題 |
|---|---|
| 09:00–09:35 | 從原則到可執行的研究設計 |
| 09:35–10:20 | 為什麼 PaBV 研究需要鸚鵡? |
| 10:20–10:30 | 休息 |
| 10:30–11:10 | 從鳥到 cell:有效資訊與 replication |
| 11:10–11:35 | p-value、資料判讀與推論界線 |
| 11:35–12:00 | 理想設計、現實限制與執行紀錄 |
即使研究已經:
結果仍可能因為 model、design、execution 或 interpretation 而不可靠。
p-value 不會替我們檢查實驗設計,即使 *p* < 0.05,仍需確認:
分析單位正確嗎?
experimental unit 是否被當成真正的 n?
組間差異能歸因於 treatment 嗎?
randomization、blinding 與 confounding 是否妥善處理?
分析決策是事先定義的嗎?
endpoint、排除規則與分析方法是否看到結果後才改變?
Smith & Pell. BMJ. 2003;327:1459–1461. doi:10.1136/bmj.327.7429.1459
這個 RCT 的 exposure,是否等於真正想回答的情境?
Trial condition
高度:0.6 m;速度接近 0 km/h 停在地面的飛機/直升機
Target condition
high altitude;高速墜落
Important
統計與分析都正確,但研究情境沒有代表真正要解答的問題。
Yeh et al. BMJ. 2018;363:k5094. doi:10.1136/bmj.k5094
秦良丰事件
| 階段 | 常見問題 |
|---|---|
| Research question | 問題模糊、primary endpoint 未定義 |
| Model | 物種或疾病模型無法代表目標 biology |
| Design | unit、control、randomization、sample size 不適當 |
| Execution | operator、時間、housing、batch 發生 drift |
| Analysis | 忽略 dependence、missing data 或 multiple testing |
| Reporting | 只呈現部分結果,方法不足以重建 |
1 Repeatability
同一團隊、同一設備、短時間內重做
2 Within-laboratory reproducibility
同一實驗室、不同批次或不同人員
3 Between-laboratory reproducibility
不同實驗室仍能得到相容結果
4 External / translational validity
結果能否延伸至其他條件、物種或臨床情境
Note
前三層問的是「能否重現」;第四層問的是「能否推廣」。
同一隻動物內增加測量
增加 biological replication - 需要更多 independent animals
Technical replication 可以提高 measurement precision,
但不能取代 animal-level biological variation。
如果研究因設計或執行問題而無法產生可信知識:
Important
Scientific validity (科學效性) 不是 3R 之外的額外要求; 是合理使用動物的必要條件。
Power analysis 顯示每組需要 12 隻動物,
但目前經費與設施只能支持每組 4 隻。
合理的作法是什麼?
Warning
Reduction 的目標:
Illustration: Kim Caesars / Springer Nature
價格便宜
飼養容易
試劑資源多
文獻資源完整
Important
Important
Experimental unit 是能被獨立分派 treatment 的最小單位。
Treatment → bird
Treatment → cage
Treatment → room
判斷原則
EU 1 隻鳥 experimental unit
M 10 張切片 tissue sections
M 100 個視野 microscopic fields
M 5,000 個細胞 single-cell observations
M 數百萬 reads sequencing reads
Important
Important
Important
Warning
Technology-first
先決定使用新技術
→ 再尋找樣本與研究問題
可能風險:
Tip
Question-led
研究問題
→ model 與 experimental unit
→ endpoint 與 replication
→ 選擇合適技術
主要優點:
Note
新技術可以幫助發現 exploratory question,但不能變成明確的研究問題。
留下可追蹤的決策流程,是研究設計的重點。
Parrot bornavirus (PaBV)與proventricular dilatation disease (PDD)/
avian bornaviral ganglioneuritis (ABG) 密切相關。
Note
PaBV infection、viral shedding、tissue lesion 與 clinical disease 並不是同一件事。
這些層次不一定同步出現,也是研究、診斷與治療上的重要瓶頸。
| 研究層次 | 可以觀察的 evidence | 主要回答的問題 |
|---|---|---|
| Exposure/inoculation | dose、route、time | 動物接受了什麼 exposure? |
| Evidence of infection | RT-PCR、viral antigen、seroconversion | 是否建立 infection? |
| Persistence/viral shedding | longitudinal swabs、tissue distribution | 病毒是否持續存在或排出? |
| Tissue lesion | ganglioneuritis、gliosis、neuronal injury | 是否造成組織與神經病變? |
| Clinical disease | GI dysfunction、weight loss、neurological signs | 是否發展成臨床疾病? |
Important
PCR positive ≠ tissue lesion ≠ clinical PDD
不同 endpoint 需要不同的採樣方法、追蹤時間與 animal number。
| 模型 | 可以回答 | 不能取代 |
|---|---|---|
| Mouse | 若能建立感染,可測試部分 host response | 必須先證明 susceptibility 與 disease relevance |
| Avian cell system | virus propagation、cellular response、screening | tissue interaction、clinical disease |
| Psittacine bird | infection 到 tissue lesion/ clinical phenotype | 成本、時間與 welfare burden 較高 |
Important
Replacement 的判準不是「能不能做實驗」,而是「能不能回答問題」。
我們曾嘗試在 mouse 進行 PaBV inoculation,但未能建立可用的感染模型。
這個結果表示:
Warning
未發表經驗,不是 PaBV host range 的定論。
Classical swine fever vaccine (兔化豬瘟疫苗):
傳統豬瘟疫苗見證防疫長路。(圖片來源╱翻攝《豐年》第8卷第13期,1958年7月1日出版)
Note
目前仍缺乏廣泛使用的 psittacine cell lines、reference atlas 與 species-specific reagents。
PaBV genotype 與 psittacine nervous-tissue response 有何關係?
目前可以拿到的結果是:
因此,whole-animal psittacine model 仍提供不可替代的資訊。
使用稀少、飼養困難且負擔較高的動物時,必須同時注意:
Important
這是一個 small-n、28-day exploratory early-response study,不是完整 disease-course study。
Study design based on the current manuscript Methods and Figure 2a.
Important
追蹤時間決定能回答的 endpoint;增加 assays 不能補回缺少的時間。
Gancz et al. Virol J. 2009;6:100. doi:10.1186/1743-422X-6-100
Leal de Araujo et al. PLoS ONE. 2017;12:e0187797. doi:10.1371/journal.pone.0187797
Gartner et al. Avian Pathol. 2021;50:138–150. doi:10.1080/03079457.2020.1852177
| 研究策略 | 主要取得的資訊 | 主要代價/ 限制 |
|---|---|---|
| 長期追蹤 | • viral shedding • seroconversion • clinical course • attrition |
• 長期飼養負擔高 • 若採樣稀疏,延長時間未必增加有效資訊 |
| 分期犧牲取樣 | • 病毒與病變在組織間的先後順序 • 不同疾病階段的pathology |
• 每隻動物只能提供一個terminal time point • 每個時間點都需要足夠的animal replication |
| 短期密集分析 | • early tissue response • cellular composition • mechanistic detail |
• 無法回答chronic persistence • 無法觀察late clinical disease |
| 重複非侵入性採樣 | • individual trajectory • onset與intermittent change |
• 可測量的endpoint有限 • 重複操作仍可能造成動物負擔 |
Important
追蹤多久、何時採樣、分析多深,決定研究最後能回答什麼。
長期飼養 cockatiels 需要:
| 28-day design 可以支持 | 不能充分支持 |
|---|---|
| early tissue response | complete disease course |
| early neuropathological change | chronic persistence/carrier state |
| exploratory genotype-associated patterns | long-term shedding |
| tissue-processing feasibility | late GI pathology |
| early cellular remodeling | clinical incidence/survival |
Important
縮短 follow-up 必須同步縮小研究問題,而不是只縮短 protocol。
超出設計能力PaBV-4與PaBV-5是否會造成不同的疾病?
目前設計可探索目前設計明確限定:
Important
研究問題、觀察時間、endpoint 與結論範圍必須一致。
n = 3n = 2
PAPER FIGURE|Gancz et al., 2009
Gancz AY, et al. Virology Journal. 2009;6:100. doi:10.1186/1743-422X-6-100
2/3 是觀察結果,不是穩定發生率
Important
小樣本仍可提供因果證據,但不適合精確估計發生率或族群差異。
Gancz AY, et al. Virology Journal. 2009;6:100. doi:10.1186/1743-422X-6-100
n = 2n = 1
PAPER EXCERPT|Mirhosseini et al., 2011
Mirhosseini N, et al. Journal of Avian Medicine and Surgery. 2011;25:199–204. doi:10.1647/2010-030.1
PAPER FIGURE|Leal de Araujo et al., 2017
Leal de Araujo J, et al. PLoS ONE. 2017;12:e0187797. doi:10.1371/journal.pone.0187797
| Study | 主要回答的問題 | 設計提供的資訊 | 主要限制 |
|---|---|---|---|
| 2009 challenge | PaBV exposure能否重現PDD相關病變? | early causal/ proof-of-concept evidence | small n、multiple routes |
| 2011 challenge | PaBV-2 challenge後會觀察到什麼? | limited challenge observation | baseline infection、housing confounding |
| 2017 time course | 病毒與病變如何隨時間進入不同組織? | temporal與tissue distribution | replication分散至多個time points |
Important
評估動物實驗時,先了解想要回答什麼,再判斷實驗設計能支持多大的結論。
10 minutes
當鸚鵡活體模型仍不可替代時,減量(Reduction)不只是減少動物數:
Important
重點不是每隻動物做更多檢測,而是讓每一項檢測共同回答同一個問題。
Important
技術愈新、資料愈多,不代表研究問題回答得更好;關鍵是選擇適合的觀察層次。
Tang F, et al. Nature Methods. 2009;6:377–382. doi:10.1038/nmeth.1315
Ståhl PL, et al. Science. 2016;353:78–82. doi:10.1126/science.aaf2403
Important
scRNA-seq 增加的是細胞層次的解析能力,不會自動增加獨立動物數。
神經組織中出現膠質細胞增生 (gliosis)、神經元退化或發炎變化
這些細胞是誰? 在做什麼?
Important
新的技術應該用來回答原本無法解決的問題,而不是單純增加資料量。
代表性病理影像,來源:作者投稿中手稿。
Important
接受不同病毒接種的是動物個體;細胞數與 UMI 再多,也不會增加動物層次的生物重複。
Important
每隻動物先個別處理;確認細胞數與存活率後,才將同組細胞等比例混合。
實際限制當時希望保留Important
混合樣本是為了讓三個實驗組別都能完成分析,不會增加生物重複。
可以描述不能直接判斷Important
可以比較三個混合基因庫的變化模式,但不能將數千個細胞視為數千個生物重複。
Note
技術選擇必須在動物使用前決定,因為它會改變樣本處理方式與可支持的結論。
Stoeckius M, et al. Genome Biology. 2018;19:224. doi:10.1186/s13059-018-1603-1
| 樣本 | 優先用途 | 可回答的問題 | 備援 |
|---|---|---|---|
| 大腦/小腦 | scRNA-seq | 細胞變化模式 | 冷凍組織 |
| 相鄰腦組織切片 | H&E/IHC | 病變與標記驗證 | 影像檔案 |
| 腸胃道/神經節 | 組織病理 | 其他組織是否受影響 | 分子檢測 |
| 拭子/血液 | 縱向檢測 | 感染變化歷程 | 生物資料庫 |
Important
主要研究終點優先;探索性多體學分析不能排擠必要的組織病理與驗證。
Important
組織分配應依主要研究終點與樣本保存條件決定,而不是平均切開。
Important
重複採樣具有 Reduction 潛力,但採樣頻率仍須由研究問題與動物福祉共同決定。
不同技術回答不同層次的問題
組織病理保留組織脈絡;scRNA-seq 提供細胞層次解析。
混合樣本可以解決實務限制,也會犧牲個體來源
更多細胞與 UMI 可以提高解析能力,但不會增加動物個體層次的重複。
提高資訊量必須從實驗前開始規畫
基因庫策略、組織分配與縱向採樣,都會影響最後可以回答的問題。
Important
Reduction 不只是從每隻動物取得最多資料
更重要的是取得足以回答研究問題、且可以正確解釋的資料
Important
同一個數字,只有放回資料產生的層次,才知道能支持哪一種結論。
Note
同一塊神經組織中的變化,可能來自不同細胞族群比例改變,也可能來自特定細胞狀態改變。
AI生成示意圖;非真實資料。
Important
UMAP 進行降維匯整將高維資料視覺化,但每個點仍然要放回原本的樣本來源解讀。
| 細胞族群 | 對照組 | 處理組 |
|---|---|---|
| Neuron-like cells | 62% | 48% |
| Astrocyte-like cells | 12% | 20% |
| Oligodendrocyte-like cells | 18% | 22% |
| Other cells | 8% | 10% |
適合:
不適合:
Important
根據前一張混合樣本的細胞組成表:
可以描述需要更多證據不能直接跳到Important
高維資料可以提供線索,但「描述差異」、「解釋原因」與「推論到動物族群」是不同層次。
若把數千個 cells 當成觀察值,p-value 可能非常小。
| 問題 | 是否能直接回答? |
|---|---|
| 兩個混合基因庫中的 cell distribution / gene expression 是否不同? | 可以 |
| 不同動物個體是否反應一致? | 不行 |
| genotype 是否造成族群層次穩定差異? | 不行 |
Important
顯著的 p-value 仍然只能回答它所屬資料層次的問題。
Zimmerman KD, et al. Nature Communications. 2021;12:738. doi:10.1038/s41467-021-21038-1
Squair JW, et al. Nature Communications. 2021;12:5692. doi:10.1038/s41467-021-25960-2
假設兩個混合基因庫各有 8,000 個 cells:
| 比較單位 | 統計檢定看到的 n | p-value 能回答什麼? |
|---|---|---|
| cell | 8,000 vs 8,000 cells | 這份資料中的 cell-level 差異 |
| 基因庫 | 1 vs 1 mixed library | 無法估計組內變異 |
| 動物個體 | 個別來源已消失 | 無法估計 animal-to-animal variation |
判讀前先問:
n 代表什麼?Important
統計計算可能正確,但如果比較單位不同,p-value 回答的問題也不同。
即使不能直接支持動物族群層次的確認性結論,探索性資料仍可用來:
Important
探索性資料的價值,不是替代生物重複,而是降低下一次實驗失敗的風險。
| 證據來源 | 可以提供的支持 | 不能取代 |
|---|---|---|
| H&E | 組織層次的病變 | 動物個體間重複 |
| IHC | 標記位置與細胞形態 | 定量推論本身 |
| scRNA-seq | 細胞族群與轉錄狀態線索 | animal-level replication |
| 病毒檢測 | 感染、組織分布或時間關聯 | 隨機分派與獨立樣本 |
Important
多層證據一致可以增加生物學合理性;但不同檢測方法不是新的動物個體。
可以這樣寫在這個案例中,不同混合基因庫呈現不同的細胞組成與轉錄變化模式。
這些變化可作為後續假說來源,並與 H&E、IHC 或病毒檢測結果進行對照。
由於個別動物來源未保留,是否能推廣到動物個體層次,仍需要具備 animal-level biological replication 的後續研究。
避免這樣寫理想通常豐滿,現實往往骨感
回答問題需要什麼:
Important
現實限制應該在設計階段改變研究問題,而不是在實驗完成後才拿來解釋不足。
| 現實限制 | 直接影響 | 必須重新決定 |
|---|---|---|
| 只有 6 隻動物可用 | animal-level replication 很低 | 保留三組探索性比較,或減少比較組別 |
| 只能負擔 3 個 scRNA-seq 基因庫 | 個體來源識別受限 | 混合樣本、multiplexing 或分階段設計 |
| 最長追蹤 28 天 | 無法推論完整疾病歷程 | 偵測早期感染反應 |
| 只有 3 個飼養空間 | 飼養空間可能與處理組別混淆 | 重新規畫分配、批次與飼養策略 |
| 組織有限 | 病理、PCR、IHC、scRNA-seq 互相競爭 | 主要研究終點優先 |
| 可能有動物淘汰 | 最終可分析的 n 下降 | 預留數量並設定繼續/停止條件 |
Important
若目前設計無法回答問題,暫緩執行也是最負責任的減量 (Reduction)。
| 項目 | 現實限制 | 最後選擇 | 結論影響 |
|---|---|---|---|
| 動物數 | 可用動物有限 | 定位為先導試驗 | 不做確認性結論 |
| scRNA-seq | 基因庫數有限 | 同組混合或 multiplexing | 限縮個體層次推論 |
| 追蹤時間 | 最長 28 天 | 聚焦早期研究終點 | 不談完整疾病歷程 |
| 組織分配 | 樣本有限 | 病理與病毒檢測優先 | 次要分析定位為探索性 |
| 飼養條件 | 隔離空間有限 | 明確記錄並盡量平衡 | 若無法分離,結論需保守 |
Note
每一個折衷都要有能對應最後能支持的結論。
6 隻動物 3 個隔離飼養空間 3 scRNA-seq 基因庫 28 天追蹤 病理、PCR、IHC、scRNA-seq 都想做
Important
重新設計不是把檢測塞滿,而是讓問題、設計與結論重新對齊。
不論方案由誰提出,只檢查四件事:
Note
好的檢視不是提出更多檢測方法,而是指出哪一項設計決策會改變推論。
可再搭配:
NC3Rs Experimental Design Assistant (EDA) 協助研究者圖形化設計決策檢查。
Important
EDA 不是替研究者決定答案,而是讓設計決策被明確畫出來以進行檢查以及討論。
NC3Rs. Experimental Design Assistant. nc3rs.org.uk
Smith AJ, et al. Laboratory Animals. 2018;52:135–141. doi:10.1177/0023677217724823
如果同一天處理三組腦組織樣本:
若細胞存活率隨處理時間下降:
應對方式:
盲目試驗以分階段設計,不是全有或全無。
Percie du Sert N, et al. PLoS Biology. 2020;18:e3000410. doi:10.1371/journal.pbio.3000410
動物 ID 籠位 / 房間 處理條件 樣本 ID 基因庫 / 影像 分析輸出
Important
公開資料可以去識別化;研究團隊內部不能切斷 linkage key。
| 3R | 本案例中的實際意義 |
|---|---|
| Replacement | 先評估小鼠與細胞模型,並說明適用邊界 |
| Reduction | 聚焦研究問題、提高有效資訊、分階段設計與資料再利用 |
| Refinement | 改善飼養條件、保定操作、採樣負擔與人道終點 |
Note
Refinement 不是把研究「做得更精緻」,而是減少動物的疼痛、緊迫與不必要負擔。
可能包括:
提醒:
影像、聲音、時間點或細胞可以很多,但真正彼此獨立的動物可能很少。
開始前:設計先寫清楚執行中:紀錄要串得回去解釋時:結論不要超過設計哪一句最準確?
Discussions