動物實驗規劃與執行

從理想設計、現實限制到有依據的科學決策

陳敬元 Jing-Yuan Chen, DVM, PhD

jychen@niar.org.tw

國家生物模式中心 (National Center for Biomodels)
國家實驗研究院 (National Institute of Applied Research)

June 30, 2026

串連昨天的課程

前一天談了
- 實驗動物 3R
- 環境優化
- 生物統計
今天介紹的是：
- 如何把這些原則組合成一個 真正能執行也能誠實解釋 的動物實驗。

今天由五個問題下手

為什麼一定使用這個物種？
真正的 experimental unit 是什麼？
現實限制改變了哪些研究問題？
p-value 支持的是哪一層推論？
使用每一隻動物，究竟取得了多少可信資訊？

本日課程大綱

時間	主題
09:00–09:35	從原則到可執行的研究設計
09:35–10:20	為什麼 PaBV 研究需要鸚鵡？
10:20–10:30	休息
10:30–11:10	從鳥到 cell：有效資訊與 replication
11:10–11:35	p-value、資料判讀與推論界線
11:35–12:00	理想設計、現實限制與執行紀錄

為什麼好的動物實驗仍可能失敗？

即使研究已經：

通過倫理審查
使用適當統計方法
完成動物照護與環境控制

結果仍可能因為 model、design、execution 或 interpretation 而不可靠。

顯著結果不一定是可信結果

p-value 不會替我們檢查實驗設計，即使 *p* < 0.05，仍需確認：

分析單位正確嗎？
experimental unit 是否被當成真正的 n？
組間差異能歸因於 treatment 嗎？
randomization、blinding 與 confounding 是否妥善處理？
分析決策是事先定義的嗎？
endpoint、排除規則與分析方法是否看到結果後才改變？

沒有 RCT，就代表沒有合理證據嗎？

BMJ 2003

找不到比較「背降落傘」與「不背降落傘」的 randomized controlled trial。
沒有 randomized controlled trial，就不能判斷降落傘有用嗎？

Smith & Pell. BMJ. 2003;327:1459–1461. doi:10.1136/bmj.327.7429.1459

RCT 做了，但回答的是哪一個情境？

這個 RCT 的 exposure，是否等於真正想回答的情境？

Trial condition
高度：0.6 m；速度接近 0 km/h 停在地面的飛機／直升機

Target condition
high altitude；高速墜落

Important

統計與分析都正確，但研究情境沒有代表真正要解答的問題。

Yeh et al. BMJ. 2018;363:k5094. doi:10.1136/bmj.k5094
秦良丰事件

【CORE｜2分鐘】

「後來真的有人進行了降落傘 randomized trial，而且研究設計與統計分析本身沒有明顯錯誤。」

「研究結果顯示 parachute 與 empty backpack 沒有差異。但先不要急著下結論，要先看受試者是在什麼情境下跳下來：飛行器停在地面，高度大約只有 0.6 公尺，速度接近零。」

「對照真實跳傘，2018 年國軍傘兵秦良丰在訓練過程中，因降落傘未正常張開而由高空墜落，受到嚴重傷害。這裡不是要用單一事件證明降落傘有效，而是讓大家看見兩個 exposure 的根本差異。」

「BMJ trial 正確回答的是：從停在地面的飛行器跳下時，降落傘是否有額外效益。它沒有回答：從飛行中的高空飛機跳下時，降落傘是否能降低死亡與重大傷害。」

「所以研究設計與統計都正確，仍不代表研究回答了我們真正關心的問題。動物模型也是如此。一個方便、標準化而且容易做統計的模型，如果沒有重現真正的宿主與疾病 biology，就可能回答了另一個問題。」

Reproducibility 可能在哪裡中斷？

階段	常見問題
Research question	問題模糊、primary endpoint 未定義
Model	物種或疾病模型無法代表目標 biology
Design	unit、control、randomization、sample size 不適當
Execution	operator、時間、housing、batch 發生 drift
Analysis	忽略 dependence、missing data 或 multiple testing
Reporting	只呈現部分結果，方法不足以重建

「重複」其實有不同層次

1　Repeatability

同一團隊、同一設備、短時間內重做

2　Within-laboratory reproducibility

同一實驗室、不同批次或不同人員

3　Between-laboratory reproducibility

不同實驗室仍能得到相容結果

4　External / translational validity

結果能否延伸至其他條件、物種或臨床情境

Note

前三層問的是「能否重現」；第四層問的是「能否推廣」。

Technical replication ≠ Biological replication

同一隻動物內增加測量

10 張 tissue sections
100 張 images
5,000 個 cells
millions of reads

增加 biological replication - 需要更多 independent animals

Technical replication 可以提高 measurement precision，
但不能取代 animal-level biological variation。

低 reproducibility 也是動物倫理問題

如果研究因設計或執行問題而無法產生可信知識：

動物已承受研究程序
經費與時間已投入
後續研究可能建立在不可靠結果上
其他團隊可能再次使用動物重做

Important

Scientific validity (科學效性) 不是 3R 之外的額外要求； 是合理使用動物的必要條件。

當理想設計超出現實資源

Power analysis 顯示每組需要 12 隻動物，
但目前經費與設施只能支持每組 4 隻。

合理的作法是什麼？

1) 先做實驗，得到顯著 p-value 就表示設計正確，實驗成功！
2) 仍以每組 4 隻執行，維持原本的 confirmatory conclusion
3) 增加更多 measurements，補償動物數不足
4) 重新評估研究目的：縮小問題、改為 pilot，或暫緩執行

【CORE｜2分鐘】這裡先跟大家討論一個很常見的現實情境。假設我們在規畫階段，利用生物統計方法算出預期 effect size 和 variability，估計每一組需要 12 隻動物。但實際盤點後，經費、空間和人力只能支持每組 4 隻。這時候應該怎麼辦？

【停 20 秒，請學生選擇】

第一個選項，是有可能出現的情形！樣本數不足的研究仍可能偶然得到顯著 p-value。反過來，沒有顯著結果也不代表沒有 biological effect。p-value 不能在實驗完成後，回頭證明原本的樣本數規畫合理。

第二個選項，是直接把動物數降到每組 4 隻，但仍然維持原本的研究問題和結論。這是最常見、也最危險的做法。因為我們減少的是動物數，卻沒有同步降低對證據的要求。

第三個選項，是對每隻動物做更多 measurements。例如多拍幾張影像、多切幾張組織切片，或測量更多 genes。這些做法可以增加資訊解析度，但不能把 4 隻動物變成 12 個 independent biological replicates。

所以第四個選項：重新評估研究目的以及可以回答的問題。我們可以縮小研究問題、把研究明確定位成 pilot、改用較精確的 endpoint、分階段執行，或者在目前條件下暫緩動物實驗。重點不是經費不足就不能做任何研究，而是研究問題必須配合設計能力調整。

這是今天很重要的一個原則：可以縮小研究問題，但不能假裝有限的設計仍然支持原本強度的結論。

Part 1｜理論原則 vs 真實研究

Reduction 不是「越少越好」

Warning

動物數過多，會造成不必要的 animal harm。
動物數過少、無法回答問題，也無法產生足以支持動物使用的 scientific benefit。

Reduction 的目標：

使用足以回答研究問題的最少動物數，同時維持研究的 scientific validity。
動物數、研究效度與動物負擔必須一起評估。

Illustration: Kim Caesars / Springer Nature

【CORE｜2分鐘】

Reduction 不是把動物數降得越低越好，而是 Harm–Benefit analysis 的一部分。

使用過多動物，會增加不必要的 harm；但使用過少動物，如果研究根本無法回答問題，動物仍然承受了實驗負擔，卻沒有產生足以支持這些使用的 scientific benefit。

右側這張圖把 3Rs 與 scientific validity 放在同一個天平上。圖中的 statistics、experimental design 與 reporting，提醒我們研究品質不是 3R 以外的額外要求，而是合理使用動物的必要條件。

這不是一個可以直接用數字相減的簡單天平。真正要評估的是：研究問題是否重要、成功產生有效知識的可能性、動物負擔的程度與時間，以及 Replacement、Reduction、Refinement 是否都已充分考慮。

所以合理的 Reduction，是使用足以回答研究問題的最少動物數，而不是只追求最小的 n。

從研究問題到可執行實驗

【CORE｜2分鐘】

「一個動物實驗不是從選統計方法開始，而是至少要經過四個彼此相依的層次。」

第一層是 scientific question：我們真正想知道什麼？如果問題沒有定義清楚，後面就不知道該選擇哪個 endpoint。

第二層是 biological model：這個物種、疾病模型或細胞系統，是否真的具有回答問題所需的 biology？後面的 PaBV 案例會特別談這一點。

第三層才是 experimental design，包括 comparison group、experimental unit、randomization、blinding 與 sample size。

第四層是 operational protocol：由誰執行、什麼時間採樣、如何編碼、如何保存資料，以及發生 deviation 時怎麼記錄。

這四層不是彼此獨立的 checklist。如果前面的 model 不成立，後面即使使用正確統計方法，也只是精確地回答了錯的問題。Statistics 可以分析一個設計，但不能替我們修復一個無效的研究問題或模型。

容易取得的動物，不一定是有效模型

價格便宜

能否重現相關 disease biology

飼養容易

是否具有合理的 host susceptibility

試劑資源多

endpoint 是否能回答研究問題

文獻資源完整

結果是否具有 biological relevance

Important

Model availability ≠ model validity
方便，不等於適合。

【CORE｜2分鐘】

很多人在開始設計動物實驗時，第一個想到的是：「哪一種動物最容易取得？」或是「哪個model在paper上最常見？」「哪個物種 reagent 最多？」「哪個 reference genome 最完整？」

這些考量都不是錯，因為它們會直接影響成本、後續分析技術成熟度，以及實驗能不能順利完成。但如果我們真正想回答的是一個 biological question，第一個問題不應該是「哪個 model 最方便？」，而應該是「哪個 model 最能回答這個問題？」

一個動物即使價格便宜、飼養成熟、試劑很多，如果它不能重現我們關心的 disease biology，或宿主對病原的反應與目標問題差異太大，那麼後續得到再多資料，也可能無法支持原本想回答的問題。

所以這裡想先建立一個觀念：Model availability 不等於 model validity。方便取得是現實考量，但模型是否適合回答研究問題，才是決定研究價值的核心。

轉場：當我們選定一個看似合適的模型後，下一個問題就是：實驗中的「一個獨立樣本」到底是什麼？這就會進入 experimental unit。

Experimental unit：先追蹤 treatment assignment

Important

Experimental unit 是能被獨立分派 treatment 的最小單位。

Treatment → bird

每隻鳥可被獨立分派 treatment
鳥可能是 experimental unit

Treatment → cage

同一 cage 內動物接受相同 treatment
cage 才是 experimental unit

Treatment → room

整個 room 只有一種 treatment
room effect 與 treatment 可能無法分離

判斷原則

先看 treatment 分派給誰
再看哪些觀察值彼此獨立

【CORE｜3分鐘】

這張先複習 experimental unit，但不展開一般教科書案例。

我會建議大家不要一開始就問：「我量了幾個樣本？」
而是先問：「treatment 是分派給誰？」

如果 treatment 是分派給每一隻鳥，而且每隻鳥可以獨立接受不同處理，那鳥就可能是 experimental unit。

但如果 treatment 是以 cage 為單位分派，例如整籠吃同一種飼料、接受同一種環境處理，那 cage 才是 experimental unit。這時候同一籠裡面有很多隻鳥，並不代表有很多個獨立的 treatment replicate。

更麻煩的是，如果整個 room 只有一種 treatment，另一個 room 是另一種 treatment，這時候 treatment 和 room effect 就可能混在一起。後續看到差異時，我們很難判斷是 treatment effect，還是 room 本身造成的差異。

所以判斷 experimental unit 的第一步不是看你最後量了多少 tissue、多少 field、多少 cells，而是回到最前面：treatment assignment 是怎麼做的。

轉場：下一張會進一步說明，為什麼 measurement unit 不等於 experimental unit。也就是說，即使我們從一隻動物身上產生很多切片、影像、細胞或 sequencing reads，它們仍然不會自動變成很多個獨立動物。

Measurement unit 不等於 experimental unit

EU 1 隻鳥 experimental unit

→

M 10 張切片 tissue sections

→

M 100 個視野 microscopic fields

→

M 5,000 個細胞 single-cell observations

→

M 數百萬 reads sequencing reads

Important

5,000 個細胞 ≠ 5,000 隻獨立動物
measurement unit 增加，不代表 experimental unit 增加。

【CORE｜2分鐘】

這張接續前一張 experimental unit 的概念。

這裡先假設 treatment 是分派給每一隻鳥，所以鳥是 experimental unit。

但是從同一隻鳥身上，可以產生很多層次的資料：10 張 tissue sections、100 個 microscopic fields、5,000 個 cells，甚至最後產生數百萬個 sequencing reads。

這些資料量看起來很多，但它們都仍然來自同一個 biological source。也就是說，measurement unit 變多了，不代表 experimental unit 變多了。

這在現在的高通量資料特別重要。scRNA-seq、spatial transcriptomics、digital pathology 都很容易產生大量 observations，但如果這些 observations 都來自同一隻動物，它們不能被當成很多隻獨立動物來做正式推論。

所以這裡的核心訊息是：資料量增加，可以提高 measurement resolution，但不能取代 biological replication。

轉場：接下來要問的是，在不同研究目的下，我們到底需要什麼等級的 replication 與推論強度。

清楚實驗類型，才可以下正確的結論

Important

研究目標不同，結論強度就不同。
不適合把 feasibility 或 exploratory study 包裝成 confirmatory 的正式結論。

【CORE｜2分鐘】

在動物實驗設計裡，我們常常會把不同目的的研究混在一起討論，但 feasibility、exploratory 和 confirmatory study 回答的是不同層級的問題。

第一種是 feasibility。它問的是「能不能做？」例如這個模型能不能建立、感染能不能成功、樣本能不能收得到、流程會不會大量失敗。這類研究的重點是技術可行性，不是正式證明 treatment effect。

第二種是 exploratory。它問的是「可能發生什麼？」這時候我們可能會看趨勢、看 cell population、看可能被影響的 pathway，目標是產生假說。Exploratory study 可以很有價值，但它的結論通常不能直接當成正式因果推論。

第三種是 confirmatory。它問的是「預先定義的效果是否成立？」這時候 endpoint、experimental unit、biological replication 與統計分析方法，理論上都應該在實驗前定義清楚。這類研究才比較適合做正式推論。

所以這張想建立一個很重要的觀念：不是每一個研究都要一開始就做成 confirmatory study；但也不能把 feasibility 或 exploratory 的結果，包裝成 confirmatory 的結論。

轉場：下一張會特別談 pilot study。Pilot 很常被誤解成「縮小版的正式實驗」，但它真正的價值不是證明效果，而是降低下一步研究的不確定性。

Pilot 不是縮小版 confirmatory study

Important

Pilot studies reduce uncertainty.
Pilot 通常不能可靠證明 treatment effect。

【CORE｜1分鐘】

這張接續前一張的研究類型。Pilot study 很常被誤解成「縮小版的 confirmatory study」，但這個想法其實不太正確。

Pilot 的主要價值，不是要用少量動物去證明 treatment effect，而是幫我們降低下一步研究的不確定性。

例如，我們可以用 pilot 估計動物是否容易取得、模型流程是否能建立、感染或處置流程是否可行、樣本處理失敗率大概有多高，以及資料變異大概落在哪個範圍。

Pilot 也可能看到 potential effect direction，也就是效果方向看起來往哪裡走。但這通常只能幫助我們設計下一步研究，不能直接當成正式證明。

所以我會把 pilot 的定位放在 feasibility 到 exploratory 之間。它可以幫我們回答「下一步正式研究要怎麼設計比較不會失敗」，但通常不能回答「treatment effect 是否已經被證明」。

轉場：接下來會回到更上游的問題，也就是研究問題本身應該先於技術。否則我們很容易因為有平台、有經費，就反過來尋找問題。

技術應該服務研究問題

Warning

Technology-first

先決定使用新技術
→ 再尋找樣本與研究問題

可能風險：

endpoint 不清楚
experimental unit 未定義
replication 與預算不匹配
產生大量但難以解釋的資料

Tip

Question-led

研究問題
→ model 與 experimental unit
→ endpoint 與 replication
→ 選擇合適技術

主要優點：

資料有明確用途
design 與 analysis 一致
能判斷技術是否必要

Note

新技術可以幫助發現 exploratory question，但不能變成明確的研究問題。

【CORE｜2分鐘】

研究很容易受到新技術吸引。例如實驗室剛好取得一部新儀器、某個平台正在提供合作，或目前政府支持推動某個類型的研究，使得經費特別支持某種分析。

技術本身不是問題。問題是，如果先決定使用技術，再尋找樣本與研究問題，可能還沒有定義 experimental unit、primary endpoint 和需要多少 biological replication，就已經開始產生資料。較穩健的方向，是先問我們真正想知道什麼，再選擇合適的 model、experimental unit、endpoint 與 replication，最後才判斷哪一項技術能回答問題。

技術機會當然也可能開啟新的 exploratory research；但這時要清楚承認，這是產生假說，而不是讓技術本身代替研究問題。

但真實研究通常不是直線

留下可追蹤的決策流程，是研究設計的重點。

【CORE｜1分鐘】

「前一張談的是一個比較理想的順序：先定義研究問題，再選擇 model、experimental unit、endpoint、replication 與技術。」

「但真實研究通常不會完全按照直線前進。」

【指向第 1 步】

「研究一開始會有一個 initial question：我們真正想回答的是什麼？」

【指向第 2 步】

「接著進入 feasibility check。我們必須確認模型能不能建立、動物能不能取得、設施能支持多久、經費與人力是否足夠，以及預定的 endpoint 能不能可靠測量。」

【指向第 3 步】

「之後可能先進行 pilot study，也可能在執行過程中得到新的觀察。這些資訊可能告訴我們：原本的模型不可行、變異比預期大、某個技術不能使用，或者出現原先沒有預期到的 biological pattern。」

【指向第 4 步】

「這時候重新定義研究問題，不一定代表原始設計失敗。合理的做法可能是縮小研究問題、調整 endpoint、改變比較方式，或降低結論的強度。」

「真正需要避免的是：研究問題已經改變，最後卻仍然使用原本問題的語言解釋結果；或者把 exploratory observation 包裝成 confirmatory evidence。」

【指向第 5 步】

「這一輪得到的資訊，應該用來建立下一個更精確的 study，而不是假裝第一次實驗已經回答所有問題。」

【指向下方橫帶】

「因此，整個過程最重要的是留下 transparent decision record：為什麼調整？調整影響了哪些 animals、samples 或 endpoints？哪些結論仍然成立？哪些推論必須縮小？」

「研究設計不是假裝限制不存在，而是讓每一次調整都有理由、可以追蹤，也能被後來的研究者正確理解。」

轉場：

「接下來，我會用 PaBV 研究作為實際案例。這個研究就經歷了模型選擇、Replacement 困難、飼養時間與經費限制，以及如何提高每隻動物資訊量等一連串決策。」

Part 2｜為什麼 PaBV 研究需要鸚鵡？

PaBV 感染與疾病

Parrot bornavirus (PaBV)與proventricular dilatation disease (PDD)/
avian bornaviral ganglioneuritis (ABG) 密切相關。

主要病理變化

神經系統： central、peripheral 與 autonomic nervous systems
典型病變： lymphoplasmacytic ganglioneuritis
功能影響： gastrointestinal dysmotility
部分病例可見 encephalitis/neurological lesions

可能臨床表現

全身性： 體重下降、消瘦
消化道： regurgitation、未消化種子、proventricular dilatation
神經： ataxia、tremor、seizure

Note

PaBV infection、viral shedding、tissue lesion 與 clinical disease 並不是同一件事。

這些層次不一定同步出現，也是研究、診斷與治療上的重要瓶頸。

【CORE｜3分鐘】

在進入實例介紹前，先簡單介紹這個疾病，否則後面很難理解為什麼 model 和 endpoint 這麼難定義。 Parrot bornavirus，簡稱 PaBV，主要和鸚鵡的 proventricular dilatation disease，也就是 PDD 有關。現在也常使用 avian bornaviral ganglioneuritis，簡稱 ABG，強調它不只是前胃擴張，而是神經系統的發炎性疾病。

典型病理是 lymphoplasmacytic ganglioneuritis，可以影響 central、peripheral 和 autonomic nervous systems。當 enteric nervous system 受到影響，腸胃道運動會出現障礙，進一步造成前胃擴張、食物通過異常與消瘦。臨床上可能看到體重下降、反芻或 regurgitation、糞便中出現未消化種子，也可能有 ataxia、tremor 或 seizure 等 neurological signs。

但最重要的設計問題是：病毒感染、排毒、組織病變和真正出現clinical disease，不是同一件事。牠們發生的時間、檢測方式與生物學意義都不同。目前在診斷、治療上，都還有很多待突破的瓶頸。

因此，在設計PaBV實驗時，我們不能只說要研究『有沒有感染』，而必須先定義究竟要把哪一層當成primary endpoint。

PaBV 研究：你想測量的是哪一層？

研究層次	可以觀察的 evidence	主要回答的問題
Exposure/inoculation	dose、route、time	動物接受了什麼 exposure？
Evidence of infection	RT-PCR、viral antigen、seroconversion	是否建立 infection？
Persistence/viral shedding	longitudinal swabs、tissue distribution	病毒是否持續存在或排出？
Tissue lesion	ganglioneuritis、gliosis、neuronal injury	是否造成組織與神經病變？
Clinical disease	GI dysfunction、weight loss、neurological signs	是否發展成臨床疾病？

Important

PCR positive ≠ tissue lesion ≠ clinical PDD

不同 endpoint 需要不同的採樣方法、追蹤時間與 animal number。

Replacement 不是「換成比較方便的模型」

模型	可以回答	不能取代
Mouse	若能建立感染，可測試部分 host response	必須先證明 susceptibility 與 disease relevance
Avian cell system	virus propagation、cellular response、screening	tissue interaction、clinical disease
Psittacine bird	infection 到 tissue lesion/ clinical phenotype	成本、時間與 welfare burden 較高

Important

Replacement 的判準不是「能不能做實驗」，而是「能不能回答問題」。

Mouse inoculation 沒有建立可用模型

我們曾嘗試在 mouse 進行 PaBV inoculation，但未能建立可用的感染模型。

這個結果表示：

目前的 mouse model 無法回答 PaBV 問題
方便與便宜不能取代 host susceptibility

Warning

未發表經驗，不是 PaBV host range 的定論。

【CORE｜2分鐘】

既然使用鸚鵡有這麼多困難，第一個自然會想到的問題是：能不能改用比較常見、比較容易飼養的小鼠？

我們過去曾經嘗試將 PaBV 接種到小鼠，但是在當時的實驗條件下，沒有成功建立可使用的感染模型。這個結果不代表 PaBV 在任何條件下都絕對不可能感染小鼠，也不能直接當成完整的 host-range 證據。因此，這裡特別標示為研究團隊尚未發表的經驗。但對研究設計而言，它已經告訴我們一件重要的事：目前這個小鼠模型不能用來回答 PaBV 在鸚鵡體內如何感染、造成神經組織病變或發展成疾病。小鼠雖然比較容易取得、飼養成本也較低，但如果無法重現我們關心的感染與疾病 biology，就不能只因為方便而把它當成替代模型。

轉場：

但是，這時候可能會出現另一個想法：如果 PaBV 目前不能感染小鼠，能不能透過反覆接種與 serial passage，逐漸讓病毒適應新的宿主？或是直接接種超高劑量，看能不能有機會感染呢？

歷史上確實有利用病毒跨宿主 passage，建立減毒疫苗株的例子，例如兔化豬瘟疫苗。因此，下一個問題不是『技術上能不能做』，而是：即使最後成功了，我們得到的病毒與模型，還能不能回答原本的 PaBV 研究問題？

Serial passage 是建立模型，還是帶來新問題？

Classical swine fever vaccine (兔化豬瘟疫苗)：
- Serial passage (>800代): host adaptation
- attenuation
- phenotype drift

傳統豬瘟疫苗見證防疫長路。(圖片來源╱翻攝《豐年》第8卷第13期，1958年7月1日出版）

成功建立模型，不代表仍在回答原來的問題

兔化豬瘟疫苗成功協助控制重大動物傳染病
經過 host adaptation 的病毒，還能代表原本 PaBV biology 嗎？
- virulence 是否改變？
- tissue tropism 是否改變？
- immune response 是否改變？
- passage history 是否成為新的實驗變因？

Cell model 能把 Replacement 推進到哪裡？

可以回答

virus isolation/propagation
infectious titer
persistent cellular infection
preliminary mechanism
intervention screening

無法完整回答

whole-animal susceptibility
neural cellular composition
tissue-to-tissue spread
immune–nervous-system interaction
clinical disease

Note

目前仍缺乏廣泛使用的 psittacine cell lines、reference atlas 與 species-specific reagents。

為什麼這個問題仍需要鸚鵡？

PaBV genotype 與 psittacine nervous-tissue response 有何關係？

目前可以拿到的結果是：

沒有其他可用實驗動物感染模型 (例如 mouse)
heterologous cells 只能回答 cell-level questions (例如 QM7 cell)
nervous-tissue response 需要保留 host、tissue context 與時間

因此，whole-animal psittacine model 仍提供不可替代的資訊。

不可替代，不代表可以降低設計標準

使用稀少、飼養困難且負擔較高的動物時，必須同時注意：

問題值得回答
替代模型不足
實驗設計能產生可解釋資訊
每隻動物的組織與所獲得的資料能被充分利用
結論不超過 design 與 follow-up 的能力

【CORE｜2分鐘】

前面談到，目前的 mouse model 和 cell model 都無法完整取代鸚鵡。可是，證明動物不可替代，只回答了『為什麼需要使用』，並不代表研究設計就可以降低標準或是隨便。

相反地，鸚鵡取得不易、飼養時間長，而且每一次動物實驗都涉及較高的成本與動物負擔，因此我們更需要確認五件事。

第一，研究問題是否真的重要，值得使用這些動物回答？第二，我們是否已經評估過 mouse、cell culture 或其他替代方法，而且能清楚說明它們缺少哪些必要資訊？第三，現在的 animal number、experimental unit、endpoint 和 follow-up，是否真的能回答我們提出的問題？第四，每隻動物提供的 tissue 和 data 是否事先規畫並充分利用，而不是實驗結束後才臨時決定要做哪些分析？第五，也是很重要的一點：最後的結論不能超過實驗設計本身的能力。例如，只追蹤 28 天，就不能宣稱已經回答完整的 disease course。

因此，不可替代性不是降低標準的理由，而是提高設計責任的理由。Replacement 做不到的部分，要透過更嚴謹的 Reduction 與 Refinement 來回應。

轉場：

接下來先看我們實際執行的 PaBV animal experiment。了解它的組別、時間與採樣流程後，再判斷這個設計能回答什麼，又不能回答什麼。

我們的 PaBV animal experiment 案例

Important

這是一個 small-n、28-day exploratory early-response study，不是完整 disease-course study。

Study design based on the current manuscript Methods and Figure 2a.

【CORE｜3分鐘】

先把我們實際做的 animal experiment 講清楚，後面討論 28 days、pooling 與 scRNA-seq 才有共同基礎。

通過 pathogen 與 antibody screening 的 cockatiels 被隨機分為 control、PaBV-4 與 PaBV-5 三組，每組兩隻。0 dpi 以 pectoral intramuscular route 接種；14 dpi 以相同劑量與途徑 booster。Control 接受 PBS mock inoculation。

動物每天接受 clinical signs 與 behavior observation。28 dpi euthanasia 後進行 necropsy、gross examination 與 tissue collection。組織一部分進入 histopathology 與 IHC；cerebrum 和 cerebellum 則製備 single-cell suspension，供後續 scRNA-seq。

這張先呈現 animal-level design。後面談 scRNA-seq 時，還要再補上一個重要限制：每隻動物先個別處理，但同組兩隻的 viable cells 最後等比例 pooling，只建立一個 library。因此 animal n、library n 與 cell n 不能混為一談。

請注意，我們在課堂上把它定位為 28-day exploratory early-response study，而不是用這個設計宣稱完整 disease course 或 clinical incidence。

PaBV 的時間尺度不是單一終點，其他人怎麼做？

Important

追蹤時間決定能回答的 endpoint；增加 assays 不能補回缺少的時間。

Gancz et al. Virol J. 2009;6:100. doi:10.1186/1743-422X-6-100
Leal de Araujo et al. PLoS ONE. 2017;12:e0187797. doi:10.1371/journal.pone.0187797
Gartner et al. Avian Pathol. 2021;50:138–150. doi:10.1080/03079457.2020.1852177

【CORE｜3分鐘】

「這張圖不是要把三篇 paper 拼成一條固定的 PaBV disease course。不同研究使用不同 genotype、inoculation route、動物年齡與 endpoint，所以時間不能直接互換。」

「我們先看 2009 年的 PaBV-4 induction study。研究追蹤到 95 dpi，每天觀察臨床表現，並每週測量體重與採集 swabs。部分動物在 21 或 31 dpi 開始持續掉體重，未消化種子在 50 或 85 dpi 才出現，而 swab RNA 最早到 85 dpi 才被偵測。這表示 clinical change、shedding 與 terminal pathology 並不一定同步。」

「2017 年 PaBV-2 time-course study 使用 serial sacrifice，在 5 到 114 dpi 設置 12 個 necropsy time points。研究者在 5 dpi 先看到 inoculation-site inflammation，20 dpi涉及 spinal cord，25 dpi到brain，30 dpi才進一步看到GI與adrenal involvement；cloacal和choanal shedding又分別到35和60 dpi才被偵測。」

「2021 年研究追蹤 adult 與 newly hatched cockatiels 到 233 dpi，並持續進行 swabs、serology 與 clinical observation。swab RNA 首次出現大約落在 27 到 66 dpi，而 seroconversion 多數落在 36 到 71 dpi。這種設計才能觀察 long-term trajectory、age effect 與 attrition。」

「再對照我們的研究：28 dpi已經進行terminal sampling。因此，我們可以密集分析early nervous-tissue response，但不會得到28 dpi以後的shedding、persistence或clinical disease資料。」

「所以增加histopathology、IHC或scRNA-seq，可以增加28 dpi這個時間點的資訊量；它不能補回沒有追蹤到的時間。」

Literature review: 投入資源換到了什麼資訊

研究策略	主要取得的資訊	主要代價/ 限制
長期追蹤	• viral shedding • seroconversion • clinical course • attrition	• 長期飼養負擔高 • 若採樣稀疏，延長時間未必增加有效資訊
分期犧牲取樣	• 病毒與病變在組織間的先後順序 • 不同疾病階段的pathology	• 每隻動物只能提供一個terminal time point • 每個時間點都需要足夠的animal replication
短期密集分析	• early tissue response • cellular composition • mechanistic detail	• 無法回答chronic persistence • 無法觀察late clinical disease
重複非侵入性採樣	• individual trajectory • onset與intermittent change	• 可測量的endpoint有限 • 重複操作仍可能造成動物負擔

Important

追蹤多久、何時採樣、分析多深，決定研究最後能回答什麼。

【CORE｜3分鐘】

「在開始動物實驗以前，我們一定會先review既有paper。但是PaBV這類非模式動物研究，真正可參考的experimental infection studies本來就很少，而且不同研究使用的genotype、dose、inoculation route、動物年齡與follow-up又不完全相同。」

「所以我們很難找到一篇paper，可以直接把protocol完整複製過來。從研究者的角度來看，這類實驗確實帶有很高的不確定性：可能投入動物、時間與經費，最後卻沒有觀察到原本期待的infection、lesion或clinical disease。」

「但研究設計的工作，不是在完全不知道風險的情況下下注。我們review文獻，是要蒐集足夠資訊，辨認哪些地方已經有證據、哪些地方仍然未知，盡可能降低『實驗做完卻拿不到可解釋資料』的風險。」

「因此，review paper不能只記錄別人用了幾隻動物、養了幾天、採用什麼接種方式。我們真正要問的是：這些投入最後換到了哪些資訊？哪些endpoint真的出現？什麼時候出現？不同genotype之間的結果是否一致？」

「例如，追蹤超過60、80甚至200天，確實有機會取得28天內不容易看到的viral shedding、seroconversion、體重變化、clinical signs、carrier state或attrition。這是long-term observation能增加的temporal scope。」

「但是，時間拉長不代表資訊會自動成比例增加。如果只在研究結束時做一次necropsy，中間沒有足夠的repeated sampling，我們可能只是得到一個比較晚的terminal endpoint，仍不知道變化從什麼時候開始。」

「2017年的研究之所以能描述PaBV從inoculation site、spinal cord、brain到GI tract的時間順序，關鍵不只是追蹤到114 dpi，而是安排了12個serial-sacrifice time points。這提高了temporal resolution，但每隻動物只能提供一個terminal time point，而且每個時間點都需要animal-level replication。」

「相對地，我們的28-day study沒有long-term temporal scope，但把有限資源放在histopathology、IHC與scRNA-seq，提高28 dpi的biological resolution。這不是說我們得到的資訊比較多，而是我們選擇取得不同維度的資訊。」

「所以，如果文獻顯示某種long-term design需要大量時間、空間與動物，最後取得的資料仍然有限或高度變異，我們就不應該機械式複製。這些資訊可能使我們縮小研究問題、調整time points、加入longitudinal sampling，或把研究方向改成較可能取得可解釋結果的early-response study。」

「好的研究設計不能消除不確定性，但至少要讓風險變得可辨識、可管理。即使最後結果不如預期，也應盡量確保實驗仍能提供可解釋的資訊。」

轉場：

「接下來要問的是：即使文獻中的long-term design在科學上有價值，我們在台北的設施、人力與環境條件下，能不能合理執行？」

理想的長期設計，遇到台北的現實

長期飼養 cockatiels 需要：

隔離空間與 biosecurity
穩定的溫濕度與環境控制
長期 animal-care 人力
- 小鳥胃
- 小鳥依人
噪音、粉塵與動物設施管理
可持續的經費與 contingency plan
- 飼料
- 營養品

長期的 100–200 天實驗，未必能直接移植到現有環境。

28 days：不是較差的 200-day study

28-day design 可以支持	不能充分支持
early tissue response	complete disease course
early neuropathological change	chronic persistence/carrier state
exploratory genotype-associated patterns	long-term shedding
tissue-processing feasibility	late GI pathology
early cellular remodeling	clinical incidence/survival

Important

縮短 follow-up 必須同步縮小研究問題，而不是只縮短 protocol。

【CORE｜2分鐘】

「前面看過文獻後，可以發現PaBV研究的追蹤時間差異很大。有些研究持續60、100甚至超過200天，而我們的animal experiment在28 dpi進行terminal sampling。」

「看到這個差異時，很容易認為28-day study只是時間不足、規模縮小的long-term study。但這樣理解並不正確。兩者真正要回答的研究問題不同。」

【指向左欄】

「28天內，我們可以觀察接種後的early tissue response，包括早期neuropathological changes，並探索PaBV-4與PaBV-5是否呈現不同的host-response patterns。」

「我們也能確認tissue collection、cell dissociation與後續分析流程是否可行。進一步搭配histopathology、IHC與scRNA-seq，可以提高對28 dpi這個時間點的cellular remodeling解析能力。」

【指向右欄】

「但是，28天無法充分回答complete disease course。即使在28 dpi看到PCR陽性、組織病變或cellular changes，也不能直接推論後續是否會形成chronic persistence、carrier state、long-term shedding或late gastrointestinal pathology。」

「同樣地，每組只有兩隻動物，而且追蹤在28 dpi結束，也不能用來估計clinical incidence、survival，或宣稱某一個genotype比較容易造成完整疾病。」

【指向下方callout】

「所以，縮短 follow-up 不能只是把原本 200 天的 protocol 提早結束，其他研究問題與結論都保持不變。當追蹤時間縮短時，research question、primary endpoint 與可以下的結論都必須一起縮小。」

「因此，我們把這項研究定位為 small-n、exploratory early-response study。它不是較差的 200-day study，而是一個目的不同、推論範圍也不同的研究設計。」

轉場：

「接下來就要把這個原則實際寫進研究問題：哪些問法超過了28-day design的能力？又要如何改寫成這個實驗真正能回答的問題？」

研究問題要符合實驗觀察的範圍

`超出設計能力`

PaBV-4與PaBV-5是否會造成不同的疾病？
- 完整疾病發展
- long-term shedding與persistence
- clinical outcomes
- 足夠的animal-level replication

`目前設計可探索`

在觀察期之內，PaBV-4與PaBV-5是否呈現不同的early nervous-tissue responses？

目前設計明確限定：

時間： 28 dpi
endpoint： nervous-tissue response
研究定位： exploratory comparison

Important

研究問題、觀察時間、endpoint 與結論範圍必須一致。

【CORE｜3分鐘】

「前一張談到，縮短 follow-up 時，研究問題也必須同步調整。這一張就是實際示範：同一個 animal experiment，可以用兩種完全不同的方式描述。」

【指向左欄】

「如果我們問：『PaBV-4與PaBV-5是否造成不同疾病？』這個問題聽起來直接，但它其實包含很大的推論範圍。」

「『不同疾病』可能涉及完整的disease course、clinical signs、長期排毒、chronic persistence、疾病發生比例，甚至survival。要回答這些問題，需要足夠長的follow-up、足夠的animal number，以及能夠估計clinical outcomes的design。」

「但我們的實驗在28 dpi結束，每組只有兩隻動物。因此，即使觀察到組織或細胞層次的差異，也不能直接說兩種genotype造成不同疾病。」

【指向右欄】

「較符合實際design的問題是：在28-day experimental conditions下，PaBV-4與PaBV-5是否呈現不同的early nervous-tissue response patterns？」

「這個問法做了三個限制。第一，明確限定觀察時間是28天。第二，把endpoint限定在nervous-tissue response，而不是完整clinical disease。第三，將比較定位為exploratory，而不是確認兩種genotype的疾病差異。」

「因此，這不只是把句子改得比較保守，而是重新界定研究真正要估計的對象，以及資料可以支持的推論範圍。」

「研究問題、endpoint、follow-up和最後的conclusion必須彼此一致。任何一項超出design能力，都可能造成overinterpretation。」

轉場：

「接下來，我們回到已發表的PaBV experiments，看看不同研究如何在animal number、follow-up與endpoint之間做取捨，也練習判斷它們的design能支持哪些結論。」

Paper design check 1｜這個實驗做了什麼？

2009 PaBV-4 challenge study

Animalsinfected n = 3
control n = 2

ExposurePaBV-4 brain homogenate

RoutesIM, ocular, nasal, oral

Follow-up95 dpi

Bias controlrandom assignment; blinded observer

Welfarepredefined humane endpoint

PAPER FIGURE｜Gancz et al., 2009

Gancz AY, et al. Virology Journal. 2009;6:100. doi:10.1186/1743-422X-6-100

Paper design check 1｜小樣本能回答哪些問題？

可以支持

Challenge 可建立 infection接種後偵測到 PaBV infection

感染動物出現 PDD 相關病變clinical / pathological findings 與 control 不同

支持因果推進從 association 往 experimental causal evidence 前進

不能穩定估計

disease incidence2/3 是觀察結果，不是穩定發生率

route effect同一隻動物接受 multiple inoculation routes

genotype / population risk只有 PaBV-4，且樣本數太小

Important

小樣本仍可提供因果證據，但不適合精確估計發生率或族群差異。

Gancz AY, et al. Virology Journal. 2009;6:100. doi:10.1186/1743-422X-6-100

【CORE｜3分鐘】

「這項研究最重要的價值，是在PaBV於2008年被辨識後不久，依照Koch’s postulates的基本因果邏輯，進一步進行experimental challenge。感染動物出現PDD相關的clinical或pathological findings，而control沒有出現相同病變。因此，即使樣本數很小，仍能將PaBV與PDD的關係從association往causal evidence推進。

先用這篇研究示範兩個判斷。第一，experimental unit是individual bird，因為每隻鳥接受treatment assignment與接種；swabs、tissues和PCR measurements都不是獨立的experimental units。第二，三隻感染動物中有兩隻出現clinical disease，我們可以描述這項研究觀察到2/3，但不能把它當成穩定的disease incidence estimate。樣本數太小，估計的不確定性很高。」同一隻動物又同時接受multiple inoculation routes，因此這篇研究也不能比較各route的效果。它只有PaBV-4，所以不能回答genotype differences。因此，小樣本不代表研究沒有價值。它能提供proof-of-concept與因果證據；但不能精確估計incidence、route effect或族群差異。

轉場：

「下一篇研究除了樣本數更少，baseline infection與housing arrangement也會進一步限制結果解釋。」

Paper design check 2｜實驗開始前，各組真的可比較嗎？

2011 PaBV-2 challenge study

Animalschallenged n = 2
control n = 1

Baselinechallenged birds 原本已 intermittently shedding PaBV-4

Housingcontrol 位於另一獨立 aviary

treatment 前各組是否在同一基線上？
baseline 與 housing 若不同，結果就不能只歸因於 PaBV-2 challenge。

PAPER EXCERPT｜Mirhosseini et al., 2011

Mirhosseini N, et al. Journal of Avian Medicine and Surgery. 2011;25:199–204. doi:10.1647/2010-030.1

【CORE｜3分鐘】

「這一篇我們不討論結果，也不問有沒有顯著差異。我們先看treatment開始以前，各組是否真的可比較。研究中只有兩隻challenged birds與一隻control。更重要的是，兩隻challenged birds在PaBV-2 inoculation以前，已經曾經intermittently shed PaBV-4。也就是說，牠們不是完全PaBV-naïve的動物。因此，接種後出現的infection、pathology或clinical findings，可能與新的PaBV-2 challenge有關，也可能受到既有PaBV-4 infection、兩種病毒之間的interaction，或先前host response影響。如果challenged animals在實驗開始前已經有PaBV-4，而control沒有，後續差異就不能全部歸因於PaBV-2。Baseline difference已經限制了attribution。第二個問題是housing。Control被飼養在separate aviary。如果aviary的溫濕度、人員、微生物環境、飼料批次或其他條件不同，aviary effect就可能與treatment effect綁在一起。這不表示這篇paper沒有價值，而是結果應被理解為一個高度受限的小型challenge observation，不能當成乾淨的PaBV-2 versus control比較。

這一頁的重點是：增加統計分析無法修正實驗開始前的baseline不一致，也無法拆開已經與treatment綁定的housing effect。

轉場：

「下一篇研究使用34隻cockatiels，看起來animal number大幅增加。但總數增加，是否代表每個時間點都有充分的replication？」

Paper design check 3｜總動物數不等於每個時間點的重複數

2017 PaBV-2 time-course study

Total animals34 cockatiels

Designserial sacrifice

Time points5–114 dpi，共 12 個

Measurementsmulti-tissue RT-PCR、histology、IHC

先判斷：每個時間點有幾隻動物？
serial sacrifice 可提高時間解析度，但每隻動物只能代表當下時間點。

PAPER FIGURE｜Leal de Araujo et al., 2017

Leal de Araujo J, et al. PLoS ONE. 2017;12:e0187797. doi:10.1371/journal.pone.0187797

【CORE｜3分鐘】

「這篇研究和前兩篇的目的不同。它不是只問PaBV能不能造成疾病，而是要追蹤病毒與病變如何隨時間從inoculation site進入nervous system，再延伸到其他tissues。」

「為了取得這種資訊，研究者安排5到114 dpi共12個採樣時間點，並在不同組織進行RT-PCR、histology與IHC。」

「這種serial-sacrifice design的優勢，是可以建立不同tissue involvement的先後順序。它提供的是temporal與spatial information。」

「研究總共使用34隻cockatiels，但不代表每一個time point都有34個biological replicates。每隻動物在被euthanized後，只能貢獻一個terminal time point。因此，真正要檢查的是每個time point分配了幾隻infected animals與controls，而不是只看abstract中的total n。」

「這也代表時間點增加會分散animal replication。若資源固定，加入更多time points，通常就會降低每個time point的n；若要維持replication，總動物數就必須增加。」

「所以Reduction不能只看總動物數。研究者需要判斷哪些time points真正有生物學意義，避免建立很多時間點，卻使每個時間點都不足以支持穩定比較。」

轉場：

「休息前，我們把三個paper design check放在一起看：同樣是PaBV experiment，不同研究其實是在回答完全不同的問題，也承擔不同的限制。」

三個實驗、三種設計、回答不同問題

Study	主要回答的問題	設計提供的資訊	主要限制
2009 challenge	PaBV exposure能否重現PDD相關病變？	early causal/ proof-of-concept evidence	small `n`、multiple routes
2011 challenge	PaBV-2 challenge後會觀察到什麼？	limited challenge observation	baseline infection、housing confounding
2017 time course	病毒與病變如何隨時間進入不同組織？	temporal與tissue distribution	replication分散至多個time points

Important

評估動物實驗時，先了解想要回答什麼，再判斷實驗設計能支持多大的結論。

【CORE｜2分鐘】

「三篇研究使用的都是cockatiels與PaBV，但它們不是同一種實驗，也不能只用animal number判斷哪一篇比較好。」

「2009年的challenge study是在PaBV剛被辨識後，依照Koch’s postulates的基本因果邏輯，提供早期proof-of-concept evidence。它的重點是能否重現相關病變，不是估計發病率。」

「2011年的研究提出PaBV-2 challenge的觀察，但baseline PaBV-4 infection與separate housing限制了結果歸因。問題不在於p-value，而在於比較組從一開始就不完全等同。」

「2017 年的 time-course study 使用更多動物與 serial sacrifice，取得病毒與病變傳播順序的資訊；但 animal replication 被分配到 12 個 time points，因此仍需要逐一檢查每個時間點的有效 n。」

「另外，前面時間軸中的 2021 long-term study 提供了 shedding、serology 與 clinical trajectory 等長期資訊，但我們不再開啟另一個完整 paper design check。它再次提醒我們，追蹤時間、sampling design 與 animal burden 之間需要取捨。」

「休息前請保留三個判斷順序：第一，研究問題是什麼；第二，experimental unit 與真正的 replication 在哪裡；第三，限制是否已反映在結論範圍中。」

☕ 休息

10 minutes

Part 3｜提高每隻動物的有效資訊

從「不可替代」走向「充分利用」

當鸚鵡活體模型仍不可替代時，減量（Reduction）不只是減少動物數：

先定義真正要回答的研究終點
讓不同資料形成同一條證據鏈
保留樣本來源與相關資訊
事先規畫組織分配
避免產生無法解釋的大量資料

Important

重點不是每隻動物做更多檢測，而是讓每一項檢測共同回答同一個問題。

現代生醫研究可以看到多深？

Important

技術愈新、資料愈多，不代表研究問題回答得更好；關鍵是選擇適合的觀察層次。

Tang F, et al. Nature Methods. 2009;6:377–382. doi:10.1038/nmeth.1315
Ståhl PL, et al. Science. 2016;353:78–82. doi:10.1126/science.aaf2403

【CORE｜3分鐘】

「現在的生醫研究，可以從整個器官一路觀察到單一細胞與分子。但是，不同技術看到的是不同層次，沒有一種方法可以回答所有問題。」

「最直觀的是肉眼病理或影像，讓我們看到器官外觀與大小是否改變。再進一步使用組織病理，可以觀察組織結構、發炎與細胞形態；IHC 則利用特定標記，幫助我們辨認某類細胞或蛋白質出現在哪裡。」

「Bulk RNA-seq 會把一塊組織中的 RNA 放在一起測量。它可以告訴我們整體基因表現有哪些變化，但不同細胞類型的訊號會混合在一起。」

「scRNA-seq 的特別之處，是將組織分離成單一細胞，再分別讀取每個細胞的基因表現特徵。研究者可以利用數千個基因的表現組合，辨認不同細胞族群，並探索細胞可能處於哪些功能狀態。」

「例如，同樣看到一個膠細胞標記增加，bulk RNA-seq 無法直接判斷是膠細胞變多，還是原有膠細胞增加這個基因的表現。scRNA-seq 可以幫助我們進一步拆開這兩種可能性。」

「Spatial transcriptomics 則試圖保留分子訊號在組織中的位置。今天不深入這項技術，只讓大家知道現代生醫研究同時追求更高的細胞層次解析能力與空間資訊。」

「不過，高階技術的威力來自解析能力，不能取代良好的實驗設計。數千個細胞仍然可能只來自一隻或少數幾隻動物。」

轉場：

「了解這些技術能觀察的層次後，接下來回到 PaBV 研究：既然組織病理已經看到神經組織變化，為什麼還需要進一步使用 scRNA-seq？」

為什麼組織病理之後還需要 scRNA-seq？

組織病理/IHC 可以回答

是否出現組織病變
病變位於哪些區域
特定標記的位置與細胞形態
不同證據在組織層次是否一致

scRNA-seq 進一步探索

哪些細胞族群值得關注
細胞組成與細胞狀態可能如何改變
混合的組織訊號來自哪些細胞
後續需要驗證的候選生物路徑

Important

scRNA-seq 增加的是細胞層次的解析能力，不會自動增加獨立動物數。

從組織病變到細胞層級：中間缺了什麼？

神經組織中出現膠質細胞增生 (gliosis)、神經元退化或發炎變化

這些細胞是誰？在做什麼？

特定細胞族群的數量改變
原有細胞進入不同的活化狀態
組織解離與採樣造成細胞組成差異

Important

新的技術應該用來回答原本無法解決的問題，而不是單純增加資料量。

代表性病理影像，來源：作者投稿中手稿。

從動物到基因轉錄體分析：數量增加，不代表獨立性增加

Important

接受不同病毒接種的是動物個體；細胞數與 UMI 再多，也不會增加動物層次的生物重複。

【CORE｜3分鐘】

「進入 scRNA-seq 資料後，我們會看到好幾種數量：動物數、基因庫數、細胞數，以及 UMI 數。這些數字都可以寫成 n，但代表的層次完全不同。」

「在這個案例中，每個實驗組別有兩隻動物。處理條件是分派給動物，因此真正的生物重複應該是彼此獨立的動物。」

「但是，同組兩隻動物的細胞在建立基因庫前已經混合，因此每組最後只有一個混合基因庫。數千個細胞與數百萬筆 UMI，可以增加我們對這個基因庫的解析能力，卻不能增加動物個體層次的獨立重複數。」

「換句話說，更多細胞可以讓我們更清楚地描述這一個混合樣本，但不能告訴我們兩隻動物的反應是否一致。」

「所以判讀高維資料時，不能只問哪一個 n 最大，而要先問：處理條件分派給誰？哪些樣本真正彼此獨立？個體來源是否仍被保留？」

轉場：

「接下來先把我們實際採用的樣本處理流程講清楚，再分別說明當時為什麼選擇混合，以及這項選擇如何限制後續解釋。」

三個 scRNA-seq 基因庫是如何建立的？

Important

每隻動物先個別處理；確認細胞數與存活率後，才將同組細胞等比例混合。

為什麼選擇混合樣本？

`實際限制`

神經組織解離後，存活細胞流失
單一動物回收的細胞量可能不足
基因庫試劑與定序經費有限

`當時希望保留`

Control、PaBV-4、PaBV-5 三個組別
每組都有足夠的細胞輸入量
三組都能完成 scRNA-seq 取得資料

Important

混合樣本是為了讓三個實驗組別都能完成分析，不會增加生物重複。

【CORE｜3分鐘】

「當時選擇混合，不只是因為只能負擔三個基因庫。」

「腦組織在解離、過濾與去除碎屑的過程中會損失細胞；部分動物單獨回收的存活細胞量，也可能不足以穩定進入後續平台。」

「另一方面，我們希望保留 Control、PaBV-4 與 PaBV-5 三個實驗組別。若只挑部分動物建庫，雖然可以保留個體來源，卻可能失去同組另一隻動物的細胞，也仍然無法形成完整的組內生物重複。」

「因此，當時的優先順序是：讓三個組別都有足夠的細胞輸入量，並且都能完成 scRNA-seq。」

「這項選擇解決的是實驗能否完成，以及三組能否同時進入分析的問題。它並沒有增加生物重複。」

轉場：

「研究能夠完成之後，還必須面對另一個問題：三個混合基因庫所產生的結果，究竟可以解釋到哪一層？」

三個混合基因庫：結果可以解釋到哪一層？

`可以描述`

三個基因庫的細胞組成差異
不同細胞族群的基因表現模式
值得後續驗證的細胞族群與候選路徑

`不能直接判斷`

同組兩隻動物是否反應一致
動物個體間變異
觀察結果是否可推廣至其他動物
PaBV 基因型的確認性效應

Important

可以比較三個混合基因庫的變化模式，但不能將數千個細胞視為數千個生物重複。

【CORE｜3分鐘】

「前兩張分別說明了實際流程與混合的理由。這一張只處理結果解釋。」

「我們可以比較 Control、PaBV-4 與 PaBV-5 三個混合基因庫，描述各基因庫中的細胞組成、不同細胞族群的基因表現模式，以及值得後續驗證的候選路徑。」

「這些資料也可以與組織病理及 IHC 相互對照，協助形成下一步研究假說。」

「但是，細胞混合後只能追溯到實驗組別，不能追溯到個別動物。因此，我們不知道同組兩隻動物是否都呈現相同反應，也無法估計動物個體間變異。」

「即使每個基因庫包含數千個細胞，這些細胞仍然來自同一個混合基因庫。細胞數增加的是解析能力，不是動物個體層次的生物重複。」

「因此，這些結果適合定位為探索性證據，用來產生假說與規畫後續驗證；不能直接宣稱 PaBV 基因型在動物族群中具有確認性效應。」

轉場：

「如果下一次希望在控制成本的同時保留個體來源，就必須在建立基因庫以前改變樣本標記或研究設計。」

下一次如何兼顧成本與個體來源？

Note

技術選擇必須在動物使用前決定，因為它會改變樣本處理方式與可支持的結論。

Stoeckius M, et al. Genome Biology. 2018;19:224. doi:10.1186/s13059-018-1603-1

組織分配規畫必須在解剖前完成

樣本	優先用途	可回答的問題	備援
大腦/小腦	scRNA-seq	細胞變化模式	冷凍組織
相鄰腦組織切片	H&E/IHC	病變與標記驗證	影像檔案
腸胃道/神經節	組織病理	其他組織是否受影響	分子檢測
拭子/血液	縱向檢測	感染變化歷程	生物資料庫

Important

主要研究終點優先；探索性多體學分析不能排擠必要的組織病理與驗證。

組織有限時，每一種保存方式都會排除其他用途

Important

組織分配應依主要研究終點與樣本保存條件決定，而不是平均切開。

【CORE｜2分鐘】

「同一塊組織不能同時完整滿足所有分析。組織病理需要固定後保留結構；scRNA-seq 需要新鮮組織立即解離；病毒或分子檢測則可能需要冷凍或核酸保存。」

「這些處理方式一旦選定，通常無法逆轉。已經固定的組織不能回頭取得高存活率的單細胞；全部拿去解離後，也無法重新取得完整組織結構。」

「因此，組織有限時不能平均分配，也不能由哪一項技術最新來決定。」

「第一順位是主要研究終點不可替代的樣本；第二順位是能驗證主要結果的配對組織；最後才是探索性分析與備援保存。」

「這也是為什麼 tissue allocation 必須在解剖前完成，而不是看到組織量之後才臨時決定。」

縱向採樣：同一隻動物提供更多時間資訊

可以增加的資訊

⚖️ 體重與臨床變化
🎥 行為與活動表現
🧪 後鼻孔/泄殖腔拭子
🩸 限量採血

同時增加的負擔

捕捉與保定壓力
重複操作與恢復時間
社會互動受干擾
採樣量與頻率限制

Important

重複採樣具有 Reduction 潛力，但採樣頻率仍須由研究問題與動物福祉共同決定。

Part 3 小結｜提高資訊量，不等於增加生物重複

不同技術回答不同層次的問題
組織病理保留組織脈絡；scRNA-seq 提供細胞層次解析。
混合樣本可以解決實務限制，也會犧牲個體來源
更多細胞與 UMI 可以提高解析能力，但不會增加動物個體層次的重複。
提高資訊量必須從實驗前開始規畫
基因庫策略、組織分配與縱向採樣，都會影響最後可以回答的問題。

Important

Reduction 不只是從每隻動物取得最多資料
更重要的是取得足以回答研究問題、且可以正確解釋的資料

【CORE｜2分鐘】

「Part 3 的核心不是鼓勵大家對每隻動物做越多檢測越好。」

「第一，不同技術回答的是不同層次。組織病理告訴我們病變發生在哪裡；scRNA-seq 則協助將混合的組織訊號拆解到細胞層次。」

「第二，資料量與生物重複必須分開。混合樣本可以讓研究在細胞量與經費限制下完成，但混合後失去的個體來源，不會因為細胞數或 UMI 數增加而恢復。」

「第三，提高資訊量必須從實驗開始前規畫。基因庫如何建立、組織如何分配、是否進行縱向採樣，都會決定最後可以回答哪些問題。」

轉場：

「接下來進入 Part 4。我們已經知道資料是如何產生的，下一步要練習的是：面對高維資料與很小的 p-value，研究結論究竟可以說到哪裡？」

Part 4｜高維資料的推論界線

案例：先追蹤資料如何產生

Important

同一個數字，只有放回資料產生的層次，才知道能支持哪一種結論。

重點不是先找最大差異或最小的 p-value，而是判斷：
- 這些數字可以描述什麼？不能直接推論什麼？

【CORE｜2分鐘】

「這張圖前面已經看過一次。前一次我們用它說明：資料量增加，不代表生物重複增加。」

「現在我們再看一次，但目的不同。這一次不是討論是否該這樣設計，而是把它當成讀資料表前的地圖。」

「每組有兩隻動物，但同組細胞被等比例混合成一個基因庫。接著我們從這個基因庫中取得數千個細胞，再從細胞中得到大量 RNA 轉錄分子的測量值。」

「所以資料量確實一路增加：從動物，到基因庫，到細胞，到 RNA 轉錄分子的測量值。但生物獨立性沒有跟著增加。因為能分開追蹤的樣本，仍然停在每組一個混合基因庫。」

「等一下看到資料表時，不要先問哪個 p-value 最小，也不要先問哪一組細胞最多。第一個問題應該是：這些數字可以描述什麼？又不能直接推論什麼？」

「這就是 Part 4 的主軸：資料很多，不代表推論可以無限制往外延伸。」

腦部不是單一細胞族群

Note

同一塊神經組織中的變化，可能來自不同細胞族群比例改變，也可能來自特定細胞狀態改變。

AI生成示意圖；非真實資料。

從 UMAP 到細胞組成表

Important

UMAP 進行降維匯整將高維資料視覺化，但每個點仍然要放回原本的樣本來源解讀。

簡化的細胞組成表

細胞族群	對照組	處理組
Neuron-like cells	62%	48%
Astrocyte-like cells	12%	20%
Oligodendrocyte-like cells	18%	22%
Other cells	8%	10%

適合：

neuron-like cells 比例較低
astrocyte-like cells 比例較高
其他細胞族群差異較小

不適合：

病毒造成神經元死亡
astrocytes 明顯增生
動物個體間反應一致

Important

先描述混合基因庫中的差異
原因、機制與動物個體間一致性，則需要更多證據支持。

【CORE｜3分鐘】

「這一頁示範的是判讀語言。左邊是簡化過的細胞組成表，右邊把同一份資料可以支持的句子，和不宜直接推論的句子分開。」

「可以描述的是：在這個處理組混合基因庫中，neuron-like cells 的比例較低，astrocyte-like cells 的比例較高，其他細胞族群差異較小。」

「這些句子仍然停留在資料表本身，沒有假設原因，也沒有把結果推到每一隻動物。」

「但如果說『病毒造成神經元死亡』，就已經進入機制解釋；需要組織病理、IHC、時間序列或其他功能性證據支持。」

「如果說『astrocytes 明顯增生』，也不只是比例表能直接回答的問題。比例上升可能來自 astrocyte 數量增加，也可能來自其他細胞比例下降，或組織解離與回收效率差異。」

「如果說『動物個體間反應一致』，則需要保留個別動物來源。混合基因庫看不到同組兩隻動物是否一致。」

「所以這張表可以作為探索性觀察，幫助我們決定下一步要驗證什麼；但不能直接當作機制或動物層次結論。」

現在哪一句是適合的描述？

根據前一張混合樣本的細胞組成表：

處理造成神經元流失
處理促進星狀膠細胞增生
處理組與對照組的混合樣本呈現不同的細胞組成模式
所有接受處理的動物都有相同變化

從描述到推論：中間隔了幾層？

`可以描述`

混合基因庫中的細胞比例不同
某些 cell populations 較高或較低
可作為後續驗證線索

`需要更多證據`

是否代表細胞數真的增加或減少
是否與組織病變一致
是否出現在個別動物中
是否可由 IHC / histology 驗證

`不能直接跳到`

病毒造成特定細胞死亡
所有感染動物都有相同反應
genotype 具有族群層次效應
可推廣到完整疾病過程

Important

高維資料可以提供線索，但「描述差異」、「解釋原因」與「推論到動物族群」是不同層次。

【CORE｜2分鐘】

「前一張我們用一份簡化的細胞組成表，練習哪些句子可以說、哪些句子不宜直接說。」

「這一張把判讀規則整理成三層。」

「第一層是描述。只要資料表中確實看到比例不同，我們可以說混合基因庫中的細胞組成不同，某些細胞族群比例較高或較低。」

「第二層是需要更多證據支持的解釋。比例改變是否真的代表細胞數增加或減少？是否和組織病理一致？是否每一隻動物都有類似反應？這些都不是單一混合基因庫能直接回答的問題。」

「第三層是不能直接跳到的結論。例如病毒造成特定細胞死亡、所有感染動物都有相同反應、或 genotype 具有族群層次效應。這些需要不同層次的實驗設計與生物重複。」

「所以高維資料不是不能用，而是要把它放在正確的位置：它很適合產生線索，但不會自動補上缺少的設計層次。」

從描述差異到統計比較

【CORE｜2分鐘】

「剛才我們先練習如何描述細胞組成表中的差異。接下來自然會問：這些差異是否大到不像是隨機波動？」

「但在進入 p-value 前，第一步不是選統計方法，而是先問比較單位是什麼。」

「如果把每個 cell 當成觀察值，統計結果主要反映的是這個資料集內的細胞層次差異。它可以幫助我們找出候選細胞族群或候選基因，但不能直接代表動物個體間的生物重複。」

「如果要做基因庫層次比較，就需要多個彼此獨立的基因庫。如果每組只有一個混合基因庫，就沒有辦法估計組內變異。」

「如果要推論到動物個體層次，就必須保留每隻動物的來源，讓每隻動物或每隻動物的基因庫成為可分辨的獨立樣本。」

「所以 p-value 不是不能用，而是要先說清楚：它是在哪一個層次計算的？它回答的是資料集內的差異，還是動物層次的問題？」

「下一張再看：當 p-value 很小時，它到底回答的是哪一層問題。」

當 p < 0.05 時，回答的是哪一層問題？

若把數千個 cells 當成觀察值，p-value 可能非常小。

問題	是否能直接回答？
兩個混合基因庫中的 cell distribution / gene expression 是否不同？	可以
不同動物個體是否反應一致？	不行
genotype 是否造成族群層次穩定差異？	不行

False discovery rate (FDR) correction：用來控制多重檢定造成的假陽性；不是用來修正比較單位。

Important

顯著的 p-value 仍然只能回答它所屬資料層次的問題。

Zimmerman KD, et al. Nature Communications. 2021;12:738. doi:10.1038/s41467-021-21038-1
Squair JW, et al. Nature Communications. 2021;12:5692. doi:10.1038/s41467-021-25960-2

【CORE｜2分鐘】

「上一張我們先決定比較單位。現在回來看 p-value。」

「如果把數千個 cells 當成觀察值，因為資料點非常多，p-value 可能非常小。」

「但這個 p-value 主要回答的是：在這份資料集中，兩個混合基因庫的細胞分布或基因表現是否不同。」

「它不能直接回答不同動物個體是否反應一致，也不能直接回答 genotype 是否在動物族群層次造成穩定差異。」

「FDR correction 是用來處理多重檢定造成的假陽性問題。高維資料常常同時檢查很多 genes、cell types 或 clusters，所以需要做這類校正。」

「但 FDR correction 不會改變比較單位。若比較單位是 cell，它不會因為校正過，就變成 animal-level inference。」

「所以看到 FDR-adjusted p-value 很小，仍然要問：它是在哪一層資料上算出來的？」

判讀 p-value 前，先確認比較單位

假設兩個混合基因庫各有 8,000 個 cells：

比較單位	統計檢定看到的 n	p-value 能回答什麼？
cell	8,000 vs 8,000 cells	這份資料中的 cell-level 差異
基因庫	1 vs 1 mixed library	無法估計組內變異
動物個體	個別來源已消失	無法估計 animal-to-animal variation

判讀前先問：

實驗處理發生在哪一層？
哪些觀察值真正彼此獨立？
統計檢定中的 n 代表什麼？

Important

統計計算可能正確，但如果比較單位不同，p-value 回答的問題也不同。

【CORE｜2分鐘】

「這一頁把前面的概念整理成操作規則。」

「假設兩個混合基因庫各有八千個 cells。如果把 cells 當成觀察值，統計檢定看到的是 8,000 對 8,000，因此 p-value 可能非常小。」

「這個計算本身不一定錯。問題是它回答的是 cell-level 或資料集內的差異，而不是動物個體間差異。」

「如果比較單位是基因庫，這裡每組只有一個混合基因庫，所以沒有辦法估計組內變異。」

「如果比較單位是動物個體，因為個別動物來源在 pooling 後已經消失，所以也無法估計 animal-to-animal variation。」

「因此，判讀 p-value 前先問三件事：實驗處理發生在哪一層？哪些觀察值真正彼此獨立？統計檢定中的 n 代表什麼？」

「這三個問題不只適用於 scRNA-seq，也適用於組織切片、影像分析、籠位資料與重複採樣。」

探索性資料的價值

即使不能直接支持動物族群層次的確認性結論，探索性資料仍可用來：

找出值得追蹤的 cell populations 或 pathways
指定後續 H&E / IHC / viral assay 的驗證目標
評估樣本處理與 scRNA-seq 流程是否可行
判斷下一次是否需要保留個別動物來源
協助規畫下一次的 endpoint、樣本數與檢測方法

Important

探索性資料的價值，不是替代生物重複，而是降低下一次實驗失敗的風險。

多層證據一致，可以增加可信度，但不會增加 n

證據來源	可以提供的支持	不能取代
H&E	組織層次的病變	動物個體間重複
IHC	標記位置與細胞形態	定量推論本身
scRNA-seq	細胞族群與轉錄狀態線索	animal-level replication
病毒檢測	感染、組織分布或時間關聯	隨機分派與獨立樣本

Important

多層證據一致可以增加生物學合理性；但不同檢測方法不是新的動物個體。

設計能支持的解釋方式

`可以這樣寫`

在這個案例中，不同混合基因庫呈現不同的細胞組成與轉錄變化模式。
這些變化可作為後續假說來源，並與 H&E、IHC 或病毒檢測結果進行對照。
由於個別動物來源未保留，是否能推廣到動物個體層次，仍需要具備 animal-level biological replication 的後續研究。

`避免這樣寫`

PaBV genotype 造成穩定的動物族群層次差異。

Part 5｜理想與現實之間

先寫出理想設計，再加入現實限制

理想通常豐滿，現實往往骨感

回答問題需要什麼：

主要研究問題與主要研究終點
研究定位：探索性或確認性
experimental unit 與 animal-level replication
個別動物、組織與基因庫的來源識別
追蹤時間、人道終點與預期脫落
隨機分派、盲目試驗、飼養空間與處理順序
組織分配、檢測優先順序與分析計畫

Important

現實限制應該在設計階段改變研究問題，而不是在實驗完成後才拿來解釋不足。

回顧目前的實驗，同時遇到哪些限制？

現實限制	直接影響	必須重新決定
只有 6 隻動物可用	animal-level replication 很低	保留三組探索性比較，或減少比較組別
只能負擔 3 個 scRNA-seq 基因庫	個體來源識別受限	混合樣本、multiplexing 或分階段設計
最長追蹤 28 天	無法推論完整疾病歷程	偵測早期感染反應
只有 3 個飼養空間	飼養空間可能與處理組別混淆	重新規畫分配、批次與飼養策略
組織有限	病理、PCR、IHC、scRNA-seq 互相競爭	主要研究終點優先
可能有動物淘汰	最終可分析的 n 下降	預留數量並設定繼續/停止條件

合理調整的幾種可行方向

增加資源或跨單位合作
縮小研究問題與結論層次
改成先導試驗或可行性試驗
減少實驗組別或次要研究終點
分階段進行，先驗證最不確定的環節
暫不執行

Important

若目前設計無法回答問題，暫緩執行也是最負責任的減量 (Reduction)。

把受限制的折衷留下紀錄

項目	現實限制	最後選擇	結論影響
動物數	可用動物有限	定位為先導試驗	不做確認性結論
scRNA-seq	基因庫數有限	同組混合或 multiplexing	限縮個體層次推論
追蹤時間	最長 28 天	聚焦早期研究終點	不談完整疾病歷程
組織分配	樣本有限	病理與病毒檢測優先	次要分析定位為探索性
飼養條件	隔離空間有限	明確記錄並盡量平衡	若無法分離，結論需保守

Note

每一個折衷都要有能對應最後能支持的結論。

在限制下，設計要怎麼改？

6 隻動物 3 個隔離飼養空間 3 scRNA-seq 基因庫 28 天追蹤病理、PCR、IHC、scRNA-seq 都想做

1保留哪一個主要研究問題？

2犧牲了哪一層推論？

3如何避免飼養空間與處理條件混淆？

4哪些結論必須降級為探索性？

Important

重新設計不是把檢測塞滿，而是讓問題、設計與結論重新對齊。

【CORE｜3分鐘】

「這裡不分組，而是一起看一個設計在限制下可以怎麼調整。大班課的重點是讓大家看見決策順序。」

「第一步先保留主要研究問題。如果仍要同時比較 PaBV-4 與 PaBV-5，就必須承認三組各 n = 2 只能定位為探索性研究。」

「第二步檢查實驗單位與樣本來源識別。三個基因庫無法同時兼顧三組比較與每隻動物各自建庫，因此必須在比較較多基因型與保留動物個體層次重複之間選擇。」

「第三步處理飼養條件。三個飼養空間若各放一個實驗組別，飼養空間與處理條件會完全混淆；必須評估能否在生物安全允許下進行平衡分配、分批重複，或明確承認飼養空間效應無法分離。」

「第四步縮小研究結論。28 天追蹤只支持早期反應；混合基因庫只支持組別層次的探索性變化模式；如果飼養空間無法完全平衡，也要在解釋時保守處理。」

「接下來一張比較三種可行方向，讓大家看到沒有單一最佳答案，但每個答案都必須清楚交代犧牲了什麼。」

如何檢視一個重新設計方案？

不論方案由誰提出，只檢查四件事：

主要研究問題是否已經縮小？
experimental unit 與真正的重複數在哪裡？
飼養空間、批次或操作人員是否與處理條件混淆？
結論是否超過追蹤時間與樣本來源識別？

Note

好的檢視不是提出更多檢測方法，而是指出哪一項設計決策會改變推論。

選擇取決於研究目的，沒有單一最佳方案

探索性先導試驗適合回答Control、PaBV-4、PaBV-5 的早期變化全貌必須承認不做 animal-level 確認性結論

對照組 vs 單一基因型適合回答感染與對照之間較穩定的個體層次差異必須承認不能直接比較 PaBV-4 與 PaBV-5

分階段設計適合回答先確認感染、採樣與檢測流程是否可行必須承認完成時間較長，第一階段結論較小

可再搭配：

multiplexing（多重標記）
縱向非侵入性採樣
跨單位合作

EDA：把實驗設計畫成可檢查的計畫

NC3Rs Experimental Design Assistant (EDA) 協助研究者圖形化設計決策檢查。

畫出實驗流程stepwise visual representation

檢查設計風險bias、變異來源、experimental unit

支援事前規畫randomisation、blinding、sample size

Scan QR or visit: eda.nc3rs.org.uk

Important

EDA 不是替研究者決定答案，而是讓設計決策被明確畫出來以進行檢查以及討論。

NC3Rs. Experimental Design Assistant. nc3rs.org.uk

PREPARE：在動物使用前完成跨角色規畫

研究問題與模型動物模型、主要研究終點、組織分配圖

執行與容量動物數、飼養條件、隨機分派、樣本處理與平台容量

福祉與紀錄人道終點、繼續/停止條件、原始資料與分組紀錄

Smith AJ, et al. Laboratory Animals. 2018;52:135–141. doi:10.1177/0023677217724823

Part 6｜執行與紀錄：讓設計真正成立

好設計也可能在執行中失效

分組紀錄遺失
處理順序固定，與組別混淆
操作人員固定，與處理條件混淆
組織處理時間拖太長
執行流程逐漸偏離原計畫
原始資料與動物相關資訊無法追溯

當實驗複雜時，可能變成混淆因素

如果同一天處理三組腦組織樣本：

一隻動物的犧牲及採樣大約 30 分鐘
- 60 分鐘 / 組
- 三組 = 180 分鐘

若細胞存活率隨處理時間下降：

基因型效應與處理順序效應將無法分離。
細胞品質無法符合後續實驗的需求！

應對方式：

平衡或隨機安排處理順序
每一批盡量包含不同實驗組別
記錄採樣到開始處理的時間
在分析與結果解釋中保留批次資訊

隨機分派與盲目試驗要留下可稽核紀錄

隨機分派

分派方法與亂數種子
分層或區集變項
分組表
籠位與房間位置
處理順序

盲目試驗

臨床評分
組織病理評分
影像選取
樣本排除決策
檔案編碼與資料分析

盲目試驗以分階段設計，不是全有或全無。

Percie du Sert N, et al. PLoS Biology. 2020;18:e3000410. doi:10.1371/journal.pbio.3000410

偏離計畫：要能回到動物與樣本

偏離事件要記清楚

發生什麼？例如處理延遲、樣本污染、記錄漏失

何時發生？採樣、處理、建庫、影像或分析階段

影響哪些動物與樣本？不要只寫「某一批」或「部分樣本」

是否改變分析條件？納入、排除或改變解釋層次

資料來源要串得回去

動物 ID 籠位 / 房間處理條件樣本 ID 基因庫 / 影像分析輸出

Important

公開資料可以去識別化；研究團隊內部不能切斷 linkage key。

這個案例如何回到 3R？

3R	本案例中的實際意義
Replacement	先評估小鼠與細胞模型，並說明適用邊界
Reduction	聚焦研究問題、提高有效資訊、分階段設計與資料再利用
Refinement	改善飼養條件、保定操作、採樣負擔與人道終點

Note

Refinement 不是把研究「做得更精緻」，而是減少動物的疼痛、緊迫與不必要負擔。

從鸚鵡延伸到其他非模式動物

可能包括：

鴿子的腫瘤影像研究
斑胸草雀的聲音與社會行為
野生動物追蹤
動物園與保育醫學

提醒：

影像、聲音、時間點或細胞可以很多，但真正彼此獨立的動物可能很少。

動物實驗的前中後檢查

`開始前：設計先寫清楚`

動物模型、研究問題、實驗單位與主要研究終點已定義
動物數、飼養條件、隨機分派與組織分配圖已完成
排除條件與偏離計畫紀錄方式已先寫好

`執行中：紀錄要串得回去`

持續記錄動物福祉、偏離計畫、處理順序與樣本來源
保留動物、樣本、檔案與分析輸出的 linkage

`解釋時：結論不要超過設計`

已揭露混合樣本、動物脫落與遺漏資料
探索性與確認性結論分開
推論沒有超過設計能力

最後一題

哪一句最準確？

只要使用 scRNA-seq，就能以較少動物完成確認性研究
極小的 p-value 可以補足 biological replication
高資訊量設計有助於 Reduction，但不能改變 experimental unit
預算不足時，應優先刪除對照組

References｜PaBV experimental infection

Gancz AY, et al. Virology Journal. 2009;6:100. doi:10.1186/1743-422X-6-100.
Mirhosseini N, et al. Journal of Avian Medicine and Surgery. 2011;25:199–204. doi:10.1647/2010-030.1.
Leal de Araujo J, et al. PLoS ONE. 2017;12:e0187797. doi:10.1371/journal.pone.0187797.
Gartner AM, et al. Avian Pathology. 2021;50:138–150. doi:10.1080/03079457.2020.1852177.
Rubbenstroth D. Viruses. 2022;14:1513. doi:10.3390/v14071513.

References｜design and reporting

Smith AJ, et al. PREPARE guidelines. Laboratory Animals. 2018;52:135–141. doi:10.1177/0023677217724823.
Percie du Sert N, et al. ARRIVE guidelines 2.0. PLoS Biology. 2020;18:e3000410. doi:10.1371/journal.pbio.3000410.
Zimmerman KD, et al. Nature Communications. 2021;12:738. doi:10.1038/s41467-021-21038-1.
Squair JW, et al. Nature Communications. 2021;12:5692. doi:10.1038/s41467-021-25960-2.
Stoeckius M, et al. Genome Biology. 2018;19:224. doi:10.1186/s13059-018-1603-1.
NC3Rs. Experimental Design Assistant. https://nc3rs.org.uk/our-portfolio/experimental-design-assistant-eda

Thank you

Discussions