遺傳流行病學原理

陳為堅 著

遺傳流行病學發展至今已逾四十多年,相關教科書或參考書多為英文書籍,較少有中文教科書或參考書。本書各章節書寫清楚、流暢、對遺傳學及統計學已有基礎的同學,這是一本學習遺傳流行病學很好的教學與自學用書。

本書包括十四章,從遺傳流行病學的發展歷史談起,介紹各種常用之遺傳流行病學核心概念,解釋其涵義,從孟德爾遺傳定律開始,還有哈溫平衡、基因頻率的估計、基因隨機漂流、連鎖不平衡與半形頻率的估計、遺傳機率與血緣係數、遺傳連鎖與遺傳地圖等基礎概念。然後介紹幾種遺傳流行病學的研究類型與分析方法,包括量性遺傳、再現危險比與家族研究、雙胞胎研究與分離分析、連鎖分析、遺傳變異種類及其鑑定、關聯分析。另外,也加入新領域的介紹,包含多基因風險分數、孟德爾隨機分派、基因與環境的交互作用、藥物基因體學、及基因表現與基因調控表現量之分析等議題。

書籍內容循序漸進,解說類別與量化性狀遺傳分析的基本原理,讓學生瞭解如何透過遺傳分析蒐尋疾病的易感基因,以奠定進一步探討遺傳流病之研究的基礎;章節安排涵蓋遺傳流行病學重要基本原理及觀念,內文所描述的重要發現附有文獻出處。適合作為大學部或研究所入門之教科書或其他醫學相關專業之參考用書。

陳為堅

臺灣大學醫學士、美國哈佛大學公共衛生學院流行病學研究所理學博士,現任國立臺灣大學公共衛生學院流行病學與預防醫學研究所特聘教授、臺大醫院精神部兼任研究員;2020年起借調至國家衛生研究院,擔任神經及精神醫學研究中心特聘研究員兼主任。主要研究領域為遺傳學、流行病學和精神與行為疾患。曾獲得國內二次科技部(國科會)傑出研究奬、特約研究人員。參與多種國內外期刊之編輯或評審工作,著有《科學論文寫作入門》,《公共衛生教育與人力現況與展望》(合著),合編有《公共衛生學》,以及多篇期刊和專書論文。
圖表目次
推薦序一 莊明哲
推薦序二 梁賡義
自序─遺傳流行病學是一段驚奇之旅
誌謝

第1章 遺傳流行病學的發展歷史
第2章 孟德爾遺傳及其擴充
  第一節 孟德爾「重現江湖」
  第二節 孟德爾遺傳的延伸
  結語
第3章 哈定─溫伯格平衡
  第一節 人口群中的基因頻率與基因型頻率
  第二節 基因頻率的估算及其變異數
  第三節 影響哈溫平衡的因素
  結語
第4章 基因隨機漂流
  第一節 有限人口群中的基因頻率
  第二節 帶有分群之人口群的基因漂流
  第三節 有效人口群大小
  第四節 歸宗法
  結語
第5章 連鎖不平衡
  第一節 連鎖不平衡的定義
  第二節 單套體頻率的估算
  第三節 連鎖不平衡係數的擴充與應用
第6章 遺傳機率與血緣係數
  第一節 遺傳機率的計算
  第二節 不同遺傳模式之遺傳風險的估算
  第三節 親屬間的血緣係數
  結語
第7章 遺傳連鎖與遺傳地圖
  第一節 遺傳連鎖的發現
  第二節 遺傳地圖
  第三節 定位函數
  第四節 重組的分布
  結語
第8章 量性遺傳
  第一節 量性遺傳現象
  第二節 型值與效應
  第三節 外表型值的成分及其變異數
  第四節 類別性狀中的線性與非線性遺傳效應
  結語
第9章 再現危險比與家族研究
  第一節 家族研究與家族聚集性
  第二節 再現風險
  第三節 再現風險比
  第四節 基因型相對風險比
  結語
第10章 雙胞胎研究與分離分析
  第一節 雙胞胎研究的基本原理
  第二節 雙胞胎研究的應用
  第三節 分離分析
  結語
第11章 遺傳連鎖分析
  第一節 兩點連鎖分析
  第二節 多點連鎖分析
  第三節 無母數連鎖分析
  第四節 數量性狀基因座的連鎖分析
  第五節 全基因體掃描
  結語
第12章 遺傳變異與基因表現量的檢測與應用
  第一節 遺傳變異的種類及其鑑定
  第二節 基因表現量的測量
  第三節 次世代定序法
  結語
第13章 關聯分析
  第一節 單套型相對風險分析
  第二節 傳遞/不平衡檢定
  第三節 家族關聯檢定
  第四節 全基因體關聯研究
  結語
第14章 遺傳流行病學的新發展
  第一節 多基因風險分數
  第二節 孟德爾隨機分派
  第三節 基因與環境的交互作用
  第四節 藥物基因體學
  第五節 基因表現與基因調控
  結語

索引
推薦序一
 
莊明哲(美國國家科學院院士及中央研究院院士、美國加州大學聖地牙哥分校大學講座教授、行為基因體學講座教授暨精神科精神醫學特聘教授)
 
就如本書第一章的歷史發展中所寫的,「遺傳流行病學」作為一種研究領域的名稱,大約是在1980年代才有的事。但是,構成遺傳流行病學的一些重要研究策略,更早之前其實就已發展成形。本書挑選了一些先前就已發展成熟的遺傳學概念,不管是孟德爾遺傳、哈定–溫伯格平衡、基因隨機漂流、連鎖不平衡、遺傳機率與血緣係數、遺傳連鎖與遺傳地圖,或是量性遺傳模式,都是很好而且重要的切入點。若能掌握這些名詞背後的概念,將更能清楚理解現在的遺傳流行病學研究。
 
在這之後,本書開始針對不同的研究設計,依照它們在遺傳因素是否有所貢獻與位置何在的推論,依序加以介紹。因此,先從最基本的疑問談起:如何確認研究人員想要探討的疾病或性狀,真的有家族聚集性?若有,可運用雙胞胎研究來評估遺傳因素的貢獻有多大?若貢獻明確,它的遺傳模式能否藉由分離分析來推測?接下來,則是運用連鎖分析來尋找連鎖標誌。之後,為了更細部的定位,要改採病例對照的關聯分析。這個安排,讓我想起當年在哈佛公共衛生學院所開授的精神流行病學。我在課程內容設計上所要強調的,就是這個架構。看起來,當年的課程對於為堅撰寫這本書似乎有一些影響。
 
為堅到哈佛公共衛生學院進修的1986年,剛好是連鎖分析起步的階段。對於俱備孟德爾遺傳特色的疾病,一旦發現了連鎖標誌,隨後的精細定位就能找出真正的致病基因變異。不管是杭丁頓症或是囊狀纖維化,都是如此。但是像思覺失調症這類複雜疾病,它的遺傳模式並不符合單一基因的遺傳模式。因此,需要一些變通的辦法,比如無母數連鎖分析或是內表型的概念。等到全基因體關聯分析的技術成熟後,整個領域又發展出新的分析概念,比如多基因風險分數,以及合作模式,像精神基因體學研究聯盟(Psychiatric Genomics Consortium)。對於這些重要轉折,本書都有精要的描述。
 
在我閱讀本書的各個章節時,發現裡面常會穿插一些研究上的故事。除了讓人更能理解觀念的演變,同時也是分享研究的基本精神。這不禁讓我想起自己1972年受聘到愛荷華大學後所建立的研究。這個日後被稱為「愛荷華500研究」(Iowa 500 Study)的家族研究,發現思覺失調症指引個案之家屬,有較高的思覺失調症罹病率;但其他組的指引個案之家屬則不會。反之,情感性疾患指引個案(躁症或重鬱症)之家屬,有較高的情感性疾患罹病率;但其他組的指引個案之家屬則不會。可是思覺失調症與躁症的界限,無法清楚區分。放在遺傳流行病學的架構來看,這些結果一方面提供重大精神疾病有來自遺傳因素貢獻的實證基礎,同時也呈現這些診斷類別在生物學上的效度。另一方面,不同指引案之家屬所呈現的部分重疊,也預告了當今多基因風險研究的最新發現,即思覺失調症與躁症兩者有相當程度的共享遺傳基礎。
 
這個經驗讓我深刻瞭解,對於基礎概念與方法的掌握,是從事科學研究非常重要的一環。這也是本書最大的好處,提供初學者一個相當簡潔又足夠寬廣的架構,來理解遺傳流行病學的「來龍去脈」。因此,我很樂意向讀者推薦這本書,也希望讀者能跟我一樣,在閱讀本書時,時時感受遺傳流行病學研究的美妙。
 
推薦序二
 
梁賡義(中央研究院院士、國家衛生研究院院長、美國國家醫學院院士)
 
在過去二十多年來,隨著人類基因體計畫的完成,促成了各種體學研究(-omics)的蓬勃發展。遺傳學的研究,真可說是「日日更新,月月不同」。在這些多方創新的推波助瀾之下,使得所謂的「精準醫學」和「精準健康」,可行性逐步提高。
 
但是,快速發展的新領域,對於想要入門的初學者,或是想要跨域的研究人員而言,都是一件極大的挑戰。
 
回想我自己的學術研究,亦曾經中途踏入原本不熟悉的遺傳流行病學領域,因此我個人那時所面對的挑戰,可以為這個快速發展的過程,提供一些時代的註解。當年在約翰霍浦金斯公共衛生學院任職時,一開始是從事重覆測量的生物統計方法學的研發。後來,在1984年因緣際會加入同在公衛院流行病學系同事Dr. Terri Beaty的研究團隊,探討各種疾病的家族聚集性,開啟了我進入遺傳流行病學此一學門的先河。六年後在醫學院精神科同事Dr. Ann Pulver的邀請下,參與了她所主持的一項思覺失調症的家族研究計畫。當我試圖去理解她的團隊所面臨的議題時,對於她們所使用名詞背後的原理與思考,其實必須需要非常足夠的瞭解。還好,當時因為有Dr. Pulver的協助,讓我逐漸弄清楚她的研究設計。於是我把這些理解,結合流行病學研究設計的語言,跟她合寫了一篇論文,把她整套的家族研究方法重新取名為「病例對照/親屬取樣法」(case-control/family sampling),發表在1996年的Genetic Epidemiology。有了這個「起手式」,之後我就順利地接續探討遺傳連鎖分析與關聯分析等領域的研究。
 
從個人的這個經驗,我能充分體會初入門者面對遺傳學名詞時的疑惑,對於背後的概念,往往不是三言兩語的說明就能夠理解清楚。在這個情況下,利用專書的形式,比較可以從基本的原理說起,又能把後來的發展提供一個理解的架構,幫助初學者對於這門學問的掌握。
 
偏偏遺傳學及其相關的研究,可說是當代進展最快速的領域。研究人員往往得花許多心力運用最新的觀念與方法,然後把最新的結果用高度壓縮的期刊論文格式呈現出來。如此情況下,還能有力氣來把基本原理寫成專書的人,恐怕所剩不多。我自己曾經跟同事合寫過重覆測量的生物統計方法專書,深知往往必需利用下班時間趕寫,才能完稿。我也曾遇過合寫,結果同事一直無法如期交稿,導致出版不成的窘境。
 
因此,當陳為堅主任把他剛剛完成校正的書稿拿給我看,並希望我能幫忙寫一篇推薦序時,我第一時間就答應了。因為我非常佩服他的毅力,尤其居然能夠在行政及研究兩忙之下,竟然能夠獨力撰寫這樣一本將近四百多頁的專書。
 
其實早在為堅借調到國家衛生研究院擔任神經及精神醫學研究中心主任之前,我跟他已相識多年。最早是在1993年,我受邀到臺大公共衛生研究所擔任客座教授;同一年的2月為堅從哈佛公衛學院學成,回到臺大公共衛生研究所任教。他那時主要參與精神科胡海國教授主持的思覺失調症整合型研究計畫。此後,我們兩人在國家衛生研究院的院外計畫學術審查會上,也有多年的互動經驗。因此,我也瞭解他對精神遺傳學的研究成果非常傑出。由他來寫這本書,可說不做第二人選。
 
我翻閱了整本書,發現這本書對於想要進入遺傳流行病學領域的人而言,真是不可多得的幫手。它包含了遺傳流行病學的核心概念,像是孟德爾遺傳、哈定─溫伯格平衡、基因隨機漂流、連鎖不平衡、遺傳機率與血緣係數、遺傳連鎖與遺傳地圖、量性遺傳。另外,針對不同的研究類型及其分析方法,也逐一加以介紹,包括:家族研究、雙胞胎研究、遺傳連鎖分析、關聯分析與遺傳流行病學的新發展等。因此,這本書的最大好處,在於提供一個足夠廣的架構,涵蓋古典的遺傳研究與最新的遺傳流行病學趨勢,並將不同的研策略彼此之間的關係,做了循序漸進的說明。
 
本書的另一項特色,在於為堅的文筆,就如他平常的談話,短短數語即把背景交待清楚。加上他的博學多聞,在不同段落間,常常穿插一些生動的故事,閱讀起來不但津津有味,且畫龍點睛,令人印象深刻。比如書中第二章,在介紹完孟德爾的遺傳實驗結果與他提出的解釋之後,書中又提起兩件關於孟德爾實驗數據的質疑,以及不同學者的解讀方式,突顯研究工作者必須維持真實的重要性。
 
因此,不管是初學者想入門,或是已有經驗想更瞭解全貌者,我都極力推薦這本難得一見的《遺傳流行病學原理》!
 
自序 遺傳流行病學是一段驚奇之旅
 
起心動念
 
本書的內容,主要是根據我在臺大公衛學院開授的一門選修課,課名就叫「遺傳流行病學原理」。1993年我剛回國任教時,除了必修課,公衛所希望針對重要但尚未有人開授的領域新開選修課,提供學生更廣的學習。於是我自告奮勇開出這門課,想不到一教已經超過25年。
 
當時遺傳流行病學仍是一門相對年輕的領域,不要說教科書,連課程都很少。我自己於1986年到哈佛公共衛生學院進修時,碰上連鎖分析在尋找人類疾病基因標誌上的成功應用,心裡也想應用這種方法來研究思覺失調症。但是當真正想投入時,發現相關的知識背景是散布在不同的課。例如,我一開始先在莊明哲教授所開的精神流行病學的課中,學習到家族研究、雙胞胎研究如何被應用在思覺失調症的病因探討上。但是對於DNA標誌與連鎖分析的相關知識,則是在莊教授的引薦下,於1988年暑假到醫學院Dr. Xandra O. Breakefield的神經遺傳學實驗室去實習,學習DNA萃取、南方墨點法(Southern blot)、限制性片段長度多型性(restriction fragment length polymorphism, RFLP)等。接著實驗室同仁推薦我去MIT修David Botstein與Gerald Fink合授的遺傳學,聽到Botstein生動地解說如何以RFLP建構遺傳圖譜來進行全基因體的連鎖掃描。有了這些基礎,1989年暑假才能參加Cold Spring Harbor由Eric Lander與David Page兩人帶領的基因定位工作坊。1990年則是到Colorado Boulder參加由Dr. David Fulker主辦的Twin Methodology Workshop,學習如何利用Structural Equation Modeling進行雙胞胎分析。
 
因此,當我在準備「遺傳流行病學原理」的主題與教材時,心裡其實是想藉此把這些到處學來的片斷概念與知識,利用上課的方式好好整理一番,說予別人聽,這往往是很有效的學習方式。很幸運的是,回國後除了獲得國家衛生研究院贊助有關思覺失調症的家族研究之多年期計畫,也獲得國科會贊助青少年雙胞胎的研究。於是我同時可以教學─研究相長。
 
當時在臺大上課有個特點,就是投影片上寫的都是英文,解說時則是中英夾雜。對我這種剛從國外回來,電腦中文輸入極不熟悉的新老師,短期可減輕教材準備上的難度。但是長久下來,這些名詞就一直沒有明確的中文譯名。可能也是這個原因,雖然教了很多年,教材逐年完備,但就是一直沒有動手寫成一本書。
 
我自己完整寫成一本書的經驗,要等到2007年暑假。從那時起,我開始把科學論文寫作的一些要領,用給研究室學生的書信模式寫出來,約每個月一封。累積一年後,終於能夠集結了十二封信,在2009年1月出版了《寫給初學者的信:科學論文寫作入門》。這本小書的出版,重新燃起我把「遺傳流行病學原理」教材寫成書的動力。
 
著手行動
 
受到出版第一本書的經驗所鼓舞,我馬上從2009年秋天的新學期,開始把我在「遺傳流行病學原理」課程裡頭的投影片,按主題逐步用中文寫成文章。一個學期下來,寫了快5章。但是學術專書的撰寫,難度顯然高很多,特別是在內容深度與題材廣度的安排上,相當不容易。2011年起,又因接任公共衛生學院院長職務,能專注於寫書的時間更少了。結果要等到2017年卸任後,才又重新提筆,把未完成的部分(往往也是最不容易寫的部分)補齊後,總算在2019年得以有初稿讓臺大出版中心送給匿名的同儕審查。
 
審查意見回來後,則是另一番考驗。審查者很快看出不同章節間,風格的差異與譯名的不一致。有些章節則是順序須要調整。此外,有些章節過於冗長,或有重要概念則付之闕如。只是章節一旦異動,須要搭配調整的幅度更大,所花時間也更長。再一項難題,則是原文中引用期刊論文的圖表,有無需要取得期刊的授權。最終,為了避免版權疑義,除了發表於Open Access的論文圖形,書中其餘的圖都只好重新畫。
 
全書架構
 
由於我自己的學習經驗,本書各章節主題的安排以及內容的取捨,主要是用一種比較廣的回顧方式,讓未具遺傳學或流行病學相關基礎的人也能從中獲益。當然我個人的功力是否足以達成這個目的,就只能讓讀者來評斷。
 
本書基本上可看成由兩大部分組成:(一)遺傳流行病學的核心概念,包含第1章到第8章;與(二)遺傳流行病學的研究類型及分析方法,包含第9章到第14章。
 
在核心概念方面,第1章先從遺傳流行病學的發展歷史談起,讓人瞭解這個領域與其他領域,例如:流行病學、人口群遺傳學、醫學遺傳學的相互關係。接著是介紹各種常用之遺傳流行病學概念的來龍去脈。其中,第2章是孟德爾遺傳及其擴充,第3章是哈定─溫伯格平衡,第4章是基因隨機漂流,第5章是連鎖不平衡,第6章是遺傳機率與血緣係數。接著第7章則引進比較複雜的遺傳連鎖與遺傳地圖,第8章則介紹量性遺傳的概念與符號。
 
在研究類型部分,第9章從基本的再現危險比與家族研究談起,第10章介紹雙胞胎研究與分離分析,第11章介紹遺傳連鎖分析,第12章則花了一些篇幅說明遺傳變異與基因表現量的檢測與應用,算是全書中用到分子遺傳技術名詞較多的一章。第13章則談到目前最常見的關聯分析,尤其是全基因體關聯分析的進行步驟。到了最後的第14章,則是簡短介紹新興的一些領域,包含多基因風險分數、孟德爾隨機分派、基因與環境的交互作用、藥物基因體學,及基因表現與基因調控等議題。
 
本書中每有專有名詞出現時,我都盡可能用括號附上原始的英文名詞。由於部分英文名詞並未有一致的中文翻譯,我大都參考國家教育研究院的譯法,只是有些仍無共識。愈是常用的名詞,翻譯上愈是困難。像是population genetics或 effective population size等名詞中的“population”,早期很多書都譯成「族群」,但是現在則譯成較為中性的「人口群」。不過這個名詞若用到動植物的遺傳學研究,又不好直稱其為「有效人口群」,只好保留原來的「族群」譯名。
 
從很多層面來看,本書也算是自己對無意中踏上遺傳流行病學研究的這趟驚奇之旅,留下見證的筆記,也希望對想要入門的人,可以加快他們的速度。
 
歡迎上車!