Chủ YếU Khác Tỷ lệ khám phá sai

Tỷ lệ khám phá sai

Tổng quat

Phần mềm

Sự miêu tả

Trang web

Bài đọc

Các khóa học

Tổng quat

Trang này mô tả ngắn gọn Tỷ lệ phát hiện sai (FDR) và cung cấp danh sách tài nguyên có chú thích.

Sự miêu tả

Khi phân tích kết quả từ các nghiên cứu trên toàn bộ bộ gen, thường hàng nghìn bài kiểm tra giả thuyết được tiến hành đồng thời. Việc sử dụng phương pháp Bonferroni truyền thống để sửa cho nhiều lần so sánh là quá thận trọng, vì đề phòng sự xuất hiện của kết quả dương tính giả sẽ dẫn đến nhiều phát hiện bị bỏ sót. Để có thể xác định nhiều so sánh quan trọng nhất có thể trong khi vẫn duy trì tỷ lệ dương tính giả thấp, Tỷ lệ phát hiện sai (FDR) và giá trị tương tự của nó được sử dụng.

Xác định vấn đề
Khi tiến hành kiểm định giả thuyết, chẳng hạn để xem liệu hai phương tiện có khác nhau đáng kể hay không, chúng tôi tính giá trị p, là xác suất thu được thống kê kiểm định bằng hoặc cao hơn thống kê được quan sát, giả sử giả thuyết rỗng là đúng. Ví dụ: nếu chúng ta có giá trị p là 0,03, điều đó có nghĩa là nếu giả thuyết vô hiệu của chúng ta là đúng, thì sẽ có 3% cơ hội nhận được thống kê thử nghiệm quan sát của chúng ta hoặc cực trị hơn. Vì đây là một xác suất nhỏ, chúng tôi bác bỏ giả thuyết vô hiệu và nói rằng các phương tiện là khác nhau đáng kể. Chúng tôi thường muốn giữ xác suất này dưới 5%. Khi chúng tôi đặt alpha của mình thành 0,05, chúng tôi đang nói rằng chúng tôi muốn xác suất mà một phát hiện rỗng sẽ được gọi là có ý nghĩa nhỏ hơn 5%. Nói cách khác, chúng tôi muốn xác suất của lỗi loại I, hoặc dương tính giả, nhỏ hơn 5%.

Khi chúng tôi tiến hành nhiều phép so sánh (tôi sẽ gọi mỗi bài kiểm tra là một tính năng), chúng tôi có xác suất dương tính giả tăng lên. Bạn càng có nhiều tính năng, thì khả năng một tính năng rỗng được gọi là quan trọng càng cao. Tỷ lệ dương tính giả (FPR), hoặc tỷ lệ lỗi trên mỗi so sánh (PCER), là số lần dương tính giả dự kiến ​​trong số tất cả các thử nghiệm giả thuyết được thực hiện. Vì vậy, nếu chúng tôi kiểm soát FPR ở mức alpha 0,05, chúng tôi đảm bảo rằng tỷ lệ phần trăm dương tính giả (đặc điểm rỗng được gọi là có ý nghĩa) trong số tất cả các thử nghiệm giả thuyết là 5% trở xuống. Phương pháp này đặt ra một vấn đề khi chúng ta đang tiến hành một số lượng lớn các thử nghiệm giả thuyết. Ví dụ, nếu chúng tôi đang thực hiện một nghiên cứu trên toàn bộ bộ gen xem xét sự biểu hiện gen khác biệt giữa mô khối u và mô khỏe mạnh, và chúng tôi đã kiểm tra 1000 gen và kiểm soát FPR, thì trung bình 50 gen không thực sự sẽ được gọi là đáng kể. Phương pháp này là quá tự do, vì chúng tôi không muốn có một số lượng lớn các kết quả dương tính giả.

Thông thường, thay vào đó, nhiều thủ tục so sánh kiểm soát tỷ lệ lỗi thông thường trong gia đình (FWER), tức là xác suất có một hoặc nhiều dương tính giả trong số tất cả các thử nghiệm giả thuyết được thực hiện. Hiệu chỉnh Bonferroni thường được sử dụng điều khiển FWER. Nếu chúng tôi kiểm tra từng giả thuyết ở mức ý nghĩa (alpha / # kiểm định giả thuyết), chúng tôi đảm bảo rằng xác suất có một hoặc nhiều dương tính giả sẽ nhỏ hơn alpha. Vì vậy, nếu alpha là 0,05 và chúng tôi đang kiểm tra 1000 gen của mình, chúng tôi sẽ kiểm tra mỗi giá trị p với mức ý nghĩa là 0,00005 để đảm bảo rằng xác suất có một hoặc nhiều dương tính giả là 5% hoặc ít hơn. Tuy nhiên, việc đề phòng bất kỳ trường hợp dương tính giả nào có thể quá nghiêm ngặt đối với các nghiên cứu trên toàn bộ hệ gen và có thể dẫn đến nhiều phát hiện bị bỏ sót, đặc biệt nếu chúng ta mong đợi có nhiều trường hợp dương tính thật.

chương trình công tác xã hội

Kiểm soát tỷ lệ phát hiện sai (FDR) là một cách để xác định càng nhiều đặc điểm quan trọng càng tốt trong khi tỷ lệ dương tính giả tương đối thấp.

Các bước để kiểm soát tỷ lệ phát hiện sai:

  • Kiểm soát FDR ở mức α * (tức là mức phát hiện sai dự kiến ​​chia cho tổng số phát hiện được kiểm soát)

E [V⁄R]

  • Tính giá trị p cho mỗi kiểm định giả thuyết và thứ tự (nhỏ nhất đến lớn nhất, P (tối thiểu) …… .P (tối đa))

  • Đối với giá trị p được đặt hàng thứ i, hãy kiểm tra xem những điều sau có được thỏa mãn không:

    khu học chánh minersville v. gobitis

P (i) ≤ α × i / m

Nếu đúng, thì đáng kể

* Giới hạn: nếu tỷ lệ lỗi (α) rất lớn có thể dẫn đến số lượng kết quả dương tính giả tăng lên đáng kể

Tỷ lệ phát hiện sai (FDR)

FDR là tỷ lệ mà các tính năng được gọi là quan trọng thực sự là rỗng.
FDR = dự kiến ​​(# dự đoán sai / # tổng số dự đoán)

FDR là tỷ lệ mà các tính năng được gọi là quan trọng thực sự là rỗng. FDR là 5% có nghĩa là, trong số tất cả các tính năng được gọi là quan trọng, 5% trong số này thực sự là rỗng. Cũng giống như chúng ta đặt alpha làm ngưỡng cho giá trị p để điều khiển FPR, chúng ta cũng có thể đặt ngưỡng cho giá trị q, là tương tự FDR của giá trị p. Ngưỡng giá trị p (alpha) là 0,05 mang lại FPR là 5% trong số tất cả các đối tượng thực sự rỗng. Ngưỡng giá trị q là 0,05 mang lại FDR là 5% trong số tất cả các tính năng được gọi là đáng kể. Giá trị q là tỷ lệ dương tính giả dự kiến ​​trong số tất cả các đối tượng địa lý ở mức cực đoan hoặc cao hơn đối tượng quan sát được.

Trong nghiên cứu của chúng tôi về 1000 gen, giả sử gen Y có giá trị p là 0,00005 và giá trị q là 0,03. Xác suất để thống kê thử nghiệm của một gen biểu hiện không phân biệt sẽ cực đoan bằng hoặc cao hơn thống kê thử nghiệm đối với gen Y là 0,00005. Tuy nhiên, thống kê thử nghiệm của gen Y có thể rất cực đoan và có thể thống kê thử nghiệm này không chắc đối với một gen biểu hiện khác biệt. Rất có thể thực sự có các gen biểu hiện khác biệt với số liệu thống kê thử nghiệm ít cực đoan hơn gen Y. Sử dụng giá trị q là 0,03 cho phép chúng ta nói rằng 3% số gen ở mức cực đoan trở lên (tức là các gen có p- thấp hơn giá trị) như gen Y là gen dương tính giả. Sử dụng q-giá trị cho phép chúng tôi quyết định có bao nhiêu dương tính giả mà chúng tôi sẵn sàng chấp nhận trong số tất cả các tính năng mà chúng tôi gọi là quan trọng. Điều này đặc biệt hữu ích khi chúng tôi muốn thực hiện một số lượng lớn các khám phá để xác nhận thêm sau này (tức là nghiên cứu thử nghiệm hoặc phân tích khám phá, ví dụ: nếu chúng tôi đã thực hiện một microarray biểu hiện gen để chọn các gen biểu hiện khác biệt để xác nhận với PCR thời gian thực). Điều này cũng hữu ích trong các nghiên cứu trên toàn bộ bộ gen, nơi chúng tôi mong đợi một phần lớn các tính năng thực sự thay thế và chúng tôi không muốn hạn chế khả năng khám phá của mình.

FDR có một số đặc tính hữu ích. Nếu tất cả các giả thuyết rỗng đều đúng (không có kết quả thay thế thực sự nào) thì FDR = FWER. Khi có một số giả thuyết thay thế thực sự, việc kiểm soát FWER cũng tự động kiểm soát FDR.

Sức mạnh của phương pháp FDR (nhớ lại rằng sức mạnh là xác suất bác bỏ giả thuyết vô hiệu khi phương án thay thế là đúng) lớn hơn một cách đồng nhất so với các phương pháp Bonferroni. Lợi thế về sức mạnh của FDR so với các phương pháp Bonferroni tăng lên khi số lượng các thử nghiệm giả thuyết ngày càng tăng.

Ước tính FDR
(Từ Storey và Tibshirani, 2003)

Định nghĩa: t: ngưỡngV: # trong số các kết quả dương tính giảS: # trong số các tính năng được gọi là có ý nghĩam0: # trong số các tính năng thực sự rỗngm: tổng số các thử nghiệm giả thuyết (tính năng)
FDR ở một ngưỡng nhất định, t, là FDR (t). FDR (t) ≈ E [V (t)] / E [S (t)] -> FDR ở một ngưỡng nhất định có thể được ước tính bằng số lần dương tính giả dự kiến ​​ở ngưỡng đó chia cho số tính năng dự kiến ​​được gọi là quan trọng ở ngưỡng đó.
Làm thế nào để chúng ta ước tính E [S (t)]?
E [S (t)] đơn giản là S (t), số giá trị p quan sát được ≤ t (tức là số đặc trưng mà chúng ta gọi là có ý nghĩa ở ngưỡng đã chọn). Xác suất giá trị p rỗng là ≤ t là t (khi alpha = 0,05, có 5% xác suất rằng một đối tượng rỗng thực sự có giá trị p thấp hơn ngưỡng một cách tình cờ và do đó được gọi là có ý nghĩa).
Làm thế nào để chúng ta ước tính E [V (t)]?
E [V (t)] = m0 * t -> số lần dương tính giả dự kiến ​​đối với một ngưỡng nhất định bằng số đặc điểm thực sự rỗng nhân với xác suất một đối tượng rỗng sẽ được gọi là có ý nghĩa.
Làm thế nào để chúng tôi ước tính m0?
Giá trị thực của m0 là chưa biết. Chúng ta có thể ước tính tỷ lệ các đối tượng thực sự là rỗng, m0 / m = π0.
Chúng tôi giả định rằng các giá trị p của các đối tượng rỗng sẽ được phân phối đồng đều (có phân phối phẳng) giữa [0,1]. Chiều cao của phân phối phẳng đưa ra một ước tính thận trọng về tỷ lệ tổng thể của các giá trị p null, π0. Ví dụ, hình ảnh dưới đây được lấy từ Storey và Tibshirani (2003) là biểu đồ mật độ của 3000 giá trị p cho 3000 gen từ một nghiên cứu biểu hiện gen. Đường chấm biểu thị chiều cao của phần phẳng của biểu đồ. Chúng tôi mong đợi các tính năng thực sự rỗng sẽ hình thành phân phối phẳng này từ [0,1] và các tính năng thay thế thực sự gần bằng 0.

π0 được định lượng bằng, trong đó lambda là tham số điều chỉnh (ví dụ trong hình trên, chúng ta có thể chọn lambda = 0,5, vì sau giá trị p là 0,5, phân bố khá bằng phẳng. Tỷ lệ các đối tượng rỗng thực sự bằng số p -giá trị lớn hơn lambda chia cho m (1-lambda). Khi lambda tiến tới 0 (khi phần lớn phân phối bằng phẳng), mẫu số sẽ xấp xỉ m, tử số cũng vậy vì phần lớn các giá trị p sẽ lớn hơn hơn lambda, và π0 sẽ xấp xỉ 1 (tất cả các đối tượng đều rỗng).
Việc lựa chọn lambda thường được tự động hóa bởi các chương trình thống kê.

Bây giờ chúng tôi đã ước tính π0, chúng tôi có thể ước tính FDR (t) là
Tử số của phương trình này chỉ là số dương tính giả dự kiến, vì π0 * m là số ước tính của các giả thuyết rỗng thực sự và t là xác suất của một đối tượng thực sự rỗng được gọi là có ý nghĩa (nằm dưới ngưỡng t). Mẫu số, như chúng tôi đã nói ở trên, chỉ đơn giản là số lượng các tính năng được gọi là quan trọng.
Giá trị q cho một tính năng sau đó là FDR tối thiểu có thể đạt được khi gọi tính năng đó là quan trọng.

(Lưu ý: các định nghĩa trên giả định rằng m rất lớn, và do đó S> 0. Khi S = 0, FDR là không xác định, vì vậy trong tài liệu thống kê, đại lượng E [V /? S? | S> 0]? * Pr (S> 0) được sử dụng làm FDR. Ngoài ra, FDR dương (pFDR) được sử dụng, là E [V / S? | S> 0]. Xem Benjamini và Hochberg (1995) và Storey và Tibshirani (2003) để biết thêm thông tin.)

Bài đọc

Sách giáo khoa & Chương

NHỮNG TIẾN BỘ GẦN ĐÂY TRONG THỐNG KÊ SINH HỌC (Tập 4):
Tỷ lệ khám phá sai, phân tích tỷ lệ sống sót và các chủ đề liên quan
Biên tập bởi Manish Bhattacharjee (Viện Công nghệ New Jersey, Hoa Kỳ), Sunil K Dhar (Viện Công nghệ New Jersey, Hoa Kỳ) và Sundarraman Subramanian (Viện Công nghệ New Jersey, Hoa Kỳ).
http://www.worldscibooks.com/lifesci/8010.html
Chương đầu tiên của cuốn sách này cung cấp đánh giá về các quy trình kiểm soát FDR đã được các nhà thống kê nổi tiếng trong lĩnh vực này đề xuất và đề xuất một phương pháp thích ứng mới kiểm soát FDR khi các giá trị p là độc lập hoặc phụ thuộc tích cực.

Thống kê sinh học trực quan: Hướng dẫn phi toán học để tư duy thống kê
bởi Harvey Motulsky
http://www.amazon.com/Intuitive-Biostosystem-Nonmathelogical-Statistical-Thinking/dp/product-description/0199730067
Đây là cuốn sách thống kê được viết cho các nhà khoa học thiếu nền tảng thống kê phức tạp. Phần E, Những thách thức trong thống kê, giải thích theo thuật ngữ của giáo dân về vấn đề so sánh nhiều lần và các cách xử lý khác nhau, bao gồm các mô tả cơ bản về tỷ lệ sai sót trong gia đình và FDR.

Suy luận quy mô lớn: các phương pháp Bayes thực nghiệm để ước tính, kiểm tra và dự đoán
bởi Efron, B. (2010). Viện chuyên khảo thống kê toán học, Nhà xuất bản Đại học Cambridge.
http://www.amazon.com/gp/product/0521192498/ref=as_li_ss_tl?ie=UTF8&tag=chrprobboo-20&linkCode=as2&camp=1789&creative=390957&creativeASIN=0521192498
Đây là cuốn sách xem xét lại khái niệm FDR và ​​khám phá giá trị của nó không chỉ như một thủ tục ước tính mà còn là một đối tượng kiểm tra ý nghĩa. Tác giả cũng đưa ra một đánh giá thực nghiệm về độ chính xác của các ước tính FDR.

Các bài báo về phương pháp luận

Benjamini, Y. và Y. Hochberg (1995). Kiểm soát Tỷ lệ Phát hiện Sai: Một Phương pháp Tiếp cận Thực tế và Mạnh mẽ cho Nhiều Thử nghiệm. Tạp chí của Hiệp hội Thống kê Hoàng gia. Dòng B (Phương pháp luận) 57 (1): 289-300.
Bài báo năm 1995 này là mô tả chính thức đầu tiên về FDR. Các tác giả giải thích về mặt toán học cách FDR liên quan đến tỷ lệ lỗi gia đình (FWER), cung cấp một ví dụ đơn giản về cách sử dụng FDR và ​​thực hiện một nghiên cứu mô phỏng chứng minh sức mạnh của thủ tục FDR so với các thủ tục kiểu Bonferroni.

Storey, J. D. và R. Tibshirani (2003). Ý nghĩa thống kê đối với các nghiên cứu trên toàn bộ bộ gen. Kỷ yếu của Viện Hàn lâm Khoa học Quốc gia 100 (16): 9440-9445.
Bài báo này giải thích FDR là gì và tại sao nó lại quan trọng đối với các nghiên cứu trên toàn bộ bộ gen và giải thích cách ước tính FDR. Nó đưa ra các ví dụ về các tình huống mà FDR sẽ hữu ích và cung cấp một ví dụ xuyên suốt về cách các tác giả đã sử dụng FDR để phân tích dữ liệu biểu hiện gen vi phân mảng vi mô.

Storey JD. (2010) Tỷ lệ phát hiện sai. In International Encyclopedia of Statistical Science, Lovric M (chủ biên).
Một bài báo rất hay về việc xem quá kiểm soát FDR, FDR tích cực (pFDR) và sự phụ thuộc. Được khuyến nghị để có cái nhìn tổng quan đơn giản về FDR và ​​các phương pháp liên quan để so sánh nhiều lần.

Reiner A, Yekutieli D, Benjamini Y: Xác định các gen biểu hiện khác biệt bằng cách sử dụng các quy trình kiểm soát tỷ lệ phát hiện sai. Tin sinh học 2003, 19 (3): 368-375.
Bài báo này sử dụng dữ liệu microarray mô phỏng để so sánh ba quy trình kiểm soát FDR dựa trên lấy mẫu lại với quy trình Benjamini-Hochberg. Việc lấy mẫu lại các thống kê thử nghiệm được thực hiện để không giả định sự phân bổ của thống kê thử nghiệm về biểu hiện khác biệt của mỗi gen.

Verhoeven KJF, Simonsen KL, McIntyre LM: Thực hiện kiểm soát tỷ lệ phát hiện sai: tăng sức mạnh của bạn. Oikos 2005, 108 (3): 643-647.
Bài báo này giải thích quy trình Benjamini-Hochberg, cung cấp một ví dụ mô phỏng và thảo luận về những phát triển gần đây trong lĩnh vực FDR có thể cung cấp nhiều năng lượng hơn so với phương pháp FDR ban đầu.

Stan Pounds và Cheng Cheng (2004) Cải thiện ước tính tỷ lệ phát hiện sai Tin sinh học Vol. 20 không. 11 2004, trang 1737–1745.
Bài báo này giới thiệu một phương pháp được gọi là biểu đồ LOESS khoảng cách (SPLOSH). Phương pháp này được đề xuất để ước tính FDR có điều kiện (cFDR), tỷ lệ dương tính giả dự kiến ​​với điều kiện có k phát hiện 'đáng kể'.

Daniel Yekutieli, Yoav Benjamini (1998) Tỷ lệ phát hiện sai dựa trên lấy mẫu kiểm soát nhiều quy trình thử nghiệm cho thống kê thử nghiệm tương quan Tạp chí Lập kế hoạch và Suy luận Thống kê 82 (1999) 171-196.
Bài báo này giới thiệu một quy trình kiểm soát FDR mới để xử lý các thống kê thử nghiệm có tương quan với nhau. Phương pháp này liên quan đến việc tính toán giá trị p dựa trên việc lấy mẫu lại. Các thuộc tính của phương pháp này được đánh giá bằng cách sử dụng một nghiên cứu mô phỏng.

Yoav Benjamini và Daniel Yekutieli (2001) Việc kiểm soát tỷ lệ phát hiện sai trong nhiều thử nghiệm dưới sự phụ thuộc Biên niên sử thống kê 2001, Vol. 29, số 4, 1165–1188.
Phương pháp FDR ban đầu được đề xuất là để sử dụng trong thử nghiệm nhiều giả thuyết về thống kê thử nghiệm độc lập. Bài báo này chỉ ra rằng phương pháp FDR ban đầu cũng kiểm soát FDR khi thống kê thử nghiệm có phụ thuộc hồi quy dương vào mỗi thống kê thử nghiệm tương ứng với giả thuyết rỗng thực sự. Một ví dụ về thống kê thử nghiệm phụ thuộc sẽ là thử nghiệm nhiều điểm cuối giữa các nhóm điều trị và nhóm chứng trong một thử nghiệm lâm sàng.

John D. Storey (2003) Tỷ lệ phát hiện sai dương tính: Giải thích theo kiểu Bayes và giá trị q The Annals of Statistics 2003, Vol. 31, số 6, 2013–2035.
Bài báo này định nghĩa tỷ lệ phát hiện sai dương tính (pFDR), là số lần dương tính giả dự kiến ​​trong số tất cả các xét nghiệm được gọi là có ý nghĩa với điều kiện là có ít nhất một phát hiện dương tính. Bài báo cũng cung cấp cách giải thích theo kiểu Bayes về pFDR.

ny lần v chúng tôi

Yudi Pawitan, Stefan Michiels, Serge Koscielny, Arief Gusnanto, và Alexander Ploner (2005) Tỷ lệ phát hiện sai, độ nhạy và kích thước mẫu cho các nghiên cứu microarray Bioinformatics Vol. 21 không. 13 2005, trang 3017–3024.
Bài báo này mô tả phương pháp tính toán cỡ mẫu cho một nghiên cứu so sánh hai mẫu dựa trên độ nhạy và điều khiển FDR.

Grant GR, Liu J, Stoeckert CJ Jr. (2005) Một phương pháp tiếp cận tỷ lệ phát hiện sai thực tế để xác định các mẫu biểu thức vi phân trong dữ liệu microarray. Tin sinh học. 2005, 21 (11): 2684-90.
Các tác giả mô tả các phương pháp ước lượng hoán vị và thảo luận các vấn đề liên quan đến việc nhà nghiên cứu lựa chọn các phương pháp thống kê và biến đổi dữ liệu. Tối ưu hóa điện năng liên quan đến việc sử dụng dữ liệu microarray cũng được khám phá.

Jianqing Fan, Frederick L. Moore, Xu Han, Weijie Gu, Ước tính Tỷ lệ Phát hiện Sai theo Sự phụ thuộc Hiệp phương sai Tùy ý. J Am Stat PGS. Năm 2012; 107 (499): 1019–1035.
Bài báo này đề xuất và mô tả một phương pháp để kiểm soát FDR dựa trên sự xấp xỉ hệ số chính của ma trận hiệp phương sai của thống kê thử nghiệm.

Các bài báo ứng dụng

Han S, Lee K-M, Park SK, Lee JE, Ahn HS, Shin HY, Kang HJ, Koo HH, Seo JJ, Choi JE và cộng sự: Nghiên cứu liên kết toàn bộ gen về bệnh bạch cầu nguyên bào lympho cấp tính ở trẻ em ở Hàn Quốc. Nghiên cứu bệnh bạch cầu 2010, 34 (10): 1271-1274.
Đây là một nghiên cứu liên kết toàn bộ gen (GWAS) kiểm tra một triệu đa hình nucleotide đơn (SNP) về mối liên quan với bệnh bạch cầu nguyên bào lympho hoạt tính ở trẻ em (ALL). Họ đã kiểm soát FDR ở mức 0,2 và tìm thấy 6 SNP trong 4 gen khác nhau có liên quan chặt chẽ đến nguy cơ TẤT CẢ.

Pedersen, K. S., Bamlet, W. R., Oberg, A. L., de Andrade, M., Matsumoto, M. E., Tang, H., Thibodeau, S. N., Petersen, G. M. và Wang, L. (2011). Dấu hiệu methyl hóa DNA của bạch cầu giúp phân biệt bệnh nhân ung thư tuyến tụy với bệnh nhân khỏe mạnh. PLoS ONE 6, e18223.
Nghiên cứu này được kiểm soát đối với FDR<0.05 when looking for differentially methylated genes between pancreatic adenoma patients and healthy controls to find epigenetic biomarkers of disease.

Daniel W. Lin, Liesel M. FitzGerald, Rong Fu, Erika M. Kwon, Siqun Lilly Zheng, Suzanne và cộng sự. Mortality (2011), Dấu ấn sinh học của Dịch tễ ung thư Trước năm 2011; 20: 1928-1936. Nghiên cứu này đã kiểm tra sự biến đổi trong các gen ứng cử viên được chọn liên quan đến sự khởi phát của ung thư tuyến tiền liệt để kiểm tra giá trị tiên lượng của nó ở những người có nguy cơ cao. FDR được sử dụng để xếp hạng các đa hình nucleotide đơn (SNP) và xác định các điểm xếp hạng hàng đầu được quan tâm.

Radom-Aizik S, Zaldivar F, Leu S-Y, Adams GR, Oliver S, Cooper DM: Ảnh hưởng của tập thể dục đối với sự biểu hiện microRNA ở nam giới trẻ tuổi tế bào đơn nhân máu ngoại vi. Khoa học Lâm sàng và Dịch thuật 2012, 5 (1): 32-38.
Nghiên cứu này đã kiểm tra sự thay đổi trong biểu hiện microRNA trước và sau khi tập thể dục bằng cách sử dụng microarray. Họ sử dụng quy trình Benjamini-Hochberg để kiểm soát FDR ở mức 0,05, và phát hiện ra 34 trong số 236 microRNA được biểu hiện một cách khác biệt. Sau đó, các nhà điều tra đã chọn các microRNA từ 34 microRNA này để được xác nhận bằng PCR thời gian thực.

trường đại học tốt nhất nyc

Trang web

Gói thống kê R
http://genomine.org/qvalue/results.html
Mã R được chú thích được sử dụng để phân tích dữ liệu trong bài báo Storey và Tibshirani (2003), bao gồm cả liên kết tới tệp dữ liệu. Mã này có thể được điều chỉnh để hoạt động với bất kỳ dữ liệu mảng nào.

http://www.bioconductor.org/packages/release/bioc/html/qvalue.html
gói qvalue cho R.

http://journal.r-project.org/archive/2009-1/RJournal_2009-1.pdf

Dự án Tạp chí R là một ấn phẩm truy cập mở, được bình duyệt của Quỹ R về Máy tính Thống kê. Tập này cung cấp một bài báo có tựa đề 'Ước tính kích thước mẫu trong khi kiểm soát tỷ lệ phát hiện sai cho thử nghiệm Microarray' của Megan Orr và Peng Liu. Các chức năng cụ thể và các ví dụ chi tiết được cung cấp.

http://strimmerlab.org/notes/fdr.html
Trang web này cung cấp danh sách các phần mềm R để phân tích FDR, với các liên kết đến trang chủ của chúng để biết mô tả về các tính năng của gói.

SAS
http://support.sas.com/documentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_multtest_sect001.htm
Mô tả PROC MULTTEST trong SAS, cung cấp các tùy chọn để kiểm soát FDR bằng các phương pháp khác nhau.

TIỂU BANG
http://www.stata-journal.com/article.html?article=st0209
Cung cấp các lệnh STATA để tính toán các giá trị q cho các thủ tục kiểm tra nhiều lần (tính các giá trị q được điều chỉnh FDR).

FDR_general tài nguyên web
http://www.math.tau.ac.il/~ybenja/fdr/index.htm
Trang web được quản lý bởi các nhà thống kê tại Đại học Tel Aviv, người đầu tiên chính thức giới thiệu FDR.

http://www.math.tau.ac.il/~ybenja/
Trang web FDR này có sẵn nhiều tài liệu tham khảo. Bài giảng về FDR có sẵn để xem xét.

http://www.cbil.upenn.edu/PaGE/fdr.html
Giải thích ngắn gọn, hay về FDR. Một bản tóm tắt hữu ích trong nháy mắt với ví dụ được cung cấp.

http://www.rowett.ac.uk/~gwh/False-posaries-and-the-qvalue.pdf
Tổng quan ngắn gọn về giá trị q và dương tính giả.

Các khóa học

Hướng dẫn về Kiểm soát Phát hiện Sai của Christopher R. Genovese Khoa Thống kê Đại học Carnegie Mellon.
Powerpoint này là một hướng dẫn rất kỹ lưỡng cho những người quan tâm đến việc tìm hiểu cơ sở toán học của FDR và ​​các biến thể trên FDR.

Thử nghiệm nhiều lần của Joshua Akey, Khoa Khoa học Bộ gen, Đại học Washington.
Powerpoint này cung cấp sự hiểu biết rất trực quan về nhiều phép so sánh và FDR. Bài giảng này rất tốt cho những ai đang tìm kiếm sự hiểu biết đơn giản về FDR mà không cần nhiều môn toán.

Ước tính tỷ lệ phát hiện sai cục bộ trong phát hiện biểu thức khác nhau giữa hai lớp.
Bài trình bày của Geoffrey MacLachlan, Giáo sư, Đại học Queensland, Úc.
www.youtube.com/watch?v=J4wn9_LGPcY
Bài giảng video này rất hữu ích trong việc tìm hiểu về FDR cục bộ, là xác suất của một giả thuyết cụ thể là đúng, với thống kê thử nghiệm cụ thể hoặc giá trị p của nó.

Quy trình kiểm soát tỷ lệ phát hiện sai cho các thử nghiệm rời rạc
Bài trình bày của Ruth Heller, Giáo sư, Cục Thống kê và Nghiên cứu Hoạt động. Đại học Tel Aviv
http://www.youtube.com/watch?v=IGjElkd4eS8
Bài giảng video này rất hữu ích trong việc tìm hiểu về ứng dụng của điều khiển FDR trên dữ liệu rời rạc. Một số quy trình nâng cấp và hạ bậc để kiểm soát FDR khi xử lý dữ liệu rời rạc được thảo luận. Các giải pháp thay thế cuối cùng giúp tăng sức mạnh đã được xem xét.

Bài ViếT Thú Vị

Editor Choice

Dịch, Đặc hữu, Đại dịch: Sự khác biệt là gì?
Dịch, Đặc hữu, Đại dịch: Sự khác biệt là gì?
Đại dịch coronavirus mới là mô hình hoàn hảo để hiểu chính xác đại dịch là gì và nó tác động như thế nào đến cuộc sống trên quy mô toàn cầu. Kể từ khi COVID-19 xuất hiện vào năm 2020, công chúng đã được sử dụng ngôn ngữ mới để hiểu về vi rút và phản ứng sức khỏe cộng đồng toàn cầu sau đó. Bài viết này sẽ khám phá các yếu tố tạo nên đại dịch và cách thức nó
Trái đất và các dân tộc của nó, Tập II: Kể từ năm 1500: Lịch sử toàn cầu
Trái đất và các dân tộc của nó, Tập II: Kể từ năm 1500: Lịch sử toàn cầu
Ủy ban Tư tưởng Toàn cầu tại Đại học Columbia, do nhà kinh tế học từng đoạt giải Nobel Joseph Stiglitz làm chủ tịch, khuyến khích các nghiên cứu liên ngành về toàn cầu hóa.
Bằng tiến sĩ. Trong kinh tế học
Bằng tiến sĩ. Trong kinh tế học
Trong Memoriam: Jack B. Weinstein ’48
Trong Memoriam: Jack B. Weinstein ’48
Một sư tử pháp lý, thẩm phán liên bang lâu năm huyền thoại, giáo sư Trường Luật Columbia đáng kính, và là một cựu sinh viên tích cực, qua đời ở tuổi 99.
Mariusz Kozak
Mariusz Kozak
Mariusz Kozak là tác giả của Enacting Musical Time: The Bodily Experience of New Music (Nhà xuất bản Đại học Oxford), trong đó ông xem xét sự hiểu biết và trải nghiệm thời gian âm nhạc của người nghe được hình thành như thế nào qua các hành động và cử chỉ của cơ thể. Nghiên cứu của ông tập trung vào mối quan hệ giữa âm nhạc, nhận thức và cơ thể. Kozak kết nối các phương pháp tiếp cận thử nghiệm từ hiện thân
Chữa bệnh bằng Somatic cho sự đàn áp nội bộ
Chữa bệnh bằng Somatic cho sự đàn áp nội bộ
CHỈ TRỰC TUYẾN | BẮT BUỘC ĐĂNG KÝ | CÓ S HON 3 GIỜ CE ĐỂ CÓ PHÍ Giới thiệu về Hội thảo Tham gia Danielle Murphy (bio), ...
Gayatri Chakravorty Spivak, Robert Gooding-Williams, Kendall Thomas, Ivan Calaff, Flores Forbes và Bernard E. Harcourt
Gayatri Chakravorty Spivak, Robert Gooding-Williams, Kendall Thomas, Ivan Calaff, Flores Forbes và Bernard E. Harcourt