Göstergeler arasındaki fark minimum düzeydedir ve istatistiksel olarak anlamlı değildir. İstatistiksel anlamlılığın gizlenmesi

Bir deneyin (anketin) herhangi bir bilimsel ve pratik durumunda, araştırmacılar tüm insanları (genel nüfus, nüfus) değil, yalnızca belirli bir örneği inceleyebilir. Örneğin, belirli bir hastalıktan muzdarip olanlar gibi nispeten küçük bir insan grubu üzerinde çalışıyor olsak bile, uygun kaynaklara sahip olmamız veya her hastayı test etme ihtiyacı duymamız pek olası değildir. Bunun yerine, daha uygun ve daha az zaman alıcı olduğundan popülasyondan bir numuneyi test etmek yaygındır. Eğer öyleyse, örneklemden elde edilen sonuçların tüm grubu temsil ettiğini nasıl bileceğiz? Ya da profesyonel terminolojiyi kullanırsak, araştırmamızın konunun tamamını doğru şekilde tanımladığından emin olabilir miyiz? nüfus, kullandığımız örnek?

Bu soruyu cevaplamak için test sonuçlarının istatistiksel anlamlılığının belirlenmesi gerekir. İstatistiksel önem (Önemli seviye kısaltılmış Sig.), veya /7 anlamlılık düzeyi (p düzeyi) - belirli bir sonucun, çalışmanın örneklendiği popülasyonu doğru şekilde temsil etme olasılığıdır. Bunun yalnızca olduğunu unutmayın olasılık- belirli bir çalışmanın tüm popülasyonu doğru şekilde tanımladığını kesin olarak söylemek imkansızdır. En iyi ihtimalle anlamlılık düzeyi bunun çok muhtemel olduğu sonucuna varabilir. Dolayısıyla, kaçınılmaz olarak bir sonraki soru ortaya çıkıyor: Belirli bir sonucun popülasyonun doğru bir karakterizasyonu olarak kabul edilebilmesi için hangi önem düzeyine sahip olması gerekir?

Örneğin, hangi olasılık değerinde bu tür şansların risk almak için yeterli olduğunu söylemeye isteklisiniz? Ya oranlar 100 üzerinden 10 ya da 100 üzerinden 50 ise? Peki ya bu olasılık daha yüksekse? 100 üzerinden 90, 100 üzerinden 95 veya 100 üzerinden 98 gibi oranlara ne dersiniz? Risk içeren bir durum için bu seçim oldukça sorunludur çünkü kişinin kişisel özelliklerine bağlıdır.

Psikolojide, geleneksel olarak 100 üzerinden 95 veya daha fazla şansın, sonuçların doğru olma olasılığının, tüm popülasyona genellenebilecek kadar yüksek olduğu anlamına geldiğine inanılır. Bu rakam bilimsel ve pratik faaliyet sürecinde oluşturulmuştur - kılavuz olarak seçilmesi gereken bir yasa yoktur (ve aslında diğer bilimlerde bazen önem seviyesinin diğer değerleri seçilir).

Psikolojide bu olasılık oldukça alışılmadık bir şekilde işlenir. Örneğin popülasyonu temsil etme olasılığı yerine, örneğin popülasyonu temsil etme olasılığı temsil etmiyor nüfus. Başka bir deyişle, gözlemlenen ilişkinin veya farklılıkların rastgele olması ve popülasyonun bir özelliği olmaması olasılığıdır. Dolayısıyla psikologlar, bir çalışmanın sonuçlarının doğru olma ihtimalinin 100'de 95 olduğunu söylemek yerine, sonuçların yanlış olma ihtimalinin 100'de 5 olduğunu söylüyorlar (tıpkı sonuçların doğru olma ihtimalinin 100'de 40 olduğu anlamına geldiği gibi) Yanlışlıkları lehine 100'de 60 şans). Olasılık değeri bazen yüzde olarak ifade edilir, ancak daha sıklıkla ondalık kesir olarak yazılır. Örneğin, 100 üzerinden 10 şans, 0,1'lik ondalık kesir olarak ifade edilir; 100 üzerinden 5 0,05 olarak yazılır; 100 üzerinden 1 - 0,01. Bu kayıt biçiminde sınır değeri 0,05'tir. Bir sonucun doğru sayılabilmesi için anlamlılık düzeyinin yüksek olması gerekir. altında bu sayı (unutmayın, bu sonucun olasılığıdır) yanlış nüfusu tanımlar). Terminolojiyi aradan çıkarmak için, “sonucun yanlış olma ihtimalini” (buna daha doğrusu) ekleyelim. önem düzeyi) genellikle Latin harfiyle gösterilir R. Deneysel sonuçların açıklamaları genellikle "sonuçlar güven düzeyinde anlamlıydı" gibi bir özet beyanı içerir. (P(p) 0,05'ten az (yani %5'ten az).

Böylece anlamlılık düzeyi ( R) sonuçların olasılığını gösterir Olumsuz nüfusu temsil eder. Geleneksel olarak psikolojide, sonuçların genel tabloyu güvenilir bir şekilde yansıttığına inanılır. R 0,05'ten az (yani %5). Ancak bu yalnızca olasılıksal bir ifadedir ve kesinlikle koşulsuz bir garanti değildir. Bazı durumlarda bu sonuç doğru olmayabilir. Aslında anlamlılık düzeyinin büyüklüğüne bakarsak bunun ne sıklıkta olabileceğini hesaplayabiliriz. 0,05 anlamlılık düzeyinde, sonuçların 100 katından 5'inin yanlış olması muhtemeldir. 11a ilk bakışta bu çok yaygın değil gibi görünüyor, ancak düşündüğünüzde 100 üzerinden 5 şans 20 üzerinden 1 ile aynı. Yani her 20 vakadan birinde sonuç şu olacak: yanlış. Bu tür olasılıklar özellikle olumlu görünmüyor ve araştırmacılar bu tür risklere girmekten kaçınmalıdır. Birinci türden hatalar. Bu, araştırmacıların gerçek sonuçlar bulduklarını düşündükleri halde aslında bulamadıkları zaman ortaya çıkan hatanın adıdır. Araştırmacıların bir sonuç bulamadıklarına inanmaları ama aslında bir sonuç olduğuna inanmalarından oluşan tam tersi hataya ne ad verilir? ikinci tip hatalar.

Bu hatalar, yapılan istatistiksel analizin göz ardı edilememesi nedeniyle ortaya çıkar. Hata olasılığı, sonuçların istatistiksel anlamlılık düzeyine bağlıdır. Bir sonucun doğru sayılması için anlamlılık düzeyinin 0,05'in altında olması gerektiğini daha önce belirtmiştik. Elbette bazı sonuçlar daha düşük düzeydedir ve 0,001 kadar düşük sonuçlar bulmak alışılmadık bir durum değildir (0,001 değeri, sonuçların yanlış olma ihtimalinin 1000'de 1 olduğunu gösterir). P değeri ne kadar küçük olursa sonuçların doğruluğuna olan güvenimiz o kadar güçlü olur.

Tabloda Şekil 7.2, istatistiksel çıkarım olasılığına ilişkin anlamlılık düzeylerinin geleneksel yorumunu ve bir ilişkinin (farklılıkların) varlığına ilişkin kararın gerekçesini göstermektedir.

Tablo 7.2

Psikolojide kullanılan anlamlılık düzeylerinin geleneksel yorumu

Pratik araştırma deneyimine dayanarak, şu şekilde tavsiye edilir: birinci ve ikinci türdeki hatalardan mümkün olduğunca kaçınmak için, önemli sonuçlar çıkarırken, seviyelere odaklanarak farklılıkların (bağlantıların) varlığı hakkında kararlar alınmalıdır. R n işareti.

İstatistiksel test(İstatistiksel Test - istatistiksel anlamlılık düzeyini belirlemek için bir araçtır. Bu, yüksek olasılıkla doğru bir hipotezin kabul edilmesini, yanlış bir hipotezin ise reddedilmesini sağlayan belirleyici bir kuraldır.

İstatistiksel kriterler aynı zamanda belirli bir sayıyı ve sayının kendisini hesaplama yöntemini de belirtir. Tüm kriterler tek bir amaç için kullanılır: belirlemek önem düzeyi analiz ettikleri veriler (yani verilerin, numunenin alındığı popülasyonu doğru şekilde temsil eden gerçek bir etkiyi yansıtma olasılığı).

Bazı testler yalnızca normal olarak dağıtılan veriler için kullanılabilir (ve özellik aralık ölçeğinde ölçülüyorsa) - bu testlere genellikle denir. parametrik. Diğer kriterleri kullanarak verileri hemen hemen her dağıtım yasasıyla analiz edebilirsiniz - bunlara denir parametrik olmayan.

Parametrik kriterler, hesaplama formülünde dağılım parametrelerini içeren kriterlerdir; ortalamalar ve varyanslar (Student's t-testi, Fisher's F-testi, vb.).

Parametrik olmayan kriterler, dağılım parametrelerinin hesaplanmasına ilişkin formülde dağılım parametrelerini içermeyen ve frekanslar veya sıralar (kriter) ile çalışmaya dayalı kriterlerdir. Q Rosenbaum kriteri sen Manna-Whitney

Örneğin, farklılıkların anlamlılığının Öğrenci t-testi ile belirlendiğini söylediğimizde, ampirik değeri hesaplamak için Öğrenci t-testi yönteminin kullanıldığını ve bu değerin daha sonra tablodaki (kritik) değerle karşılaştırıldığını kastediyoruz.

Kriterin ampirik (bizim tarafımızdan hesaplanan) ve kritik değerlerinin (tablo) oranına göre hipotezimizin doğrulanıp doğrulanmadığına karar verebiliriz. Çoğu durumda, farklılıkları anlamlı olarak tanıyabilmemiz için, kriterin ampirik değerinin kritik değeri aşması gerekir, ancak bazı kriterler (örneğin, Mann-Whitney testi veya işaret testi) vardır. tam tersi kurala uymalıyız.

Bazı durumlarda, kritere ilişkin hesaplama formülü, incelenen örnekteki gözlem sayısını içerir; bu sayı şu şekilde gösterilir: P. Özel bir tablo kullanarak, belirli bir ampirik değerin farklılıkların hangi istatistiksel anlamlılık düzeyine karşılık geldiğini belirleriz. Çoğu durumda, kriterin aynı ampirik değeri, incelenen örnekteki gözlem sayısına bağlı olarak önemli veya önemsiz olabilir ( N ) veya sözde serbestlik derecesi sayısı , olarak gösterilir v (g>) veya nasıl df (Bazen D).

bilmek N veya serbestlik derecesi sayısı, özel tablolar (ana tablolar Ek 5'te verilmiştir) kullanarak kriterin kritik değerlerini belirleyebilir ve elde edilen ampirik değeri onlarla karşılaştırabiliriz. Bu genellikle şu şekilde yazılır: “ne zaman n = Kriterin 22 kritik değeri tst = 2,07" veya "de v (D) = Öğrenci testinin 2 kritik değeri = 4,30” vb.

Tipik olarak, tercih hala parametrik kriterlere verilmektedir ve biz de bu pozisyona bağlı kalıyoruz. Daha güvenilir oldukları kabul edilir ve daha fazla bilgi ve daha derin analiz sağlayabilirler. Matematiksel hesaplamaların karmaşıklığına gelince, bilgisayar programları kullanıldığında bu karmaşıklık ortadan kalkar (ancak bazılarının üstesinden gelinebilir gibi görünür).

  • Bu ders kitabında istatistik sorununu ayrıntılı olarak ele almıyoruz.
  • hipotezler (boş - R0 ve alternatif - Hj) ve yapılan istatistiksel kararlar, çünkü psikoloji öğrencileri bunu "Psikolojide matematiksel yöntemler" disiplininde ayrı olarak inceliyorlar. Ayrıca bir araştırma raporu hazırlarken (ders veya diploma çalışması, yayın), istatistiksel hipotezlerin ve istatistiksel çözümlerin kural olarak verilmediğine dikkat edilmelidir. Genellikle, sonuçları açıklarken kriter belirtilir, gerekli tanımlayıcı istatistikler (ortalamalar, sigma, korelasyon katsayıları vb.), Kriterlerin ampirik değerleri, serbestlik dereceleri ve mutlaka p anlamlılık düzeyi verilir. . Daha sonra, test edilen hipotezle ilgili olarak, ulaşılan veya ulaşılamayan önem düzeyini gösteren (genellikle eşitsizlik biçiminde) anlamlı bir sonuç formüle edilir.

İSTATİSTİKSEL GÜVENİLİRLİK

- İngilizce güvenilirlik/geçerlilik, istatistiksel; Almanca Doğrulama, istatistik. İstatistiksel bir testte veya Q.l.'de tutarlılık, nesnellik ve belirsizlik eksikliği. ölçüm seti. D. s. aynı sonuçların elde edilip edilmediğini görmek için aynı testin (veya anketin) aynı denek üzerinde tekrarlanmasıyla test edilebilir; veya aynı nesneyi ölçmesi gereken bir testin farklı bölümlerini karşılaştırarak.

Antinazi. Sosyoloji Ansiklopedisi, 2009

Diğer sözlüklerde “İSTATİSTİKSEL GÜVENİLİRLİK” in ne olduğuna bakın:

    İSTATİSTİKSEL GÜVENİLİRLİK- İngilizce güvenilirlik/geçerlilik, istatistiksel; Almanca Doğrulama, istatistik. İstatistiksel bir testte veya Q.l.'de tutarlılık, nesnellik ve belirsizlik eksikliği. ölçüm seti. D. s. aynı testi tekrarlayarak doğrulanabilir (veya... Açıklayıcı Sosyoloji Sözlüğü

    İstatistikte bir değerin tesadüfen ortaya çıkma olasılığı veya daha uç değerlerin düşük olması durumunda istatistiksel olarak anlamlı denir. Burada aşırı noktayla, test istatistiklerinin sıfır hipotezinden sapma derecesini kastediyoruz. Farkın adı... ...Wikipedia

    İstatistiksel kararlılığın fiziksel olgusu, örneklem büyüklüğü arttıkça rastgele bir olayın sıklığının veya bir fiziksel miktarın ortalama değerinin belirli bir sabit sayıya yönelmesidir. İstatistik olgusu... ... Vikipedi

    FARKLILIKLARIN GÜVENİLİRLİĞİ (Benzerlikler)- incelenen göstergelere (değişkenlere) göre örnekler arasındaki farklılıkların veya benzerliklerin önem düzeyini belirlemek için analitik istatistiksel prosedür ... Modern eğitim süreci: temel kavramlar ve terimler

    RAPORLAMA, İSTATİSTİK Büyük Muhasebe Sözlüğü

    RAPORLAMA, İSTATİSTİK- İlgili makamların işletmelerden (kuruluşlar ve kurumlar) ihtiyaç duydukları bilgileri yasal olarak oluşturulmuş raporlama belgeleri (istatistiksel raporlar) biçiminde aldıkları bir tür devlet istatistiksel gözlemi... Büyük ekonomi sözlüğü

    İnsanın sosyal yaşamındaki kitlesel olayların sistematik olarak gözlemlenmesi, bunların sayısal tanımlarının derlenmesi ve bu tanımların bilimsel olarak işlenmesi yöntemlerini inceleyen bir bilim. Dolayısıyla teorik istatistik bir bilimdir... ... Ansiklopedik Sözlük F.A. Brockhaus ve I.A. Efron

    Korelasyon katsayısı- (Korelasyon katsayısı) Korelasyon katsayısı, iki rastgele değişkenin bağımlılığının istatistiksel bir göstergesidir. Korelasyon katsayısının tanımı, korelasyon katsayılarının türleri, korelasyon katsayısının özellikleri, hesaplanması ve uygulanması... ... Yatırımcı Ansiklopedisi

    İstatistikler- (İstatistik) İstatistik, olgu ve süreçlerdeki niceliksel değişiklikleri inceleyen genel bir teorik bilimdir. Devlet istatistikleri, istatistiksel hizmetler, Rosstat (Goskomstat), istatistiksel veriler, sorgu istatistikleri, satış istatistikleri,... ... Yatırımcı Ansiklopedisi

    Korelasyon- (Korelasyon) Korelasyon, iki veya daha fazla rastgele değişken arasındaki istatistiksel ilişkidir. Korelasyon kavramı, korelasyon türleri, korelasyon katsayısı, korelasyon analizi, fiyat korelasyonu, Forex İçeriklerindeki döviz çiftlerinin korelasyonu... ... Yatırımcı Ansiklopedisi

Kitaplar

  • Araştırmada matematik ve matematik araştırması: Öğrenci araştırma faaliyetlerine ilişkin metodolojik koleksiyon, Borzenko V.I.. Koleksiyon, öğrenci araştırma faaliyetlerinin düzenlenmesinde uygulanabilir metodolojik gelişmeleri sunmaktadır. Koleksiyonun ilk bölümü araştırma yaklaşımının uygulanmasına ayrılmıştır...

Eğer harekete geçmezsen koğuşun hiçbir faydası olmayacak. (Şota Rustaveli)

Tıbbi istatistiğin temel terim ve kavramları

Bu makalede tıbbi araştırma yürütürken önemli olan bazı temel istatistiksel kavramları sunacağız. Terimler ilgili makalelerde daha ayrıntılı olarak ele alınmaktadır.

Varyasyon

Tanım. Değer aralığı boyunca verilerin (öznitelik değerleri) dağılım derecesi

Olasılık

Tanım. Olasılık, belirli bir olayın belirli koşullar altında meydana gelme olasılığının derecesidir.

Örnek. "Arimidex ilacını kullanırken iyileşme olasılığı %70'dir" cümlesindeki terimin tanımını açıklayalım. Olay “hastanın iyileşmesi”, “hastanın Arimidex alması” durumudur, olasılık derecesi %70'tir (kabaca konuşursak, Arimidex alan 100 kişiden 70'i iyileşir).

Kümülatif olasılık

Tanım. T zamanında hayatta kalmanın Kümülatif Olasılığı, o sırada hayatta olan hastaların oranıyla aynıdır.

Örnek. Beş yıllık bir tedaviden sonra kümülatif hayatta kalma olasılığının 0,7 olduğu söylenirse, bu, söz konusu hasta grubunun ilk sayısının% 70'inin hayatta kaldığı ve% 30'unun öldüğü anlamına gelir. Yani her yüz kişiden 30'u ilk 5 yıl içinde öldü.

Olaydan önceki zaman

Tanım. Bir olaydan önceki zaman, bazı birimlerle ifade edilen, zamanın herhangi bir başlangıç ​​noktasından bir olayın meydana gelmesine kadar geçen zamandır.

Açıklama. Tıbbi araştırmalarda zaman birimleri gün, ay ve yıldır.

Başlangıç ​​zamanlarına tipik örnekler:

    hastayı izlemeye başlayın

    cerrahi tedavi

Ele alınan olayların tipik örnekleri:

    hastalığın ilerlemesi

    nüksetme meydana gelmesi

    hasta ölümü

Örnek

Tanım. Bir popülasyonun seçilim yoluyla elde edilen kısmı.

Numune analizinin sonuçlarına dayanarak, tüm popülasyon hakkında, yalnızca seçimin rastgele olması durumunda geçerli olan sonuçlara varılır. Bir popülasyondan rastgele seçim yapmak neredeyse imkansız olduğundan, numunenin en azından popülasyonu temsil etmesini sağlamak için çaba gösterilmelidir.

Bağımlı ve bağımsız örnekler

Tanım.Çalışma deneklerinin birbirinden bağımsız olarak alındığı örnekler. Bağımsız örneklere bir alternatif, bağımlı (bağlı, eşleştirilmiş) örneklerdir.

Hipotez

İki taraflı ve tek taraflı hipotezler

Öncelikle hipotez teriminin istatistikteki kullanımını açıklayalım.

Çoğu araştırmanın amacı bazı ifadelerin doğruluğunu test etmektir. İlaç testinin amacı çoğunlukla bir ilacın diğerinden daha etkili olduğu hipotezini test etmektir (örneğin Arimidex, Tamoksifen'den daha etkilidir).

Çalışmanın titizliğini sağlamak için doğrulanan ifade matematiksel olarak ifade edilir. Örneğin, Arimidex alan bir hastanın yaşayacağı yıl sayısı A ise ve Tamoksifen alan bir hastanın yaşayacağı yıl sayısı T ise, test edilen hipotez A>T olarak yazılabilir.

Tanım. Bir hipotez, iki miktarın eşitliğinden oluşuyorsa iki taraflı olarak adlandırılır.

İki taraflı hipotez örneği: A=T.

Tanım. Bir hipotez, iki miktarın eşitsizliğinden oluşuyorsa, tek taraflı (1 taraflı) olarak adlandırılır.

Tek taraflı hipotez örnekleri:

İkili (ikili) veriler

Tanım. Yalnızca iki geçerli alternatif değerle ifade edilen veriler

Örnek: Hasta “sağlıklı” - “hasta”. Ödem “vardır” - “hayır”.

Güven aralığı

Tanım. Bir miktar için güven aralığı, o miktarın gerçek değerinin (belirli bir güven düzeyi ile) yer aldığı miktarın değeri etrafındaki aralıktır.

Örnek. İncelenen miktar yıllık hasta sayısı olsun. Ortalama olarak sayıları 500'dür ve %95 güven aralığı (350, 900)'dir. Bu, büyük olasılıkla (%95 olasılıkla) yıl içinde en az 350, en fazla 900 kişinin kliniğe başvuracağı anlamına geliyor.

Tanım. Çok yaygın olarak kullanılan bir kısaltma şudur: CI %95, %95 güven düzeyine sahip bir güven aralığıdır.

Güvenilirlik, istatistiksel anlamlılık (P - düzeyi)

Tanım. Bir sonucun istatistiksel anlamlılığı, onun “doğruluğuna” duyulan güvenin bir ölçüsüdür.

Herhangi bir araştırma, nesnelerin yalnızca bir kısmı temel alınarak gerçekleştirilir. İlacın etkinliğine ilişkin bir çalışma, gezegendeki tüm hastalar temelinde değil, yalnızca belirli bir hasta grubu üzerinde gerçekleştirilmektedir (tüm hastalar temelinde bir analiz yapmak kesinlikle imkansızdır).

Analiz sonucunda belli bir sonuca varıldığını varsayalım (örneğin Arimidex'in yeterli tedavi olarak kullanılması Tamoksifen'den 2 kat daha etkilidir).

Sorulması gereken soru şu: “Bu sonuca ne kadar güvenebilirsiniz?”

Sadece iki hasta üzerinden bir çalışma yaptığımızı düşünün. Tabii ki, bu durumda sonuçlara dikkatle yaklaşılmalıdır. Çok sayıda hasta incelendiyse ("büyük sayının" sayısal değeri duruma bağlıdır), o zaman çıkarılan sonuçlara zaten güvenilebilir.

Yani güvenin derecesi p-seviyesi değeri (p-değeri) ile belirlenir.

Daha yüksek bir p düzeyi, örnek analizinden elde edilen sonuçlara ilişkin daha düşük bir güven düzeyine karşılık gelir. Örneğin, 0,05'e (%5) eşit bir p düzeyi, belirli bir grubun analizinden elde edilen sonucun, yalnızca %5 olasılıkla bu nesnelerin yalnızca rastgele bir özelliği olduğunu gösterir.

Başka bir deyişle, çok yüksek bir olasılıkla (%95) sonuç tüm nesnelere genişletilebilir.

Birçok çalışma %5'i kabul edilebilir bir p düzeyi değeri olarak kabul etmektedir. Bu, örneğin p = 0,01 ise sonuçlara güvenilebileceği, ancak p = 0,06 ise güvenilemeyeceği anlamına gelir.

Çalışmak

Prospektif çalışmaÖrneklerin bir başlangıç ​​faktörüne göre seçildiği ve sonuçta ortaya çıkan bazı faktörlerin örneklerde analiz edildiği bir çalışmadır.

Retrospektif çalışmaÖrneklerin sonuçtaki bir faktöre göre seçildiği ve örneklerde bazı başlangıç ​​faktörlerinin analiz edildiği bir çalışmadır.

Örnek. Başlangıç ​​faktörü 20 yaş üstü/genç hamile bir kadındır. Sonuçta ortaya çıkan faktör, çocuğun 2,5 kg'dan daha hafif/ağır olmasıdır. Çocuğun ağırlığının annenin yaşına bağlı olup olmadığını analiz ediyoruz.

Biri 20 yaşın altındaki annelerden, diğeri daha yaşlı annelerden olmak üzere 2 örnek alır ve her gruptaki çocuk kitlesini analiz edersek bu ileriye dönük bir çalışma olur.

Birinde 2,5 kg'dan hafif çocuk doğuran anneler, diğerinde ise daha ağır 2 örnek alırsak ve sonra her gruptaki annelerin yaşını analiz edersek, bu geriye dönük bir çalışmadır (doğal olarak böyle bir çalışma) yalnızca deney tamamlandığında gerçekleştirilebilir, yani tüm çocuklar doğmuştur).

Çıkış

Tanım. Araştırmacının ilgisini çeken klinik açıdan önemli bir olgu, laboratuvar göstergesi veya işareti. Klinik araştırmalar yürütülürken sonuçlar, terapötik veya önleyici müdahalenin etkinliğini değerlendirmede kriter görevi görür.

Klinik epidemiyoloji

Tanım. Tahminlerin doğruluğunu sağlamak için hastaları incelerken katı bilimsel yöntemler kullanarak benzer vakalarda hastalığın klinik seyrini incelemeye dayalı olarak her bir hasta için belirli bir sonucu tahmin etmeyi mümkün kılan bilim.

Kohort

Tanım. Oluşumu sırasında bazı ortak özelliklerle birleşen ve uzun bir süre boyunca çalışılan bir grup çalışma katılımcısı.

Kontrol

Tarihsel kontrol

Tanım.Çalışmadan önceki dönemde bir kontrol grubu oluşturuldu ve incelendi.

Paralel kontrol

Tanım. Ana grubun oluşumuyla eş zamanlı olarak bir kontrol grubu oluşturuldu.

Korelasyon

Tanım.İki özellik arasındaki (niceliksel veya sıralı) istatistiksel ilişki olup, vakaların belirli bir bölümünde bir özelliğin daha büyük değerinin, diğer özelliğin daha büyük bir değerine (pozitif (doğrudan) korelasyon durumunda) veya daha küçük bir değere karşılık geldiğini gösterir. değer - negatif (ters) korelasyon durumunda.

Örnek. Hastanın kanındaki trombosit ve lökosit düzeyleri arasında anlamlı bir korelasyon bulundu. Korelasyon katsayısı 0,76'dır.

Risk katsayısı (RR)

Tanım. Risk oranı, birinci grup nesneler için bazı (“kötü”) olayların meydana gelme olasılığının, aynı olayın ikinci grup nesneler için meydana gelme olasılığına oranıdır.

Örnek. Sigara içmeyenlerde akciğer kanserine yakalanma olasılığı% 20 ve sigara içenlerde -% 100 ise, CR beşte bire eşit olacaktır. Bu örnekte, ilk gruptaki nesneler sigara içmeyenler, ikinci grup ise sigara içenlerdir ve akciğer kanserinin ortaya çıkması “kötü” bir olay olarak değerlendirilmektedir.

Şu açıktır:

1) KR = 1 ise, bir olayın gruplar halinde meydana gelme olasılığı aynıdır

2) KP>1 ise, olay birinci gruptaki nesnelerde ikinci gruba göre daha sık meydana gelir

3) eğer KR ise<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analiz

Tanım. İLE Aynı sorunu araştıran çeşitli çalışmaların sonuçlarını özetleyen istatistiksel analiz (genellikle tedavinin etkinliği, önleme, teşhis yöntemleri). Havuzlama çalışmaları, analiz için daha büyük bir örnek ve birleştirilmiş çalışmalar için daha büyük istatistiksel güç sağlar. Çalışılan yöntemin etkinliğine ilişkin bir sonuca ilişkin kanıtları veya güveni artırmak için kullanılır.

Kaplan-Meier yöntemi (Kaplan-Meier çarpan tahminleri)

Bu yöntem istatistikçiler E.L. Kaplan ve Paul Meyer tarafından icat edildi.

Yöntem, bir hastanın gözlem süresiyle ilişkili çeşitli miktarları hesaplamak için kullanılır. Bu miktarlara örnekler:

    ilacı kullanırken bir yıl içinde iyileşme olasılığı

    Ameliyattan sonraki üç yıl içinde ameliyattan sonra nüksetme olasılığı

    Organ ampütasyonunu takiben prostat kanseri olan hastalarda beş yılda kümülatif hayatta kalma olasılığı

Kaplan-Meier yöntemini kullanmanın avantajlarını açıklayalım.

“Geleneksel” analizdeki (Kaplan-Meier yöntemini kullanmayan) değerlerin değerleri, söz konusu zaman aralığının aralıklara bölünmesiyle hesaplanır.

Örneğin bir hastanın 5 yıl içinde ölme ihtimalini araştırıyorsak bu zaman aralığını 5 parçaya bölebiliriz (1 yıldan az, 1-2 yıl, 2-3 yıl, 3-4 yıl, 4-4 yıl). 5 yıl), yani 10 (her biri altı ay) veya başka sayıda aralıklarla. Farklı bölümlerin sonuçları farklı olacaktır.

En uygun bölümü seçmek kolay bir iş değildir.

Kaplan-Meier yöntemi kullanılarak elde edilen değerlerin tahminleri, gözlem süresinin aralıklara bölünmesine bağlı değildir, yalnızca her bir hastanın yaşam süresine bağlıdır.

Bu nedenle araştırmacının analizi gerçekleştirmesi daha kolaydır ve sonuçlar çoğu zaman “geleneksel” analiz sonuçlarından daha iyidir.

Kaplan-Meier eğrisi, Kaplan-Meier yöntemi kullanılarak elde edilen hayatta kalma eğrisinin bir grafiğidir.

Cox'un modeli

Bu model, 300'den fazla makale ve kitabın yazarı olan ünlü İngiliz istatistikçi Sir David Roxby Cox (d. 1924) tarafından icat edildi.

Cox modeli, hayatta kalma analizinde incelenen niceliklerin zamanın fonksiyonlarına bağlı olduğu durumlarda kullanılır. Örneğin, t yıl sonra tekrarlama olasılığı (t=1,2,...) log(t) zamanının logaritmasına bağlı olabilir.

Cox tarafından önerilen yöntemin önemli bir avantajı, bu yöntemin çok sayıda duruma uygulanabilir olmasıdır (model, olasılık dağılımının doğası veya şekli üzerinde katı kısıtlamalar getirmez).

Cox modeline dayanarak, sonucu risk katsayısının değeri ve risk katsayısı için güven aralığı olan bir analiz yapılabilir (Cox analizi denir).

Parametrik olmayan istatistiksel yöntemler

Tanım. Nitel verilerin analizinin yanı sıra, öncelikle normal dağılım oluşturmayan niceliksel verilerin analizi için kullanılan bir istatistiksel yöntemler sınıfı.

Örnek. Tedavi türüne bağlı olarak hastaların sistolik basıncındaki farklılıkların önemini belirlemek için parametrik olmayan Mann-Whitney testini kullanacağız.

İşaret (değişken)

Tanım. Xçalışma nesnesinin özellikleri (gözlem). Niteliksel ve niceliksel özellikler vardır.

Rastgeleleştirme

Tanım. Araştırma nesnelerini özel araçlar (tablolar veya rastgele sayı sayacı, yazı tura atma ve dahil edilen bir gözleme rastgele bir grup numarası atamanın diğer yöntemleri) kullanarak ana ve kontrol gruplarına rastgele dağıtma yöntemi. Rastgeleleştirme, üzerinde çalışılan sonucu potansiyel olarak etkileyen bilinen ve bilinmeyen özellikler açısından gruplar arasındaki farklılıkları en aza indirir.

Risk

Nitelikli- Çalışma konusunda belirli bir özelliğin (risk faktörünün) varlığı nedeniyle olumsuz bir sonucun (örneğin hastalık) ek riski. Bu, bir hastalığın gelişme riskinin risk faktörüyle ilişkili, onunla açıklanabilen ve risk faktörü ortadan kaldırıldığında ortadan kaldırılabilen kısmıdır.

Göreceli risk- bir gruptaki olumsuz durum riskinin başka bir gruptaki bu durum riskine oranı. Grupların önceden oluşturulduğu ve incelenen durumun henüz ortaya çıkmadığı ileriye dönük ve gözlemsel çalışmalarda kullanılır.

Devamlı sınav

Tanım. Gözlemleri sırayla kaldırarak ve modeli yeniden hesaplayarak istatistiksel bir modelin kararlılığını, güvenilirliğini, performansını (geçerliliğini) kontrol etmeye yönelik bir yöntem. Ortaya çıkan modeller ne kadar benzer olursa, model o kadar kararlı ve güvenilir olur.

Etkinlik

Tanım. Bir komplikasyonun ortaya çıkması, nüksetme, iyileşme veya ölüm gibi çalışmada gözlemlenen klinik sonuç.

tabakalaşma

Tanım. M Bir çalışmaya dahil edilme kriterlerini karşılayan tüm katılımcıların popülasyonunun, öncelikle ilgilenilen sonucu potansiyel olarak etkileyen bir veya daha fazla özelliğe (genellikle cinsiyet, yaş) dayalı olarak gruplara (tabakalara) bölündüğü ve ardından bunların her birinden oluşan bir örnekleme tekniği. bu grupların (tabaka) katılımcıları bağımsız olarak deney ve kontrol gruplarına alınır. Bu, araştırmacının deney ve kontrol grupları arasındaki önemli özellikleri dengelemesine olanak tanır.

Acil durum tablosu

Tanım. Sütunları bir özelliğin değerlerine ve satırları başka bir özelliğin değerlerine (iki boyutlu bir beklenmedik durum tablosu durumunda) karşılık gelen gözlemlerin mutlak frekansları (sayıları) tablosu. Mutlak frekans değerleri satır ve sütunların kesişimindeki hücrelerde bulunur.

Bir acil durum tablosu örneği verelim. 194 hastaya anevrizma ameliyatı yapıldı. Ameliyat öncesinde hastalardaki ödemin şiddeti bilinmektedir.

Ödem\ Sonuç

şişlik yok 20 6 26
orta derecede şişlik 27 15 42
belirgin ödem 8 21 29
mj 55 42 194

Böylece ödemi olmayan 26 hastadan 20'si ameliyat sonrası hayatta kaldı, 6'sı ise hayatını kaybetti. Orta derecede ödemi olan 42 hastadan 27'si hayatta kaldı, 15'i öldü vb.

Olasılık tabloları için ki-kare testi

Bir işaretteki diğerine bağlı farklılıkların önemini (güvenilirliğini) belirlemek için (örneğin, ödemin ciddiyetine bağlı olarak bir ameliyatın sonucu), beklenmedik durum tablolarında ki-kare testi kullanılır:


Şans

Bir olayın olasılığı p'ye eşit olsun. O halde olayın gerçekleşmeme olasılığı 1-p'dir.

Örneğin bir hastanın beş yıl sonra hayatta kalma olasılığı 0,8 (%80) ise bu süre içinde ölme olasılığı 0,2 (%20) olur.

Tanım.Şans, bir olayın gerçekleşme olasılığının, o olayın gerçekleşmeme olasılığına oranıdır.

Örnek. Örneğimizde (bir hasta hakkında), 0,8/0,2=4 olduğundan şans 4'tür.

Yani iyileşme ihtimali ölüm ihtimalinden 4 kat daha fazladır.

Bir miktarın değerinin yorumlanması.

1) Şans=1 ise, bir olayın gerçekleşme olasılığı, gerçekleşmeme olasılığına eşittir;

2) Şans >1 ise, olayın gerçekleşme olasılığı, olayın gerçekleşmeme olasılığından daha yüksektir;

3) Şans varsa<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Oran oranı

Tanım. Olasılık oranı, birinci nesne grubu için ikinci nesne grubu için olasılık oranıdır.

Örnek. Hem erkeklerin hem de kadınların bir takım tedavilerden geçtiğini varsayalım.

Bir erkek hastanın beş yıl sonra hayatta kalma olasılığı 0,6 (%60); bu süre zarfında ölme olasılığı 0,4 (%40)'tür.

Kadınlar için benzer olasılıklar 0,8 ve 0,2'dir.

Bu örnekteki olasılık oranı

Bir miktarın değerinin yorumlanması.

1) Oran oranı = 1 ise birinci grubun şansı ikinci grubun şansına eşittir

2) Eğer odds oranı >1 ise birinci grubun şansı ikinci grubun şansından daha yüksektir

3) Oran oranı ise<1, то шанс для первой группы меньше шанса для второй группы

İstatistiksel yöntemlerin tıpta uygulanmasına ilişkin tipik bir örneği ele alalım. İlacın yaratıcıları, alınan dozla orantılı olarak diürezi arttırdığını öne sürüyor. Bu hipotezi test etmek için beş gönüllüye ilacın farklı dozlarını verdiler.

Gözlem sonuçlarına dayanarak, diürezin doza karşı grafiği çizilir (Şekil 1.2A). Bağımlılık çıplak gözle görülebilir. Araştırmacılar keşiften dolayı birbirlerini, yeni idrar söktürücüden dolayı da dünyayı tebrik ediyor.

Aslında veriler, yalnızca bu beş gönüllüde doza bağlı bir diürezin gözlemlendiğini güvenilir bir şekilde belirtmemize izin veriyor. Bu bağımlılığın ilacı alan her insanda kendini göstereceği gerçeği bir varsayımdan öteye gidememektedir.
ZY

İle

hayat Bunun asılsız olduğu söylenemez - aksi takdirde neden deneyler yapasınız ki?

Ancak ilaç satışa çıktı. Giderek daha fazla insan idrar çıkışını artırmak umuduyla bu ilacı kullanıyor. Peki ne görüyoruz? İlacın dozu ile diürez arasında herhangi bir bağlantının olmadığını gösteren Şekil 1.2B'yi görüyoruz. Siyah daireler orijinal çalışmadan elde edilen verileri gösterir. İstatistiklerin, böylesine "temsilci olmayan" ve aslında kafa karıştırıcı bir örnek elde etme olasılığını tahmin etmemize olanak tanıyan yöntemleri vardır. Diürez ile ilacın dozu arasında bir bağlantı olmadığında ortaya çıkan "bağımlılığın" yaklaşık 1000 deneyden 5'inde gözlemleneceği ortaya çıktı. Yani bu durumda araştırmacılar kesinlikle şanssızdı. En gelişmiş istatistiksel yöntemleri kullansalardı bile bu onların hata yapmasını engellemezdi.

Biz bu hayali ama gerçeklikten hiç de uzak olmayan örneği, gereksizliğine dikkat çekmemek için verdik.
istatistiklerin varlığı. Başka bir şeyden, vardığı sonuçların olasılıksal doğasından bahsediyor. İstatistiksel yöntemin uygulanmasının bir sonucu olarak, nihai gerçeği elde etmeyiz, yalnızca belirli bir varsayımın olasılığına ilişkin bir tahmin elde ederiz. Ayrıca her istatistiksel yöntem kendi matematiksel modelini temel alır ve sonuçları bu modelin gerçeğe uygun olduğu ölçüde doğrudur.

GÜVENİLİRLİK VE İSTATİSTİKSEL ÖNEM hakkında daha fazla bilgi:

  1. Yaşam kalitesi göstergelerinde istatistiksel olarak anlamlı farklılıklar
  2. İstatistiksel nüfus. Muhasebe özellikleri. Sürekli ve seçici araştırma kavramı. İstatistiksel veriler ve muhasebe ve raporlama belgelerinin kullanımına ilişkin gereklilikler
  3. SOYUT. GÖZ KAPAĞI İLE GÖZ İÇİ BASINCINI ÖLÇMEK İÇİN TONOMETRE ENDİKASYONLARININ GÜVENİLİRLİĞİNİN ÇALIŞMASI 2018, 2018

Değişkenler arasındaki herhangi bir ilişkinin temel özellikleri.

Değişkenler arasındaki ilişkinin en basit iki özelliğine dikkat çekebiliriz: (a) ilişkinin büyüklüğü ve (b) ilişkinin güvenilirliği.

- Büyüklük . Bağımlılığın büyüklüğünün anlaşılması ve ölçülmesi güvenilirlikten daha kolaydır. Örneğin örneklemdeki herhangi bir erkeğin beyaz kan hücresi sayısı (WCC) değeri herhangi bir kadından yüksekse bu durumda iki değişken (Cinsiyet ve WCC) arasındaki ilişkinin çok yüksek olduğunu söyleyebilirsiniz. Başka bir deyişle, bir değişkenin değerlerini diğerinin değerlerinden tahmin edebilirsiniz.

- Güvenilirlik ("gerçek"). Karşılıklı bağımlılığın güvenilirliği, bağımlılığın büyüklüğünden daha az sezgisel bir kavramdır ancak son derece önemlidir. İlişkinin güvenilirliği, sonuçların çıkarıldığı belirli bir örneklemin temsil edilebilirliğiyle doğrudan ilgilidir. Başka bir deyişle güvenilirlik, aynı popülasyondan alınan başka bir örneklemden alınan veriler kullanılarak bir ilişkinin yeniden keşfedilme (başka bir deyişle doğrulanma) olasılığının ne kadar yüksek olduğunu ifade eder.

Nihai hedefin bu özel değer örneğini neredeyse hiçbir zaman incelememek olduğu unutulmamalıdır; Bir örnek yalnızca tüm popülasyon hakkında bilgi sağladığı ölçüde ilgi çekicidir. Çalışma belirli belirli kriterleri karşılıyorsa, örnek değişkenler arasında bulunan ilişkilerin güvenilirliği standart bir istatistiksel ölçüm kullanılarak ölçülebilir ve sunulabilir.

Bağımlılığın büyüklüğü ve güvenilirliği, değişkenler arasındaki bağımlılığın iki farklı özelliğini temsil eder. Ancak tamamen bağımsız oldukları söylenemez. Normal büyüklükteki bir örneklemde değişkenler arasındaki ilişkinin (bağlantının) büyüklüğü ne kadar büyük olursa, o kadar güvenilir olur (bir sonraki bölüme bakın).

Bir sonucun istatistiksel anlamlılığı (p-seviyesi), onun "doğruluğuna" ("örneklemin temsil edilebilirliği" anlamında) olan güvenin tahmini bir ölçüsüdür. Daha teknik konuşursak, p düzeyi, sonucun güvenilirliğine göre azalan büyüklük sırasına göre değişen bir ölçüdür. Daha yüksek bir p düzeyi, örneklemde bulunan değişkenler arasındaki ilişkiye ilişkin daha düşük bir güven düzeyine karşılık gelir. Yani p düzeyi, gözlemlenen sonucun tüm popülasyona dağılımıyla ilişkili hata olasılığını temsil eder.

Örneğin, p düzeyi = 0,05(yani 1/20), numunede bulunan değişkenler arasındaki ilişkinin numunenin sadece rastgele bir özelliği olma ihtimalinin %5 olduğunu belirtir. Pek çok çalışmada, hata düzeyi için 0,05'lik p düzeyi "kabul edilebilir marj" olarak kabul edilir.

Hangi önem düzeyinin gerçekten "önemli" olarak değerlendirilmesi gerektiğine karar verirken keyfilikten kaçınmanın bir yolu yoktur. Üzerinde sonuçların yanlış olarak reddedildiği belirli bir anlamlılık düzeyinin seçimi oldukça keyfidir.



Uygulamada, nihai karar genellikle sonucun önceden mi tahmin edildiğine (yani deney gerçekleştirilmeden önce) veya çeşitli veriler üzerinde ve aynı zamanda çeşitli veriler üzerinde gerçekleştirilen birçok analiz ve karşılaştırmanın sonucu olarak sonradan mı keşfedildiğine bağlıdır. çalışma alanının geleneği.

Genel olarak birçok alanda p=0,05'lik bir sonuç, istatistiksel anlamlılık açısından kabul edilebilir bir sınır değeridir, ancak bu seviyenin hala oldukça büyük bir hata payı (%5) içerdiğini unutmayın.

p=0,01 düzeyindeki anlamlı sonuçlar genellikle istatistiksel olarak anlamlı kabul edilirken, p=0,005 veya p<000 düzeyindeki sonuçlar genellikle istatistiksel açıdan anlamlı kabul edilir. 001 oldukça anlamlıdır. Ancak, önem düzeylerine ilişkin bu sınıflandırmanın oldukça keyfi olduğu ve yalnızca pratik deneyimlere dayanarak kabul edilen resmi olmayan bir anlaşma olduğu anlaşılmalıdır. belirli bir çalışma alanında.

Toplanan verilerin toplamı üzerinde gerçekleştirilen analizlerin sayısı ne kadar fazla olursa, (seçilen düzeyde) önemli sonuçların da o kadar fazla sayıda tamamen şans eseri keşfedileceği açıktır.

Çok sayıda karşılaştırma içeren ve dolayısıyla bu tür hataların tekrarlanma ihtimali önemli olan bazı istatistiksel yöntemler, toplam karşılaştırma sayısı için özel bir ayarlama veya düzeltme yapar. Ancak birçok istatistiksel yöntem (özellikle basit keşfedici veri analizi yöntemleri) bu sorunu çözmenin herhangi bir yolunu sunmamaktadır.

Değişkenler arasındaki ilişki "nesnel olarak" zayıfsa, bu tür bir ilişkiyi test etmenin büyük bir örneklemi incelemek dışında başka yolu yoktur. Örneklem mükemmel bir şekilde temsil etse bile, örneklem küçükse etki istatistiksel olarak anlamlı olmayacaktır. Benzer şekilde, eğer bir ilişki “objektif olarak” çok güçlü ise, o zaman çok küçük bir örneklemde bile yüksek derecede anlamlılık tespit edilebilir.

Değişkenler arasındaki ilişki ne kadar zayıfsa, onu anlamlı bir şekilde tespit etmek için gereken örneklem boyutu da o kadar büyük olur.

Birçok farklı ilişki ölçüleri değişkenler arasındadır. Belirli bir çalışmada belirli bir ölçümün seçimi değişkenlerin sayısına, kullanılan ölçüm ölçeklerine, ilişkilerin doğasına vb. bağlıdır.

Ancak bu ölçümlerin çoğu genel bir prensibi takip eder: Gözlemlenen bir ilişkiyi, söz konusu değişkenler arasındaki "akla gelebilecek maksimum ilişki" ile karşılaştırarak tahmin etmeye çalışırlar. Teknik açıdan konuşursak, bu tür tahminler yapmanın olağan yolu, değişkenlerin değerlerinin nasıl değiştiğine bakmak ve ardından mevcut toplam varyasyonun ne kadarının, "ortak" ("ortak") varyasyonun varlığıyla açıklanabileceğini hesaplamaktır. iki (veya daha fazla) değişken.

Önem esas olarak örneklem büyüklüğüne bağlıdır. Daha önce açıklandığı gibi, çok büyük örneklemlerde değişkenler arasındaki çok zayıf ilişkiler bile anlamlı olurken, küçük örneklemlerde çok güçlü ilişkiler bile güvenilir değildir.

Bu nedenle, istatistiksel anlamlılık düzeyini belirlemek için, her örneklem büyüklüğü için değişkenler arasındaki ilişkinin "büyüklüğü" ve "anlamlılığı" arasındaki ilişkiyi temsil edecek bir fonksiyona ihtiyaç vardır.

Böyle bir fonksiyon tam olarak "popülasyonda böyle bir bağımlılığın olmadığı varsayılarak, belirli büyüklükteki bir örnekte belirli bir değere (veya daha fazlasına) bağımlılık elde etmenin ne kadar muhtemel olduğunu" gösterecektir. Başka bir deyişle, bu fonksiyon bir anlamlılık düzeyi verecektir.
(p-seviyesi) ve dolayısıyla popülasyonda bu bağımlılığın olmadığı varsayımını hatalı bir şekilde reddetme olasılığı.

Bu "alternatif" hipoteze (popülasyonda hiçbir ilişkinin bulunmadığına) genellikle denir. boş hipotez.

Hata olasılığını hesaplayan fonksiyonun doğrusal olması ve farklı örneklem büyüklükleri için yalnızca farklı eğimlere sahip olması ideal olacaktır. Ne yazık ki bu işlev çok daha karmaşıktır ve her zaman tam olarak aynı değildir. Ancak çoğu durumda formu bilinir ve belirli bir büyüklükteki numunelerle yapılan çalışmalarda anlamlılık seviyelerini belirlemek için kullanılabilir. Bu işlevlerin çoğu, adı verilen bir dağılım sınıfıyla ilişkilidir. normal .



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!