• Sunday June 16,2019

Masalah pengagregatan maklumat

Anonim

Dalam jawatan di bawah, saya menanam semula plot PCA HGDP yang anda mungkin lihat di sekeliling, kecuali saya menambah ibu bapa saya (dan beberapa populasi HapMap) ke dalam plot. PCA di bawah pada dasarnya adalah visualisasi dua dimensi bebas terbesar variasi genetik dalam set data. Ia tidak skala, kerana dimensi menegak Afrika dan non-Afrika menegaskan agak lebih besar daripada barat melintang berbanding dimensi timur dalam magnitud. Tetapi, saya berpendapat bahawa kedudukan ibu bapa saya menipu terhadap warisan mereka. Dalam komen John Emerson menawarkan hipotesis untuk menyelamatkan kemungkinan bahawa PCA memberitahu kita sesuatu yang bermaklumat mengenai hubungan ibu bapa saya dengan Uyghurs:

Adakah pernah ada kumpulan Mughal di Asia Selatan? Jika kedua-dua ibu bapa anda jauh dari kumpulan itu, walaupun diasimilasikan kepada penduduk tempatan untuk beberapa generasi, hubungan Uighur akan menjadi biasa.

Menarik plot yang saya hasilkan dengan maklumat sejarah ini adalah model yang benar-benar masuk akal. Tetapi kita perlu mempertimbangkan apa yang PCA menunjukkan kepada kita. Kedudukan ibu bapa saya 'adalah gambaran tentang varians genetik purata mereka berkaitan dengan dua titik rujukan. Ia tidak mengatakan kepada kami semestinya mengenai pengubahan variasi itu. Dengan analogi, pertimbangkan bahawa purata 2 dan 4 adalah 3. Tetapi purata 1 dan 5 juga 3. Ini pada dasarnya apa yang berlaku dengan kedudukan ibu bapa saya di plot. Mereka, dan Uyghur, berkumpul di kedudukan yang sama melalui laluan yang berbeza.

Tetapi mari kita menggali lebih mendalam ke dalam data. Pertama, saya menjana plot PCA dengan hanya populasi Eurasia. Ini bermakna dimensi terbesar, yang memisahkan orang Afrika dari bukan orang Afrika, tidak lagi wujud dengan set data ini. Jadi anda mempunyai dimensi percuma untuk bekerja dengan. Inilah yang kita dapat:


Sila ambil perhatian bahawa magnitud dimensi mendatar ialah 4.5 dimensi menegak. Plot bukan untuk skala. Dengan cara itu, pengumpulan ibu bapa saya dengan Uyghur kini hilang ketika kita menambah apa yang jelas komponen utara-selatan Eurasia untuk variasi. Dimensi ini sentiasa wujud, tetapi ia tidak mungkin PC 1 atau PC 2 dengan orang Afrika dalam sampel, jadi kami tidak dapat melihatnya. Ibu bapa saya jelas masih berada di luar paksaan utama variasi Asia Selatan, walaupun pada tahap tertentu saya fikir ini hanya sedikit sampling (ergo, HAP).

PCA mungkin bukan cara terbaik untuk menggambarkan isu ini pada penghujung hari. Oleh itu, saya mengendalikan set data HGDP dengan Afrika dikecualikan dengan K = 10 (10 populasi leluhur putative dalam model kami). Saya menambah ibu bapa saya, Gujaratis, dan Tuscans, bersama dengan beberapa kawan yang menghantar data 23andMe saya. Saya dipangkas SNP ke 55, 000. Saya fikir ini mungkin sedikit di bahagian yang rendah, dan cording warna di plot itu mengerikan. Tetapi saya mahu tidur sekarang, jadi mari kerja ini. Fokus pada Uyghurs, Hazaras, dan ibu bapa saya. Bandingkan bahagian warna:

Terdapat dua komponen tersendiri di Asia Timur: satu warisan hijau yang berlebihan di kalangan kumpulan selatan China, dan satu orang oren di antara orang-orang Siberia. Keseimbangan antara dua komponen ini seolah-olah mengikuti kecerunan utara-selatan. Perhatikan bahawa Uyghurs dan Hazaras kedua-duanya memperlihatkan keseimbangan antara dua komponen ini. Ini masuk akal memandangkan asal-usul Mongolia separa kedua-dua kumpulan ini (Turki berasal dari Mongolia barat dan Siberia selatan). Sebaliknya, ibu bapa saya sangat berat sebelah ke arah komponen "timur" Asia Timur yang hijau. Ini menunjukkan elemen timur mereka berasal dari kumpulan yang berkaitan dengan barat daya China atau Burma.

Seperti yang mereka katakan, saya fikir "kes tertutup." Sekurang-kurangnya apabila ia datang kepada genetik. Secara kultur perkara itu mungkin berbeza. Kesan remeh dari keturunan Turanian saya membentuk konsepsi diri nenek moyang saya selama beberapa generasi. Sebaliknya, komponen Asia Tenggara yang besar telah dilupakan secara harfiah.


Artikel Yang Menarik

Penyelidik Akhirnya ID Poison Ivy Suspek

Penyelidik Akhirnya ID Poison Ivy Suspek

Urushiol (dalam hijau), bahan aktif dalam racun ivy, telah terputus oleh molekul CD1a (ditunjukkan dalam warna merah jambu). Coe Pengimejan Berita baik untuk orang yang terdedah kepada ruam dari racun ivy, oak dan sumac: Ahli-ahli sains telah mengenal pasti molekul tertentu dalam kulit yang memainkan peranan dalam keradangan, yang boleh menjadi awal yang akhirnya menyelesaikan gatal-gatal

Adakah deklarasi Vatican mengenai pemanasan global mempunyai kesan terhadap perbahasan iklim keseluruhan?

Adakah deklarasi Vatican mengenai pemanasan global mempunyai kesan terhadap perbahasan iklim keseluruhan?

Ini adalah jawatan tetamu oleh Jamie L. Vernon, Ph.D., seorang saintis penyelidikan HIV dan wonk dasar yang bercita-cita, yang baru-baru ini berpindah ke DC untuk mendapatkan rasa tindakan Akademi Sains Kepausan, panel sains non-denominasi Vatican, telah mengisytiharkan bahawa tindakan global mengenai perubahan iklim perlu dilakukan untuk mengelakkan "kesan serius dan berpotensi tidak dapat dipulihkan daripada pemanasan global yang disebabkan oleh pelepasan antropogenik gas rumah hijau

Hanya Berapa Banyak Seks Adakah Kita Bercakap Tentang?

Hanya Berapa Banyak Seks Adakah Kita Bercakap Tentang?

Ini adalah yang terakhir dalam siri jawatan tetamu dari Vanessa Woods, pengarang buku baru, Bonobo Handshake. Vanessa adalah Penyelidik Saintis dalam Antropologi Evolusi di Duke University dan mengkaji kognisi cimpanzi dan bonobos di Congo. Jadi ada beberapa keraguan yang terapung di sekitar seperti bau yang tidak baik, bahawa bonobos tidak mempunyai banyak seks

Monyet See, Monyet Do: Bagaimana Membuat Kawan Monyet

Monyet See, Monyet Do: Bagaimana Membuat Kawan Monyet

Tiruan mungkin bentuk pengukuhan yang tulus bukan hanya untuk manusia, tetapi untuk kebanyakan primata. Dalam interaksi sosial manusia, orang mempunyai kecenderungan naluriah untuk menyalin bahasa tubuh dan gaya tubuh masing-masing, dan kajian terdahulu telah menunjukkan bahawa tiruan semacam itu menimbulkan perasaan mesra

Rosetta berayun melepasi masa lalu

Rosetta berayun melepasi masa lalu

Siasatan Agensi Angkasa Eropah Rosetta sedang dalam perjalanan ke komet 67 / P Churyumov-Gerasimenko (dengan cara asteroid 21 Lutetia pada Juli mendatang), di mana ia akan tiba pada bulan Mei 2014. Ini akan menjatuhkan lander - yang pertama kali dicoba sebuah komet - dan pengetahuan kami tentang pelawat-pelik kabur ini akan meningkat dengan pesat