Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
楼主: Yungsiyebu

匈奴或汉军?匈奴时代蒙古样本常染色体Admixture分析

[复制链接]
发表于 2018-6-12 15:43 | 显示全部楼层
本帖最后由 大昊 于 2018-6-12 15:56 编辑

彝族纳西族和北汉在常染上本身就比较接近。

18011522218f6e52f7822ec672.jpg.thumb_副本.jpg
纳西彝族成分,北汉成分,日本成分,都属于东亚成分。
纳西彝族成分最西,北汉居中,日本成分最东。
 楼主| 发表于 2018-6-12 15:55 | 显示全部楼层
彝族纳西族和北汉在常染上本身就比较接近。

57897
大昊 发表于 2018-6-12 15:43


你注意,这个D45样本没有多少纳西族普遍存在的类拉祜族西南土著第二主成分,所以,你不难理解,为什么当K值很低时,DA45的类西伯利亚成分比纳西族高很多,所以,不是说,admixture第一主成分为类纳西,所以,pca就一定聚类。
发表于 2018-6-12 16:00 | 显示全部楼层
本帖最后由 大昊 于 2018-6-12 16:09 编辑
你注意,这个D45样本没有多少纳西族普遍存在的类拉祜族西南土著第二主成分,所以,你不难理解,为什么当K值很低时,DA45的类西伯利亚成分比纳西族高很多,所以,不是说,admixture第一主成分为类纳西,所以,pca ...
Yungsiyebu 发表于 2018-6-12 15:55
但他的主成份都是以纳西成分和日本成分这样的东亚成分为主的,而北亚成分(鄂伦春成分和雅库特成分)极少。
所以,在PCA图里,那个疑似汉兵也只会位于纳西北汉那块分布区。
所以,不是说,admixture第一主成分为类纳西,所以,pca ...
Yungsiyebu 发表于 2018-6-12 15:55

当然不是只看第一主成份,还有第二主成份日本成分啊。
我贴那个PCA图,只是用图中日本北汉纳西的位置,来说明日本成分和纳西成分本质都是东亚成分,只是日本成分偏东些,纳西彝族成分偏西些。
一个纳西成分+日本成分超过90%,然后鄂温克成分和拉祜成分都只有零头的人,显然是类似北汉这样的东亚北部人群。
 楼主| 发表于 2018-6-12 16:09 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 16:10 编辑
但他的主成份都是以纳西成分和日本成分这样的东亚成分为主的,而北亚成分(鄂伦春成分和雅库特成分)极少。
所以,在PCA图里,那个疑似汉兵也只会位于纳西北汉那块分布区。

当然不是只看第一主成份,还有第二主成 ...
大昊 发表于 2018-6-12 16:00

请你注意,藏族等西南民族的k7b结果也与内蒙古的西伯利亚水平接近,不是西南就东亚了。这个样本的整体k7b结果与东北民族接近,高于纳西族不少,主要是后者第二主成分是西南土著拉祜族,而DA43信号微弱。所以,不能说该样本第一主成分类纳西族,就西南了,他没有纳西族普遍的西南土著因素。
发表于 2018-6-12 16:14 | 显示全部楼层
本帖最后由 大昊 于 2018-6-12 16:54 编辑
请你注意,藏族等西南民族的k7b结果也与内蒙古的西伯利亚水平接近,不是西南就东亚了。这个样本的整体k7b结果与东北民族接近,高于纳西族不少,主要是后者第二主成分是西南土著拉祜族,而DA43信号微弱。所以,不能 ...
Yungsiyebu 发表于 2018-6-12 16:09
两个汉兵的K7b数据都是典型的华北汉人水平,怎么会和东北民族接近?
QQ图片20180611184212_副本6666.png

除了东北汉人,哪个东北民族会是这么南的K7b数据?
下面中间那个圈里的,蒙古,锡伯,赫哲,鄂伦春,哪个民族会有这么南的K7b数据?
发表于 2018-6-12 16:16 | 显示全部楼层
请你注意,藏族等西南民族的k7b结果也与内蒙古的西伯利亚水平接近,
Yungsiyebu 发表于 2018-6-12 16:09
藏族不等于纳西,两回事!
纳西的K7b和北汉的南北程度相似。
 楼主| 发表于 2018-6-12 16:21 | 显示全部楼层
藏族不等于纳西,两回事!
纳西的K7b和北汉的南北程度相似。
大昊 发表于 2018-6-12 16:16

DA43=纳西族-拉祜族,希望不难理解。
发表于 2018-6-12 16:33 | 显示全部楼层
本帖最后由 大昊 于 2018-6-12 17:15 编辑
DA43=纳西族-拉祜族,希望不难理解。
Yungsiyebu 发表于 2018-6-12 16:21
再怎么换算,他也是和北汉类似的人群。
这种成分的组合,其实是可以拆分的。
假如纳西成分可以由大比例的日本成分和小比例的拉祜成分合成,那把那汉兵的纳西成分按一定比例,分割成大比例的日本成分和小比例的拉祜成分,那各成分比例就和北汉一致了。

这种例子是普遍的,在微基因或23魔方里,父母和子女都是某地当地人,母亲有高比例彝族成分的,儿子可能完全没有,转而多出来的成高比例的韩国成分+少量拉祜成分,或高比例的北汉成分+少量的拉祜成分。
 楼主| 发表于 2018-6-12 17:32 | 显示全部楼层
A与B有50%接近,B与C有25%,不意味着A和C一定有什么关联。
 楼主| 发表于 2018-6-12 17:32 | 显示全部楼层
假如纳西成分可以由大比例的日本成分和小比例的拉祜成分合成,那把那汉兵的纳西成分按一定比例,分割成大比例的日本成分和小比例的拉祜 ...
大昊 发表于 2018-6-12 16:33


说明他们的算法有待优化。
发表于 2018-6-12 18:39 | 显示全部楼层
本帖最后由 大昊 于 2018-6-12 18:59 编辑

30# Yungsiyebu 你那19楼的K6分析结果,那个汉代古人在南北水平上完全就是北汉的水平,这在大尺度上和之前gedmatch的K7b和K12b的结果是完全一致的

和北汉相比,古代样本的鄂伦春成分多些,但更北的雅库特成分少些,二者完全可以相互抵消。
然后二者主要都是东亚的纳西成分和日本成分为主,超过了90%。
古代样本的纳西成分多些,日本成分少些;而北汉的日本成分多些,纳西成分少些。但北汉的拉祜成分也比古代样本稍多些,而假如较多的类日本成分可以和较少的类拉祜成分合成纳西成分,宏观的看二者就没什么差别!
为什么说“较多的类日本成分+较少的类拉祜成分”可能可以合成类纳西成分呢?
因为在hgdp的东亚欧pca图里,纳西族还真就在日本人和拉祜人之间(更偏向日本人)的位置。
估计3%的日本成分+1%的拉祜成分,可以近似的等于4%的纳西成分(或彝族成分)
18011522218f6e52f7822ec672.jpg.thumb_副本.jpg

类似于数字游戏,假如越北方的成分用越大的数字代替,雅库特成分是6,鄂伦春成分是2,日本成分是1.1,纳西成分是0.9,拉祜成分是0.3,
然后北汉和那个古代样本,按每个成分的百分比相乘,然后相加,得到的总的数值一定是非常接近的,而二者和那些北方民族则会差别明显。当然,和更南方的人群如南汉苗畲也会差别明显。

总之,你K6的分析结果完全和之前gedmatch的K7b和K12b的数据是吻合的,两个疑似汉兵在南北水平上就是和现代北汉类似的。


 楼主| 发表于 2018-6-12 18:53 | 显示全部楼层
30# Yungsiyebu 你那19楼的K6分析结果,那个汉代古人在南北水平上完全就是北汉的水平,这在大尺度上和之前gedmatch的K7b和K12b的结果是完全一致的。

和北汉相比,古代样本的鄂伦春成分多些,但更北的雅库特成分少 ...
大昊 发表于 2018-6-12 18:39

无诸王的数据已经查明原因,一号染色体hgdp匹配约3万+,结果被他用商业芯片删除了其中2/3,我用其剩下的1/3跑数据,得到的结果也的确类北汉。这是问题所在。
 楼主| 发表于 2018-6-12 18:56 | 显示全部楼层
至于pca,我们看到的就是三个被标记为匈奴的样本彼此聚类,如果你觉得加入汉族样本会打不同,请不要如此辛苦的码字,亲自跑跑数据就解决了,这样空对空没有意义。
 楼主| 发表于 2018-6-12 19:10 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 19:16 编辑

D45的结果也出来了,与D43非常接近,类雅库特比例,在呼伦贝尔蒙古的上限。欢迎网友积极验证。



类雅库特类傣族
Xiong
period
DA450.655440.34456
N.HanHGDP012960.1425890.857411
DaiHGDP013070.000010.99999
MongolaHGDP012320.2549950.745005
MongolaHGDP012260.6481620.351838
YakutHGDP009690.999990.00001
S.HanHGDP009710.0669470.933053

DA45_Han_Dai_Mongol_Yakut.2.txt

6.28 KB, 下载次数: 57

发表于 2018-6-12 19:10 | 显示全部楼层
本帖最后由 大昊 于 2018-6-12 19:13 编辑
至于pca,我们看到的就是三个被标记为匈奴的样本彼此聚类,如果你觉得加入汉族样本会打不同,请不要如此辛苦的码字,亲自跑跑数据就解决了,这样空对空没有意义。
Yungsiyebu 发表于 2018-6-12 18:56
如果加入北汉,就会和那两个DA43DA45重合了,然后都位于比DA39南些的位置,因为这些样本的共同点就是西亚欧成分极少,然后在南北程度上都挺南的(那个DA39虽说是匈奴人,但和真正的北方西伯利亚人相比还是很南的)

那个DA39的常染水平,近似现代内蒙古蒙族的水平(比现代内蒙古人稍北些,稍东些)。
难道你认为在整个亚欧大陆人群的pca图里,北汉和内蒙古的蒙古族会离的很远吗?在西亚欧人对比下,北汉和内蒙的蒙族在东西尺度上基本会重叠。
在雅库特人对比下,北汉和内蒙的蒙族在南北尺度上也会离的很近。
 楼主| 发表于 2018-6-12 19:12 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 19:15 编辑
如果加入北汉,就会和那两个DA43DA45重合了,然后都位于比DA39南些的位置,因为这些样本的共同点就是西亚欧成分极少,然后在南北程度上都挺南的(那个DA39虽说是匈奴人,但和真正的北方西伯利亚人相比还是很南的)
...
大昊 发表于 2018-6-12 19:10


兄弟,少点长篇大论的刷屏,干扰大家阅读数据分析结果。你说的问题很简单,等三个样本都跑出来,加入汉族等东亚样本,用文献的算法和工具,跑一下pca,不比你这么瞎猜直接了当?欢迎学习admixture,亲自跑一下,如果对我跑有质疑。
 楼主| 发表于 2018-6-12 20:31 | 显示全部楼层
DA39这个标准匈奴人,处于外蒙古最北面的样本也跑出来了。与gedmacth上传的数据抛出的K7b等结果也不同。类雅库特比例高达~80%,这应当在外蒙古的水平上。



类雅库特类傣族
Xiong
period
DA390.7913310.208669
MongolaHGDP012320.2524440.747556
N.HanHGDP012870.129150.87085
S.HanHGDP008220.0063740.993626
YakutHGDP009450.999990.00001
MongolaHGDP012260.6462820.353718

DA39_Han_Dai_Mongol_Yakut.2.txt

6.23 KB, 下载次数: 61

 楼主| 发表于 2018-6-12 22:31 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 22:51 编辑

D43样本,K=7的结果如下:

类鄂伦春成分出现,D43样本比例很高。

Fst值如下:


    Pop0    Pop1    Pop2    Pop3    Pop4    Pop5   
Pop0   
Pop1    0.054   
Pop2    0.107    0.086   
Pop3    0.116    0.117    0.164   
Pop4    0.082    0.064    0.096    0.138   
Pop5    0.097    0.087    0.127    0.155    0.097   
Pop6    0.079    0.087    0.135    0.145    0.105    0.124   





类雅库特类日本类拉祜类玛雅类柬埔寨类纳西族类鄂伦春
DA43_23andmeXiongnu
period
0.000010.4052590.0786840.000010.0729660.2245420.218528
HGDP01346Naxi0.000010.3866840.1102770.000010.0979990.4002690.004751
HGDP01347Tu0.1137790.4413990.0167520.028160.1211890.2643290.014392
HGDP01326Lahu0.000010.2088170.4726940.000010.2337170.0847420.00001
HGDP01327She0.000010.490960.000010.000010.508990.000010.00001
HGDP01296N.Han0.0139490.5769930.000010.0082450.1492870.2115280.039988
HGDP01307Dai0.000010.3084660.0521430.000010.6393520.000010.00001
HGDP01251Xibo0.0644870.542140.0033120.0095240.0666270.1662250.147684
HGDP01287S.Han0.0033070.5693250.000010.0079280.172280.2082120.038937
HGDP01232Mongola0.0862830.4686190.000010.0257760.1388610.1795230.100928
HGDP01234Hezhen0.000010.4116360.000010.000010.000010.0295130.558812
HGDP01212Oroqen0.1680790.4461650.000010.0054950.067560.076050.236641
HGDP01213Daur0.0225920.4962050.000010.000010.0148720.0717020.394609
HGDP01188Yizu0.0141550.4023110.0773070.000010.1435010.355910.006804
HGDP01189Miaozu0.000010.4461130.0144680.000010.4186370.1207520.00001
HGDP01095Tujia0.000010.5054220.0399290.000010.3663870.0882320.00001
HGDP00969Yakut0.9543330.000010.000010.0456170.000010.000010.00001
HGDP00828Japanese0.000010.9881680.0117820.000010.000010.000010.00001
HGDP00854Maya0.000010.000010.000010.999940.000010.000010.00001
HGDP00721Cambodians0.1095350.000010.0463730.0330130.811050.000010.00001
D43_K=7.jpg

DA43_eastAsian.7.txt

41.86 KB, 下载次数: 69

发表于 2018-6-12 23:23 | 显示全部楼层
D43样本,K=7的结果如下:

类鄂伦春成分出现,D43样本比例很高。

Fst值如下:


    Pop0    Pop1    Pop2    Pop3    Pop4    Pop5   
Pop0   
Pop1    0.054   
Pop2    0.107    0.086   
Pop3  ...
Yungsiyebu 发表于 2018-6-12 22:31
我的理解不知道对不对,k值越高,每一种成分都要分离出去一部分。表现为递减模式,不应该是你这种某种成分忽高忽低的情形吧?
 楼主| 发表于 2018-6-12 23:26 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 23:29 编辑
我的理解不知道对不对,k值越高,每一种成分都要分离出去一部分。表现为递减模式,不应该是你这种某种成分忽高忽低的情形吧?
zzzz 发表于 2018-6-12 23:23

请自己跑下数据,admixture是自动运行的程序,不是我控制的。重点看fst值,比如k=7时,鄂伦春成分分离出来,这种成分与雅库特成分的fst最低,亲缘关系最近。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2019-11-14 03:40 , Processed in 0.102806 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表