Haixu唐
教授信息和计算
兼职教授生物学
办公室301 d:林德利大厅
电话:(812)856 - 1859
传真:(812)856 - 4764
电子邮件:hatang(在)indiana.edu
实验室:计算组学实验室(COL)
去布卢明顿大学生物信息学课程
邮寄地址:
学校的信息和计算
美国据大街150号
布卢明顿,47405 - 7104
Educaltional背景:
生物化学博士学位,中国科学院上海生物化学研究所。
物理学学士学位,物理学系,南京大学,中国。
主要研究方向:
- 计算质谱:
我们有兴趣开发算法和机器学习方法来解决挑战性的问题在分析质谱数据,特别是对蛋白质组学,作者和glycoproteomics。我的团队介绍了新概念,MS-based蛋白质组学中的肽检测能力,它可以预测整个蛋白质的氨基酸序列。这个概念被广泛应用于蛋白质组学现在很多组。概念的基础上,我们小组开发了一种贝叶斯框架来提高蛋白质识别和推理。由NSF事业奖,2007年NIH资助的,我们小组开发了第一组软件工具来帮助女士数据的自动化分析多糖分析和映射特有的糖基化蛋白,包括MultiGlycan,GlycoFragwork和GlycoSeq。- 隐私保护技术进行分析和传播人类基因组数据:
自2008年以来,我的团队开创了一种应用隐私保护技术共享和分析基因组数据。我的小组研究了泄漏的信息发布全基因组关联研究(GWAS)和开发了一种计算方法在发布GWAS数据隐私风险评估。这项工作获得了声望宠物奖在2011年。与的合作iDASH中心在加州,我们组织了这次的结果挑战申请保护隐私技术(见人类基因组数据自然新闻和Genomeweb我们的努力)的报告。正在进行(见最近的挑战在这里)我也是一个积极参与者的隐私/安全工作小组GA4GH共享人类基因组数据。- 移动遗传元素:
我的团队已经开发了MGEScan和ISEScan识别移动在真核基因元素和细菌基因组抓紧器描述的插入多态性在真核生物和细菌物种的自然种群。
- 片段组装:
我的早期研究主要集中在DNA测序片段组装问题。使用Drs。Pevzner和沃特曼,我开发了欧拉路径方法基因组组装,后来大多数采用汇编(如天鹅绒,SOAPDenovo、ALLPATHS等)组装下一代测序(上天)数据。我们的工作得到了时间的考验RECOMB会议2013年奖在这里)。
教学领域:
2004年秋季
I602:
顶石生物信息学硕士项目的学生
2005年春季
I590:
主题在信息学:基因组学概论(non-biology学生)
2006年秋季
I519:
生物信息学概论
2006年春季
I690:
计算技术在比较基因组学
I627:
在生物信息学研讨会
2006年秋季
I617:
生命科学和化学信息学
2007年春季
I529:
生物序列分析
2007年秋季
I690:
高级算法在生物信息学
2008年春季
I529:
生物序列分析
2008年秋季
I201:
数学基础信息
奖
- NSF早期职业发展(职业)奖,2007年。
- 雷竞技官方网站下载印第安纳大学优秀青年教师奖,2009年。
- 隐私增强技术(PET)奖,2011年。
- RECOMB时间的考验奖,2013年。
书和书的章节
- h . Tang流感病毒从动物到人类如何?pp148 - 1640,在“生物学家生物信息学”,p . a . Pevzner和r·沙米尔(Eds),剑桥大学出版社,2011年。亚马逊
- 金,h . Tang和e .理智型。基因组测序技术和算法,Artech房子出版商(2007)。亚马逊
- h . Tang和美国金,生物信息学:挖掘大量数据从高通量基因组学实验,pp1-24,生物数据分析:软计算方法由她Bandyopadhyay编辑,放进Maulik和杰森·t·l·王,世界科学出版社(2007)。
- y和h唐,动态规划算法的序列和结构比较,pp9-28,生物信息学算法:技术和应用程序由离子Mandoiu和亚历山大Zelikovsky编辑,威利出版社(2008)。
- h . Tang流感病毒从动物到人类如何?生物信息学在生物学家,由p . a . Pevzner编辑和r·沙米尔,剑桥大学出版社,(2011)。
最近的出版物:
t·h . m .ρ,y . Wu Tang Doak y你们(2011),不同CRISPRs进化人类微生物组,Plos Genetics,出版社。
y赵,你们h . Tang和y (2011) RAPSearch2:快速节省内存和蛋白质为下一代测序数据相似性搜索工具。生物信息学,出版社。Pubmed
s . Lee m . Kwon h·李,y沉重的一击,h . Tang j·k·李和t .公园(2011)增强肽量化使用光谱计算集群和集群丰富,BMC生物信息学,12:423。Pubmed
h·l . x Lai Wang唐宋f.a.h ayek Witzmann(2011)小说对齐方法和多个过滤器排除不合格的肽增强Label-Free量化使用肽强度质/女士,蛋白质组研究期刊》的研究,10:4799 - 4812。Pubmed
y, j . Choi和h唐(2011)RAPSearch:快速读取蛋白质相似搜索工具短,12:159 BMC生物信息学。Pubmed
a . Mayampurath c . Yu和h .唐(2011),生物信息学方法作者glycoproteomics,当前蛋白质组学,8 (4):309 - 324。在线
王x和y, b . Peng h .唐(2012),大规模的保护隐私的映射人类基因组序列混合云,19进行网络和分布式系统安全座谈会(nds的12),接受了。
周x、b .彭陈y, y . f . Li h . Tang和x王(2011)发布还是不释放:评估信息泄漏总基因组数据,美国16日欧洲研究在计算机安全会议上(ESORICS 11),课堂讲稿在计算机科学中,6879:607 - 627。信号
- 水蚤基因团(2011),广阔的基因组的水蚤pulex依赖环境基因调控,科学,(6017):555 - 561。科学在线,科学评论
- l . Cherbas a .威林汉d, l .杨邹y, b . d . Eads j·w·卡尔森j . m . Landolin p . Kapranov j .杜a . Samsonova黄永发。崔j .罗伯特c。a . Davis h . Tang m . j . van压印垫板,s . Ghosh a·多布林k . Bell w·林,l·兰顿·m·o·达夫a . e . Tenney c·扎尔斯基·m·r·布伦特·r·a·斯·t·c·考夫曼j·安德鲁斯,b . r . Graveley n . Perrimon s e . Celniker t·r·Gingeras和p . Cherbas(2011)的转录多样性25果蝇细胞系基因组研究,21:301 - 314。Pubmed
- t . g . n .沙h . Tang Doak y你们(2011),比较细菌社区推断从16 s rRNA基因测序和猎枪宏基因组。Pac协会Biocomput 2011:165 - 176。全文从公安局网上进行。
- s, r·j·阿诺德·h . Tang和p . Radivojac(2010)肽碎片光谱预测的准确性和限制。分析化学,在出版社。Pubmed。
- 你们m .ρ,h . Tang和y (2010) FragGeneScan:预测基因在短和容易出错的读取。诊断。酸Res, 38 (20): e191。Pubmed,NAR在线免费全文。
- c中,h . Tang和s·张(2010),RNAMotifScan:自动识别的RNA结构图案使用二级结构对齐。诊断。酸Res。38 (18): e176。Pubmed,NAR在线免费全文。
- y . f . Li r·j·阿诺德·h . Tang和p . Radivojac(2010),蛋白质肽检测能力的重要性识别、量化,并在MS / MS蛋白质组学实验设计。j .蛋白质组研究。9 (12):6288 - 6297。Pubmed。
- 公元前波尔,y . f . Li j·p·赖利d·e·克莱梅尔·r·d·DiMarchi p . Radivojac h . Tang和r·j·阿诺德(2010)组合库的合成肽作为猎枪蛋白质组学的一个模型。肛交。化学82 (15):6559 - 6568。Pubmed。
- m .ρ,s . Schaack x高,s . Kim m (merrill Lynch)和h .唐(2010),基因组的LTR retroelements水蚤pulex, BMC基因组学、11:425。Pubmed。
- y, y Mechref, Klouckova, a . Mayampurath m . v . Novotny和h唐(2010),映射特有的蛋白质N-Glycosylations通过液相色谱/质谱分析和有针对性的串联质谱,质谱的快速通信,24 (7):965 - 72。Pubmed。
- d . Hajkova y Imanishi诉Palamalai, k . c . s . Rao c .元,问:盛,h .唐曾r, r·m·丹诺d T Organisciak和m .宫城县(2010),蛋白质组变化的光感受器外节在强烈的曝光,j .蛋白质组Res。9 (2): 1173 - 1181。Pubmed。
- m .ρ和h .唐(2009),MGEScan-nonLTR:计算识别和分类在真核基因组Non-LTR反转位子活动。37岁的核酸Res (21): e143。NAR在线免费全文
- f . y . r . Wang, x, x h . Tang和周(2009),学习你的身份和疾病研究论文:全基因组研究协会信息泄密事件。16 ACM会议进行计算机和通信安全(CCS ' 09)。CCS在线
- 李x r . Wang Wang z h . Tang m . Reiter和z董(2009),保护隐私基因组计算通过项目专业化。16 ACM会议进行计算机和通信安全(CCS ' 09)。CCS在线
- r . j . y . f . Li阿诺德,y, p . Radivojac唐问:盛和h(2009),贝叶斯方法蛋白质猎枪蛋白质组学的推理问题。j . Comp。杂志。,16(8): 1183-1193.Pubmed
- 你们y和h唐(2009),一个ORFome组装宏基因组序列分析方法。j . Bioinf。广告样稿,杂志。,7(3):455-71.Pubmed
- m .ρ,m .周x高,s . Kim h .唐·m·林奇(2009),独立的哺乳动物基因组收缩后,KT边界。医学杂志。另一个星球,1:2-12。对免费全文GBE在线
- b·曼m .ㄧ盛,h . Tang y Mechref, m . v . Novotny (2008), ProteinQuant套件:一束label-free定量蛋白质组学自动化的软件工具,快速通讯。质量规范,22:3823 - 3834。Pubmed
- 盛,y Mechref, y, m . v . Novotny h .唐(2008),计算方法描述债券链接使用MALDI-TOF-TOF多糖同分异构体的质谱快速通讯22:3561 - 3569质量规范。Pubmed
- c .沈问:盛,j .戴y, r .曾h .唐(2008),在肽识别假阳性估计使用诱饵搜索策略,蛋白质组学,9 (1):194 - 204。Pubmed
- c .元,问:盛,h . Tang y, r .曾庆红,r . j . Solaro(2008),定量的比较Sarcomeric phosphoproteomes新生儿和成年老鼠的心脏。杂志。心中国保监会。杂志。,295 (2):H647-56。Pubmed
- 你们y, h·唐(2008),一个ORFome组装宏基因组序列分析方法。学报》第七届国际会议上计算系统生物学(CSB ' 08), 3-13。CSB在线
- r . j . y . f . Li阿诺德,y, p . Radivojac盛,h·唐(2008),贝叶斯方法蛋白质猎枪蛋白质组学的推理问题。学报》第12届国际会议上计算分子生物学(RECOMB08) LNBI 4955年,167 - 180。LNBI在线
- 萨哈,c .沈,s·h·哈里森·h·唐、p . Radivojac r·j·阿诺德x张j.y.陈(2008),HIP2:人类从健康人血浆蛋白的在线数据库。BMC医学基因组学,1:12。Pubmed
- 崔j . h . s . Kim h . Tang安德鲁j . d·g·吉尔伯特,j·k·Colbourne(2008),机器学习方法结合证据验证基因组装配,生物信息学,24 (6):744 - 50。Pubmed
- p·阿尔维斯,r·j·阿诺德·d·e·克莱梅尔y, j·p·赖利,盛,h . Tang z, r .曾和p . Radivojac(2008),快速和准确识别猎枪semi-tryptic肽的蛋白质组学、生物信息学、24:102 - 109。Pubmed
- 江z, h .唐·m·文图拉·m·f·Cardone t . Marques-Bonet x她,p . a . Pevzner e大肠为(2007),祖先重建节段复制揭示了人类基因组进化的核心。Nat麝猫。39:1361 - 1368。Pubmed,评论自然遗传学。
- h·唐(2007)基因组组装、重排和重复,化学牧师,107 (8):3391 - 3406。Pubmed。
- j . h, s·h·Bae Tang, j·谢和美国金(2007),dPattern:转录因子结合位点(TFBS)发现在人类基因组中使用一个歧视模式分析。23:2619 - 2621。Pubmed。
- 崔m .ρ,j . h . s . Kim m (merrill Lynch)和h .唐(2007),新创LTR反转位子活动在真核基因组的识别。BMC基因组学,8:90。Pubmed。
- a . Sundquist m . Ronaghi h . Tang p . a . Pevzner和美国Batzoglou(2007),全基因组测序和组装与高通量、短内容的技术。2:e484 PLoS ONE。Pubmed。
- i Klouckova, y, y Mechref m . v . Novotny和h唐(2007),计算方法的识别位点专一的蛋白质糖基化通过离子阱质谱分析,第三RECOMB卫星会议上蛋白质组学,课堂讲稿在生物信息学,4532:96 - 107,信号网络。
- p·阿尔维斯,r·j·阿诺德·m·诉Novotny p . Radivojac j·p·赖利和h唐(2007),发展蛋白质推断使用肽从猎枪蛋白质组学检测能力。太平洋生物运算研讨会上,12:409 - 420。全文从公安局网上进行。
- r . Patwardhan h . Tang金和m . Dalkilic(2006),一个近似de Bruijn多个局部比对和主题图方法在蛋白质序列,发现第一个国际研讨会在数据挖掘和生物信息学,课堂讲稿在生物信息学,4316:158 - 169。
- d .智,拉斐尔,a .价格h . Tang和p . Pevzner(2006),识别重复域在大型基因组、基因组生物学,7 (1):R7,Pubmed。
- d .智r . Keich p . Pevzner希和h .唐(2006),检查base-calling重复错误。IEEE / ACM事务计算生物学和生物信息学,4 (1):54 - 64,2007,Pubmed
- h . Tang r·j·阿诺德·p·阿尔维斯,z, d·e·克莱梅尔m . v . Novotny j·p·赖利和p . Radivojac(2006),计算方法对label-free蛋白量化使用预测肽检测能力。生物信息学,22 (14):e481 - 488, ISMB 2006。Pubmed。
- 诉Bafna h . Tang和Shaojie张(2006),共识折叠不结盟的RNA序列的再现。j . Comp。杂志。13 (2):283 - 295,Pubmed。
- r·j·阿诺德n . Jayasankar d . Aggarwal h . Tang和p . Radivojac(2006),机器学习的方法来预测肽碎片光谱。太平洋生物运算研讨会上,11:219 - 230,全文从公安局网上进行。
- h . Tang y Mechref和m . Novotny(2005),自动解释MS / MS谱的低聚糖。生物信息学,21增刊1:i431-i439 ISMB 2005,Pubmed
- 诉Bafna h . Tang和Shaojie张(2005),共识折叠不结盟的RNA序列的再现。学报》第九届国际会议上计算分子生物学(RECOMB ' 05), 172 - 187年,2005年5月,波士顿,美国,ACM。
- b·拉斐尔·d·智,h . Tang和p . A . Pevzner多个对齐的一种新颖的方法和重复序列元素。基因组研究》2004年,14:2336 - 2346。Pubmed
- 诉Bafna n . Bandeira h . Tang和p . a . Pevzner猎枪蛋白质测序由串联组装质量。分析化学,2004年,76:7221-33。Pubmed
- p . a . Pevzner唐h . g . p .第二,新创分类和重复片段组装。基因组研究》2004年9月;14 (9):1786 - 96。Pubmed
- M . Chaisson M p . a . Pevzner和h . Tang片段组装较短的读取。生物信息学。2004年9月1;20 (13):2067 - 74。Pubmed
- p . a . Pevzner唐h . g . p .第二,新创分类和重复片段组装。学报》第八届国际会议上计算分子生物学(RECOMB 04), 2004年4月,圣地亚哥,美国,ACM出版社。2004年9月;14 (9):1786 - 96。
- 希,M . Alekseyev M s h·苏h . Tang和p . a . Pevzner拼接图和装配问题。生物信息学。2002;18增刊1:S181-8 (ISMB 2002问题)。Pubmed
- p . a . Pevzner和h . Tang片段组装与双重数据。生物信息学。2001年6月17日增刊1:S225-33(特殊ISMB 2001问题)。Pubmed
- p . A . Pevzner h . Tang和m . s .沃特曼(2001)DNA测序片段组装的新方法。《第五届国际会议上计算分子生物学(RECOMB 01), 2001年4月,加拿大蒙特利尔,ACM出版社。
- 问:你,h . Tang和d·丁MedBlast:搜索文章相关的生物序列。生物信息学。2004年,20:75 - 77。Pubmed
- p . a . Pevzner h . Tang和m . s .沃特曼(2001),一个欧拉路径方法DNA片段组装。Proc。国家的。学会科学。美国98:9748 - 9753。Pubmed自然新闻
- Kruglyak和h .唐(2001)一个新的估计意义相关的时间序列数据,j . Comp。杂志。2001年,8:463 - 470。Pubmed
- Kruglyak和h .唐(2000)临近酵母基因的调控。遗传学、趋势16:109 - 111。Pubmed