FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5979, 520 aa 1>>>pF1KB5979 520 - 520 aa - 520 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0818+/-0.000848; mu= 11.2603+/- 0.052 mean_var=119.7577+/-23.780, 0's: 0 Z-trim(111.1): 31 B-trim: 47 in 1/50 Lambda= 0.117199 statistics sampled from 12114 (12145) to 12114 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.726), E-opt: 0.2 (0.373), width: 16 Scan time: 3.310 The best scores are: opt bits E(32554) CCDS14445.1 TBX22 gene_id:50945|Hs108|chrX ( 520) 3528 607.4 1.2e-173 CCDS81360.1 TBX15 gene_id:6913|Hs108|chr1 ( 602) 1265 224.8 2.1e-58 CCDS30816.1 TBX15 gene_id:6913|Hs108|chr1 ( 496) 1241 220.7 3e-57 CCDS34495.1 TBX18 gene_id:9096|Hs108|chr6 ( 607) 1210 215.5 1.3e-55 CCDS43568.1 TBX20 gene_id:57057|Hs108|chr7 ( 447) 851 154.8 2e-37 CCDS13765.1 TBX1 gene_id:6899|Hs108|chr22 ( 372) 760 139.3 7.2e-33 CCDS31621.1 TBX10 gene_id:347853|Hs108|chr11 ( 385) 754 138.3 1.5e-32 CCDS13766.1 TBX1 gene_id:6899|Hs108|chr22 ( 398) 745 136.8 4.4e-32 CCDS13767.1 TBX1 gene_id:6899|Hs108|chr22 ( 495) 737 135.5 1.4e-31 CCDS11629.1 TBX4 gene_id:9496|Hs108|chr17 ( 545) 724 133.3 6.7e-31 CCDS82180.1 TBX4 gene_id:9496|Hs108|chr17 ( 546) 724 133.3 6.7e-31 CCDS9173.1 TBX5 gene_id:6910|Hs108|chr12 ( 518) 695 128.4 1.9e-29 CCDS9175.1 TBX3 gene_id:6926|Hs108|chr12 ( 723) 688 127.3 5.8e-29 CCDS9174.1 TBX5 gene_id:6910|Hs108|chr12 ( 468) 679 125.7 1.2e-28 CCDS55960.1 MGA gene_id:23269|Hs108|chr15 (2856) 630 117.8 1.6e-25 CCDS55959.1 MGA gene_id:23269|Hs108|chr15 (3065) 630 117.9 1.7e-25 CCDS33310.1 TBR1 gene_id:10716|Hs108|chr2 ( 682) 600 112.4 1.7e-24 CCDS2646.1 EOMES gene_id:8320|Hs108|chr3 ( 686) 599 112.3 1.9e-24 CCDS63585.1 EOMES gene_id:8320|Hs108|chr3 ( 705) 597 111.9 2.4e-24 CCDS11514.1 TBX21 gene_id:30009|Hs108|chr17 ( 535) 578 108.6 1.8e-23 CCDS10670.1 TBX6 gene_id:6911|Hs108|chr16 ( 436) 537 101.7 1.8e-21 CCDS11627.2 TBX2 gene_id:6909|Hs108|chr17 ( 712) 524 99.6 1.3e-20 CCDS1272.1 TBX19 gene_id:9095|Hs108|chr1 ( 448) 487 93.2 6.6e-19 CCDS63584.1 EOMES gene_id:8320|Hs108|chr3 ( 410) 479 91.8 1.6e-18 CCDS5290.1 T gene_id:6862|Hs108|chr6 ( 435) 456 88.0 2.4e-17 CCDS59045.1 T gene_id:6862|Hs108|chr6 ( 377) 446 86.2 7e-17 CCDS9176.1 TBX3 gene_id:6926|Hs108|chr12 ( 743) 420 82.0 2.6e-15 >>CCDS14445.1 TBX22 gene_id:50945|Hs108|chrX (520 aa) initn: 3528 init1: 3528 opt: 3528 Z-score: 3230.8 bits: 607.4 E(32554): 1.2e-173 Smith-Waterman score: 3528; 100.0% identity (100.0% similar) in 520 aa overlap (1-520:1-520) 10 20 30 40 50 60 pF1KB5 MALSSRARAFSVEALVGRPSKRKLQDPIQAEQPELREKKGGEEEEERRSSAAGKSEPLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MALSSRARAFSVEALVGRPSKRKLQDPIQAEQPELREKKGGEEEEERRSSAAGKSEPLEK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 QPKTEPSTSASSGCGSDSGYGNSSESLEEKDIQMELQGSELWKRFHDIGTEMIITKAGRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QPKTEPSTSASSGCGSDSGYGNSSESLEEKDIQMELQGSELWKRFHDIGTEMIITKAGRR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 MFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIPRFYVHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIPRFYVHP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 DSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 DSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 LPTEGVKTFSFKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRNRGVLDGLLETYPW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LPTEGVKTFSFKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRNRGVLDGLLETYPW 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 RPSFTLDFKTFGADTQSGSSGSSPVTSSGGAPSPLNSLLSPLCFSPMFHLPTSSLGMPCP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RPSFTLDFKTFGADTQSGSSGSSPVTSSGGAPSPLNSLLSPLCFSPMFHLPTSSLGMPCP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 EAYLPNVNLPLCYKICPTNFWQQQPLVLPAPERLASSNSSQSLAPLMMEVPMLSSLGVTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EAYLPNVNLPLCYKICPTNFWQQQPLVLPAPERLASSNSSQSLAPLMMEVPMLSSLGVTN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 SKSGSSEDSSDQYLQAPNSTNQMLYGLQSPGNIFLPNSITPEALSCSFHPSYDFYRYNFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SKSGSSEDSSDQYLQAPNSTNQMLYGLQSPGNIFLPNSITPEALSCSFHPSYDFYRYNFS 430 440 450 460 470 480 490 500 510 520 pF1KB5 MPSRLISGSNHLKVNDDSQVSFGEGKCNHVHWYPAINHYL :::::::::::::::::::::::::::::::::::::::: CCDS14 MPSRLISGSNHLKVNDDSQVSFGEGKCNHVHWYPAINHYL 490 500 510 520 >>CCDS81360.1 TBX15 gene_id:6913|Hs108|chr1 (602 aa) initn: 914 init1: 634 opt: 1265 Z-score: 1161.9 bits: 224.8 E(32554): 2.1e-58 Smith-Waterman score: 1400; 45.5% identity (69.0% similar) in 565 aa overlap (1-520:9-566) 10 20 30 pF1KB5 MALSSRARAFSVEALVGRPSKRKLQD--------PIQAEQP-------ELRE .::::::.:::::::.: .::::.: ..: .: : CCDS81 MSERRRSAVALSSRAHAFSVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAA 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB5 KKGGEEEEERRSSAAGKSEPLEKQPKTEPSTSASSGCGSDSGYGNSSESLEEKDIQMELQ .: : . . ..:... :: : .. . :: .. . :. . . :.:: ::.::: CCDS81 AHGLEPHPDSEQSTGSDSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEE--IQVELQ 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 GSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYH ..:::::::::::::::::::::::..:::. :::: .::..:.:.::::.:::::::: CCDS81 CADLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYH 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB5 SSQWMVAGNTDHLCIIPRFYVHPDSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSM ::.::::::.: . :: :.:::: ::.:::::..:::..::::::.::.:::::.:: CCDS81 SSKWMVAGNADSP-VPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSM 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB5 HKYKPRVHVIEQGSSVDLSQIQSLPT-EGVKTFSFKETEFTTVTAYQNQQITKLKIERNP :::.::::::.. : ::: . .:. .:::::.: :: :::::::::::::.:::.::: CCDS81 HKYQPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNP 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB5 FAKGFRDTGRNRGVLDGLLETYP-WRPSF-TLDFKTFGA--DTQSGSSGSSPVTSSGGAP :::::::.:::: :....::: ::: :: :. : . :.::.:.::.::: :.: CCDS81 FAKGFRDSGRNRTGLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTP 300 310 320 330 340 350 340 350 360 370 380 pF1KB5 SPLNS--LLSPLCFSPMFHLPTSSLGMPCPEAYLPNVNL---PLCYKICPTNFWQQQPLV :: : :::: : : ::: ..... : :. : :.:: : : . . . . : CCDS81 SPSASSHLLSPSCSPPTFHLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLS 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB5 LPAPERLASSNSS--QSLAPLM-MEVP-MLSSLGVTNSKSGSS--EDSSDQYLQAPNSTN . .:: :...: : .: ...: ..:.. . : :.: : . : . : :. CCDS81 DSGYNRLQSGTTSATQPSETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFP--TS 420 430 440 450 460 470 450 460 470 480 490 pF1KB5 QMLYGLQSPGNIFLPNSITPEAL-----------SCSFHPSYDFYRYNFSMPSRLISGSN :. : .:. :: .: .:. . . :.: :..: ::: :: .. . CCDS81 QFQYVMQA-GNA-ASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPE 480 490 500 510 520 530 500 510 520 pF1KB5 HLKVNDDSQV--SFGEGKCNHVHWYPA-INHYL .:...... . : ..: .. .. :. ..: . CCDS81 KLSASQSTLLCSSPSNGAFGERQYLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGS 540 550 560 570 580 590 CCDS81 SSQMSVHMV 600 >>CCDS30816.1 TBX15 gene_id:6913|Hs108|chr1 (496 aa) initn: 789 init1: 634 opt: 1241 Z-score: 1141.3 bits: 220.7 E(32554): 3e-57 Smith-Waterman score: 1299; 48.6% identity (71.8% similar) in 465 aa overlap (86-520:3-460) 60 70 80 90 100 110 pF1KB5 EPLEKQPKTEPSTSASSGCGSDSGYGNSSESLEEKDIQMELQGSELWKRFHDIGTEMIIT :.:: ::.::: ..::::::::::::::: CCDS30 MSSMEE--IQVELQCADLWKRFHDIGTEMIIT 10 20 30 120 130 140 150 160 170 pF1KB5 KAGRRMFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIPR ::::::::..:::. :::: .::..:.:.::::.::::::::::.::::::.: . :: CCDS30 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSP-VPPR 40 50 60 70 80 180 190 200 210 220 230 pF1KB5 FYVHPDSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDL :.:::: ::.:::::..:::..::::::.::.:::::.:::::.::::::.. : :: CCDS30 VYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDL 90 100 110 120 130 140 240 250 260 270 280 290 pF1KB5 SQIQSLPT-EGVKTFSFKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRNRGVLDGL : . .:. .:::::.: :: :::::::::::::.:::.::::::::::.:::: :... CCDS30 SPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRTGLEAI 150 160 170 180 190 200 300 310 320 330 340 pF1KB5 LETYP-WRPSF-TLDFKTFGA--DTQSGSSGSSPVTSSGGAPSPLNS--LLSPLCFSPMF .::: ::: :: :. : . :.::.:.::.::: :.::: : :::: : : : CCDS30 METYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLSPSCSPPTF 210 220 230 240 250 260 350 360 370 380 390 400 pF1KB5 HLPTSSLGMPCPEAYLPNVNL---PLCYKICPTNFWQQQPLVLPAPERLASSNSS--QSL :: ..... : :. : :.:: : : . . . . : . .:: :...: : CCDS30 HLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTSATQPS 270 280 290 300 310 320 410 420 430 440 450 pF1KB5 APLM-MEVP-MLSSLGVTNSKSGSS--EDSSDQYLQAPNSTNQMLYGLQSPGNIFLPNSI .: ...: ..:.. . : :.: : . : . : :.:. : .:. :: .: CCDS30 ETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFP--TSQFQYVMQA-GNA-ASSSS 330 340 350 360 370 380 460 470 480 490 500 pF1KB5 TPEAL-----------SCSFHPSYDFYRYNFSMPSRLISGSNHLKVNDDSQV--SFGEGK .:. . . :.: :..: ::: :: .. ..:...... . : ..: CCDS30 SPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPSNGA 390 400 410 420 430 440 510 520 pF1KB5 CNHVHWYPA-INHYL .. .. :. ..: . CCDS30 FGERQYLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVHMV 450 460 470 480 490 >>CCDS34495.1 TBX18 gene_id:9096|Hs108|chr6 (607 aa) initn: 725 init1: 618 opt: 1210 Z-score: 1111.6 bits: 215.5 E(32554): 1.3e-55 Smith-Waterman score: 1231; 43.2% identity (64.4% similar) in 553 aa overlap (6-502:16-554) 10 20 30 40 pF1KB5 MALSSRARAFSVEALVGRPSKRKLQDP---IQAEQPELR------EKKGG .:.:::::::.: ....:: . ::. . :: CCDS34 MAEKRRGSPCSMLSLKAHAFSVEALIGAEKQQQLQKKRRKLGAEEAAGAVDDGGCSRGGG 10 20 30 40 50 60 50 60 70 80 pF1KB5 EEEEERRSSAAGKSEPLEKQPKTEPSTS-------ASSGC--GSDSGY-----------G :. . : . : . :. : :..:: : ..: : CCDS34 AGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKG 70 80 90 100 110 120 90 100 110 120 130 pF1KB5 NSSESLEEKDIQM--------ELQGSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKGLD . ..:: . . .:::.:::::::.::::::::::::::::..:::..::: CCDS34 SPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLD 130 140 150 160 170 180 140 150 160 170 180 190 pF1KB5 PGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIPRFYVHPDSPCSGETWMRQI : .::..:.:.::::.::::::::::.::::::.: . :: :.::::: ::::::::. CCDS34 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSP-VPPRVYIHPDSPASGETWMRQV 190 200 210 220 230 200 210 220 230 240 250 pF1KB5 ISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQSLPT-EGVKTFSFK ::::..::::::.::.:::::.:::::.::::::.. . ::: :. .:. ::::.::: CCDS34 ISFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFP 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB5 ETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRNRGVLDGLLETYP-WRPSF-TLDFKT :: :::::::::::::.:::.::::::::::.:::: :..:.:.: ::::. :: :. CCDS34 ETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFED 300 310 320 330 340 350 320 330 340 350 360 pF1KB5 F-GADTQSGSSGSSPVTSSG-GAPSPLNSLLS-PLCFSPMFHL-PTSSLGMPCPEAYLPN . : :...:.:. . ..: :.:. ::: : :: ::: :..: . : : CCDS34 IPGIPKQGNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAFHLGPNTS--QLCSLA---- 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB5 VNLPLCYKICPTN--FWQQQPLVLPAPERLASSNSSQSLAPLMME--VPMLSSLGVTNSK : :. : . .. : ........:: : . :: .:. : CCDS34 ---PADYSACARSGLTLNRYSTSLAETYNRLTNQAGETFAPPRTPSYVGVSSSTSVNMSM 420 430 440 450 460 470 430 440 450 460 470 pF1KB5 SGSSEDS-----SDQYLQAPNSTNQMLYGLQSPG-NIFLPNSITPEALSCSF--HPSYDF .:.. :. .. .: . . :. : . ::. : : :. : .. .: : . CCDS34 GGTDGDTFSCPQTSLSMQISGMSPQLQYIMPSPSSNAFATNQ-THQGSYNTFRLHSPCAL 480 490 500 510 520 480 490 500 510 520 pF1KB5 YRYNFSMPSRLISGSNHLKVNDDSQVSFGEGKCNHVHWYPAINHYL : :::: .: .. ... .:: :: CCDS34 YGYNFSTSPKLAASPEKIV---SSQGSFLGSSPSGTMTDRQMLPPVEGVHLLSSGGQQSF 530 540 550 560 570 580 >>CCDS43568.1 TBX20 gene_id:57057|Hs108|chr7 (447 aa) initn: 799 init1: 349 opt: 851 Z-score: 785.5 bits: 154.8 E(32554): 2e-37 Smith-Waterman score: 851; 40.3% identity (65.8% similar) in 409 aa overlap (3-397:11-405) 10 20 30 40 pF1KB5 MALSSRARAFSVEALV---GRPSKRKLQDPIQAEQPELREKKGGEEEEERRS ::::: :::. ::. : :. .. :. . .. ::.. . . . CCDS43 MEFTASPKPQLSSRANAFSIAALMSSGGSKEKEATENTIKPLE-QFVEKSSCAQPLGELT 10 20 30 40 50 50 60 70 80 90 100 pF1KB5 SAAGKSEPLEKQPKTEPSTSASSGCGSDSGYGNSS--ESLEEKDIQMELQGSELWKRFHD : ...: . . ::.: : : .. .. : : : :. .::: .::. CCDS43 SLDAHGE-FGGGSGSSPSSS--SLC-TEPLIPTTPIIPSEEMAKIACSLETKELWDKFHE 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 IGTEMIITKAGRRMFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNT .::::::::.::::::..::. .:.:: .: : .:.::::.:::::.:: :.:.:::.. CCDS43 LGTEMIITKSGRRMFPTIRVSFSGVDPEAKYIVLMDIVPVDNKRYRYAYHRSSWLVAGKA 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB5 DHLCIIP-RFYVHPDSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHV : .: :.::::::: .:: ..:..::...::::::.:..:::::.:::::.::::. CCDS43 DP--PLPARLYVHPDSPFTGEQLLKQMVSFEKVKLTNNELDQHGHIILNSMHKYQPRVHI 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB5 IEQGSSVDLSQIQSLPTEGVKTFSFKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGR :.. . . ... .: .: .:: : :: ::.::::::: ::::::. :::::::::..: CCDS43 IKKKDHT--ASLLNLKSEEFRTFIFPETVFTAVTAYQNQLITKLKIDSNPFAKGFRDSSR 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 NRGVLDGLLETYPWRPSFTLD-FKTFGA--DTQSGSSGSSPVTSSGGAPSP---LNSLLS . .:. . :.. . ..:.:. :. . : ..: .:. . : :.: .: CCDS43 LTDIERESVESLIQKHSYARSPIRTYGGEEDVLGDESQTTPNRGSAFTTSDNLSLSSWVS 300 310 320 330 340 350 350 360 370 380 390 pF1KB5 PLCFSPMFHLPTS--SLGMPCPEAYLPNVNLPLCYKICPTNFWQQQPLVLPAPERLASSN : :. : : .:: : . :. .. : . . ::. : .::: CCDS43 SSSSFPGFQHPQSLTALGTSTASIATP-IPHPIQGSLPPYSRLGM-PLT---PSAIASSM 360 370 380 390 400 400 410 420 430 440 450 pF1KB5 SSQSLAPLMMEVPMLSSLGVTNSKSGSSEDSSDQYLQAPNSTNQMLYGLQSPGNIFLPNS CCDS43 QGSGPTFPSFHMPRYHHYFQQGPYAAIQGLRHSSAVMTPFV 410 420 430 440 >>CCDS13765.1 TBX1 gene_id:6899|Hs108|chr22 (372 aa) initn: 764 init1: 310 opt: 760 Z-score: 703.6 bits: 139.3 E(32554): 7.2e-33 Smith-Waterman score: 770; 43.3% identity (66.2% similar) in 305 aa overlap (51-341:60-356) 30 40 50 60 70 80 pF1KB5 KRKLQDPIQAEQPELREKKGGEEEEERRSSAAGKSEPLEKQPKTEPSTSASSGCGSDSGY : : : . : . . .:.:. . : CCDS13 AASPGADPYGPREPPPPPPRYDPCAAAAPGAPGPPPPPHAYPFAPAAGAATSAAAEPEGP 30 40 50 60 70 80 90 100 110 120 130 pF1KB5 GNSSESLEEKDIQ---------MELQGSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKG : : . . .. ..:. . :: .:...:::::.:::::::::. .::. : CCDS13 GASCAAAAKAPVKKNAKVAGVSVQLEMKALWDEFNQLGTEMIVTKAGRRMFPTFQVKLFG 90 100 110 120 130 140 140 150 160 170 180 190 pF1KB5 LDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIP-RFYVHPDSPCSGETWM .:: .: . .: ::::.:::::..:::.:.:::..: : : . ::::: .: :: CCDS13 MDPMADYMLLMDFVPVDDKRYRYAFHSSSWLVAGKADP--ATPGRVHYHPDSPAKGAQWM 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB5 RQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQSLPTEGVKTFS .::.:::..::::: .::.:::::.:::.:.:: ::. : .. :. ::: CCDS13 KQIVSFDKLKLTNNLLDDNGHIILNSMHRYQPRFHVVYVDPRKDS---EKYAEENFKTFV 210 220 230 240 250 260 260 270 280 290 300 pF1KB5 FKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRN---RGVLDGLLETYPWRPSFTLD :.::.::.::::::..::.::: ::::::::: . :. : : : .:. . CCDS13 FEETRFTAVTAYQNHRITQLKIASNPFAKGFRDCDPEDWPRNHRPGAL---PLMSAFARS 270 280 290 300 310 320 310 320 330 340 350 360 pF1KB5 FKTFGADTQ-SGSSGSSPVTSSGGAPSPLNSLLSPLCFSPMFHLPTSSLGMPCPEAYLPN . .. :: ::. . . .:: :. :. ::.: CCDS13 RNPVASPTQPSGTEKGLVTEGSGLQPGLLDVLLKPPSKKSESLRPPHCKDT 330 340 350 360 370 370 380 390 400 410 420 pF1KB5 VNLPLCYKICPTNFWQQQPLVLPAPERLASSNSSQSLAPLMMEVPMLSSLGVTNSKSGSS >>CCDS31621.1 TBX10 gene_id:347853|Hs108|chr11 (385 aa) initn: 696 init1: 294 opt: 754 Z-score: 697.9 bits: 138.3 E(32554): 1.5e-32 Smith-Waterman score: 770; 41.5% identity (65.2% similar) in 330 aa overlap (57-367:34-353) 30 40 50 60 70 80 pF1KB5 PIQAEQPELREKKGGEEEEERRSSAAGKSEPLEKQPKTEPSTSASSGCGSDSGYGNSSES :. . : : :...... . .: : .. CCDS31 FLSAGLGILAPSETYPLPTTSSGWEPRLGSPFPSGPCT--SSTGAQAVAEPTGQGPKNPR 10 20 30 40 50 60 90 100 110 120 130 140 pF1KB5 LEEKDIQMELQGSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKGLDPGKQYHVAIDVVP . . .:.:.. ::..:...:::::.::::::::: .::. :.: .: . .: .: CCDS31 VSRVTVQLEMK--PLWEEFNQLGTEMIVTKAGRRMFPPFQVKILGMDSLADYALLMDFIP 70 80 90 100 110 150 160 170 180 190 200 pF1KB5 VDSKRYRYVYHSSQWMVAGNTDHLCIIP-RFYVHPDSPCSGETWMRQIISFDRMKLTNNE .:.:::::..::: :.:::..: : : . ::::: .: :::::.:::..::::: CCDS31 LDDKRYRYAFHSSAWLVAGKADP--ATPGRVHFHPDSPAKGAQWMRQIVSFDKLKLTNNL 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB5 MDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQSLPTEGVKTFSFKETEFTTVTAYQNQ .::.:::::.:::.:.:: ::. : . . :. :.: : ::.::.::::::. CCDS31 LDDNGHIILNSMHRYQPRFHVVFVDPRKDSERYAQ---ENFKSFIFTETQFTAVTAYQNH 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB5 QITKLKIERNPFAKGFRDTGRNR-GVLDGLLETYPWRPSFTLDFKTF-GA-DTQSGSSGS .::.::: ::::::::.. . : : . : : .:. .. :: : .. . . CCDS31 RITQLKIASNPFAKGFRESDLDSWPVAPRPLLSVPARSHSSLSPCVLKGATDREKDPNKA 240 250 260 270 280 290 330 340 350 360 pF1KB5 SPVTSSGGA-------PSPLNSLLSPLCFSP-----MFHLPTSSLGMPC--PEAY-LPNV : ::. : : : . ::.: . : .. : ::.: : : :::. CCDS31 SASTSKTPAWLHHQLLPPP-EVLLAPATYRPVTYQSLYSGAPSHLGIPRTRPAPYPLPNI 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB5 NLPLCYKICPTNFWQQQPLVLPAPERLASSNSSQSLAPLMMEVPMLSSLGVTNSKSGSSE CCDS31 RADRDQGGLPLPAGLGLLSPTVVCLGPGQDSQ 360 370 380 >>CCDS13766.1 TBX1 gene_id:6899|Hs108|chr22 (398 aa) initn: 770 init1: 310 opt: 745 Z-score: 689.4 bits: 136.8 E(32554): 4.4e-32 Smith-Waterman score: 755; 40.5% identity (64.0% similar) in 331 aa overlap (51-365:60-381) 30 40 50 60 70 80 pF1KB5 KRKLQDPIQAEQPELREKKGGEEEEERRSSAAGKSEPLEKQPKTEPSTSASSGCGSDSGY : : : . : . . .:.:. . : CCDS13 AASPGADPYGPREPPPPPPRYDPCAAAAPGAPGPPPPPHAYPFAPAAGAATSAAAEPEGP 30 40 50 60 70 80 90 100 110 120 130 pF1KB5 GNSSESLEEKDIQ---------MELQGSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKG : : . . .. ..:. . :: .:...:::::.:::::::::. .::. : CCDS13 GASCAAAAKAPVKKNAKVAGVSVQLEMKALWDEFNQLGTEMIVTKAGRRMFPTFQVKLFG 90 100 110 120 130 140 140 150 160 170 180 190 pF1KB5 LDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIP-RFYVHPDSPCSGETWM .:: .: . .: ::::.:::::..:::.:.:::..: : : . ::::: .: :: CCDS13 MDPMADYMLLMDFVPVDDKRYRYAFHSSSWLVAGKADP--ATPGRVHYHPDSPAKGAQWM 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB5 RQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQSLPTEGVKTFS .::.:::..::::: .::.:::::.:::.:.:: ::. : .. :. ::: CCDS13 KQIVSFDKLKLTNNLLDDNGHIILNSMHRYQPRFHVVYVDPRKDS---EKYAEENFKTFV 210 220 230 240 250 260 260 270 280 290 300 pF1KB5 FKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRN---RGVLDGLLETYPWRPSFTLD :.::.::.::::::..::.::: ::::::::: . :. : : : .:. . CCDS13 FEETRFTAVTAYQNHRITQLKIASNPFAKGFRDCDPEDWPRNHRPGAL---PLMSAFARS 270 280 290 300 310 320 310 320 330 340 350 360 pF1KB5 FKTFGADTQ-SGSSGSSPVTSSGGAPSPLNSLLSPLCFSPMFHLPTS--SLGMPCPEAYL . .. :: ::. .. : .. . . .: .: ... . .::.::: CCDS13 RNPVASPTQPSGTEKGGHVLKDKEVKAE-TSRNTPEREVELLRDAGGCVNLGLPCPAECQ 330 340 350 360 370 380 370 380 390 400 410 420 pF1KB5 PNVNLPLCYKICPTNFWQQQPLVLPAPERLASSNSSQSLAPLMMEVPMLSSLGVTNSKSG : CCDS13 PFNTQGLVAGRTAGDRLC 390 >>CCDS13767.1 TBX1 gene_id:6899|Hs108|chr22 (495 aa) initn: 773 init1: 320 opt: 737 Z-score: 680.7 bits: 135.5 E(32554): 1.4e-31 Smith-Waterman score: 756; 39.7% identity (61.2% similar) in 358 aa overlap (51-371:60-411) 30 40 50 60 70 80 pF1KB5 KRKLQDPIQAEQPELREKKGGEEEEERRSSAAGKSEPLEKQPKTEPSTSASSGCGSDSGY : : : . : . . .:.:. . : CCDS13 AASPGADPYGPREPPPPPPRYDPCAAAAPGAPGPPPPPHAYPFAPAAGAATSAAAEPEGP 30 40 50 60 70 80 90 100 110 120 130 pF1KB5 GNSSESLEEKDIQ---------MELQGSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKG : : . . .. ..:. . :: .:...:::::.:::::::::. .::. : CCDS13 GASCAAAAKAPVKKNAKVAGVSVQLEMKALWDEFNQLGTEMIVTKAGRRMFPTFQVKLFG 90 100 110 120 130 140 140 150 160 170 180 190 pF1KB5 LDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIP-RFYVHPDSPCSGETWM .:: .: . .: ::::.:::::..:::.:.:::..: : : . ::::: .: :: CCDS13 MDPMADYMLLMDFVPVDDKRYRYAFHSSSWLVAGKADP--ATPGRVHYHPDSPAKGAQWM 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB5 RQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQSLPTEGVKTFS .::.:::..::::: .::.:::::.:::.:.:: ::. : .. :. ::: CCDS13 KQIVSFDKLKLTNNLLDDNGHIILNSMHRYQPRFHVVYVDPRKDS---EKYAEENFKTFV 210 220 230 240 250 260 260 270 280 290 pF1KB5 FKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTG-----RNR--GVLDGLLETY----- :.::.::.::::::..::.::: ::::::::: ::. :.: :. .. CCDS13 FEETRFTAVTAYQNHRITQLKIASNPFAKGFRDCDPEDWPRNHRPGALP-LMSAFARSRN 270 280 290 300 310 320 300 310 320 330 340 pF1KB5 ----PWRPSFTL-DFKTFGADTQSGSSGSSPVTSSGGAPSPLNSLLSPLC--------FS : .:: : : . : ..: . . . . :. : .::: . CCDS13 PVASPTQPSGTEKDAAEARREFQRDAGGPAVLGDPAHPPQLLARVLSPSLPGAGGAGGLV 330 340 350 360 370 380 350 360 370 380 390 400 pF1KB5 PMFHLPTSSLGMPCPEAYL--PNVNLPLCYKICPTNFWQQQPLVLPAPERLASSNSSQSL :. : . . : :: : :... :: CCDS13 PLPGAPGGRPSPPNPELRLEAPGASEPLHHHPYKYPAAAYDHYLGAKSRPAPYPLPGLRG 390 400 410 420 430 440 >>CCDS11629.1 TBX4 gene_id:9496|Hs108|chr17 (545 aa) initn: 716 init1: 280 opt: 724 Z-score: 668.2 bits: 133.3 E(32554): 6.7e-31 Smith-Waterman score: 724; 46.0% identity (70.7% similar) in 263 aa overlap (24-284:2-252) 10 20 30 40 50 60 pF1KB5 MALSSRARAFSVEALVGRPSKRKLQDPIQAEQPELREKKGGEEEEERRSSAAGKSEPLEK ::: .:. : . : : .:::. :: CCDS11 MLQDKGLSESEEAFRAPGPALGE---ASAANAPEPALA 10 20 30 70 80 90 100 110 pF1KB5 QPKTEPSTSASS-GCGSDSGYGNSSESLEEKDIQMELQGSELWKRFHDIGTEMIITKAGR : .. .: : :.: . ..:. : .:.. :. .::::.::. ::::::::::: CCDS11 APGLSGAALGSPPGPGADVVAAAAAEQTIE-NIKVGLHEKELWKKFHEAGTEMIITKAGR 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB5 RMFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIP-RFYV ::::: .::: :..: .: . ::.::.:..::.. ...:::::... .: :.:: CCDS11 RMFPSYKVKVTGMNPKTKYILLIDIVPADDHRYKFC--DNKWMVAGKAEP--AMPGRLYV 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB5 HPDSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQI ::::: .: ::::..::...:::::..: :::::.:::::.::.:... .: .. CCDS11 HPDSPATGAHWMRQLVSFQKLKLTNNHLDPFGHIILNSMHKYQPRLHIVK----ADENNA 160 170 180 190 200 240 250 260 270 280 290 pF1KB5 QSLPTEGVKTFSFKETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRNRGVLDGLLETY . . . : : :: : .::.:::..::.:::: :::::::: . CCDS11 FGSKNTAFCTHVFPETSFISVTSYQNHKITQLKIENNPFAKGFRGSDDSDLRVARLQSKE 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB5 PWRPSFTLDFKTFGADTQSGSSGSSPVTSSGGAPSPLNSLLSPLCFSPMFHLPTSSLGMP CCDS11 YPVISKSIMRQRLISPQLSATPDVGPLLGTHQALQHYQHENGAHSQLAEPQDLPLSTFPT 270 280 290 300 310 320 520 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 18:10:44 2016 done: Sat Nov 5 18:10:45 2016 Total Scan time: 3.310 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]