FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9467, 1181 aa 1>>>pF1KB9467 1181 - 1181 aa - 1181 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0111+/-0.00141; mu= 17.9971+/- 0.084 mean_var=67.4040+/-13.382, 0's: 0 Z-trim(99.4): 66 B-trim: 341 in 1/47 Lambda= 0.156218 statistics sampled from 5670 (5734) to 5670 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.515), E-opt: 0.2 (0.176), width: 16 Scan time: 4.590 The best scores are: opt bits E(32554) CCDS3957.1 ITGA2 gene_id:3673|Hs108|chr5 (1181) 7727 1751.6 0 CCDS72869.1 ITGA10 gene_id:8515|Hs108|chr1 (1167) 2280 524.0 8.4e-148 CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188) 2042 470.3 1.2e-131 CCDS76204.1 ITGA10 gene_id:8515|Hs108|chr1 (1024) 1886 435.2 4e-121 CCDS3955.1 ITGA1 gene_id:3672|Hs108|chr5 (1179) 1742 402.7 2.7e-111 CCDS32531.1 ITGAE gene_id:3682|Hs108|chr17 (1179) 1012 238.2 9e-62 CCDS45470.1 ITGAM gene_id:3684|Hs108|chr16 (1152) 907 214.5 1.2e-54 CCDS10711.1 ITGAX gene_id:3687|Hs108|chr16 (1163) 843 200.1 2.6e-50 CCDS67014.1 ITGAX gene_id:3687|Hs108|chr16 (1169) 843 200.1 2.6e-50 CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086) 777 185.2 7.3e-46 CCDS54004.1 ITGAM gene_id:3684|Hs108|chr16 (1153) 777 185.2 7.7e-46 CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170) 769 183.4 2.7e-45 CCDS32438.1 ITGAD gene_id:3681|Hs108|chr16 (1161) 741 177.1 2.2e-43 CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032) 569 138.3 9e-32 CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035) 547 133.4 2.8e-30 CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039) 481 118.5 8.5e-26 CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051) 461 114.0 1.9e-24 CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063) 459 113.5 2.7e-24 CCDS8880.1 ITGA5 gene_id:3678|Hs108|chr12 (1049) 408 102.1 7.7e-21 CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002) 400 100.2 2.6e-20 CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012) 400 100.2 2.6e-20 CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048) 400 100.2 2.7e-20 CCDS34938.1 COL14A1 gene_id:7373|Hs108|chr8 (1796) 275 72.1 1.3e-11 >>CCDS3957.1 ITGA2 gene_id:3673|Hs108|chr5 (1181 aa) initn: 7727 init1: 7727 opt: 7727 Z-score: 9401.5 bits: 1751.6 E(32554): 0 Smith-Waterman score: 7727; 100.0% identity (100.0% similar) in 1181 aa overlap (1-1181:1-1181) 10 20 30 40 50 60 pF1KB9 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 NWLLVGSPWSGFPENRMGDVYKCPVDLSTATCEKLNLQTSTSIPNVTEMKTNMSLGLILT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 NWLLVGSPWSGFPENRMGDVYKCPVDLSTATCEKLNLQTSTSIPNVTEMKTNMSLGLILT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 RNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSLIDVVVVCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 RNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSLIDVVVVCD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 ESNSIYPWDAVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIVATS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 ESNSIYPWDAVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIVATS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 QTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSMLKAVIDQCN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 QTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSMLKAVIDQCN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 HDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTLGEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 HDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTLGEQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 IFSIEGTVQGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSHGHLIFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 IFSIEGTVQGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSHGHLIFP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 KQAFDQILQDRNHSSYLGYSVAAISTGESTHFVAGAPRANYTGQIVLYSVNENGNITVIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 KQAFDQILQDRNHSSYLGYSVAAISTGESTHFVAGAPRANYTGQIVLYSVNENGNITVIQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 AHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTIKEGILGQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 AHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTIKEGILGQH 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 QFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGAVYIYNGHQGTIRTKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 QFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGAVYIYNGHQGTIRTKY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 SQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQSIADVAIEAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 SQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQSIADVAIEAS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 FTPEKITLVNKNAQIILKLCFSAKFRPTKQNNQVAIVYNITLDADGFSSRVTSRGLFKEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 FTPEKITLVNKNAQIILKLCFSAKFRPTKQNNQVAIVYNITLDADGFSSRVTSRGLFKEN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 NERCLQKNMVVNQAQSCPEHIIYIQEPSDVVNSLDLRVDISLENPGTSPALEAYSETAKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 NERCLQKNMVVNQAQSCPEHIIYIQEPSDVVNSLDLRVDISLENPGTSPALEAYSETAKV 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 FSIPFHKDCGEDGLCISDLVLDVRQIPAAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 FSIPFHKDCGEDGLCISDLVLDVRQIPAAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTG 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 IVVDFSENLFFASFSLPVDGTEVTCQVAASQKSVACDVGYPALKREQQVTFTINFDFNLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 IVVDFSENLFFASFSLPVDGTEVTCQVAASQKSVACDVGYPALKREQQVTFTINFDFNLQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 NLQNQASLSFQALSESQEENKADNLVNLKIPLLYDAEIHLTRSTNINFYEISSDGNVPSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 NLQNQASLSFQALSESQEENKADNLVNLKIPLLYDAEIHLTRSTNINFYEISSDGNVPSI 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 VHSFEDVGPKFIFSLKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 VHSFEDVGPKFIFSLKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB9 ADINPLKIGQTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 ADINPLKIGQTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIW 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB9 NGTFASSTFQTVQLTAAAEINTYNPEIYVIEDNTVTIPLMIMKPDEKAEVPTGVIIGSII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 NGTFASSTFQTVQLTAAAEINTYNPEIYVIEDNTVTIPLMIMKPDEKAEVPTGVIIGSII 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 pF1KB9 AGILLLLALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS ::::::::::::::::::::::::::::::::::::::::: CCDS39 AGILLLLALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS 1150 1160 1170 1180 >>CCDS72869.1 ITGA10 gene_id:8515|Hs108|chr1 (1167 aa) initn: 1870 init1: 954 opt: 2280 Z-score: 2767.0 bits: 524.0 E(32554): 8.4e-148 Smith-Waterman score: 2347; 34.8% identity (65.6% similar) in 1186 aa overlap (13-1172:9-1158) 10 20 30 40 50 60 pF1KB9 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG :.: :.. :. : .:. . ..: :: .:::.: : .. CCDS72 MELPFVTHLFLPLVFLTGL---CSPFNLDEHHPRLFPGPPEAEFGYSVLQHVGGGQ 10 20 30 40 50 70 80 90 100 110 pF1KB9 NWLLVGSPWSGFPENRMGDVYKCPVDLS-TATCEKLNLQTSTSIPNVTEMKTNMSLGLIL :.:::.::.: .: ::::.::: . .: : : .: . .. : .. .:: ::. : CCDS72 RWMLVGAPWDGPSGDRRGDVYRCPVGGAHNAPCAKGHLG-DYQLGNSSHPAVNMHLGMSL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 TRNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSLIDVVVVC .. : :::..:.:::.. ::.. ...:.:. .. .:: ..:..:..: ::. .:::.: CCDS72 LETDGDGGFMACAPLWSRACGSSVFSSGICARVDASFQPQGSLAPTAQRCPTYMDVVIVL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 DESNSIYPWDAVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIVAT : :::::::. :..::...: : : : . ::::.::...: ..:. ..::::.. :. CCDS72 DGSNSIYPWSEVQTFLRRLVGKLFIDPEQIQVGLVQYGESPVHEWSLGDFRTKEEVVRAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 SQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSMLKAVIDQC .. :. : :.: ::. : ..: . ::: :....::::::::::: : :.. : CCDS72 KNLSRREGRETKTAQAIMVACTEGFSQSHGGRPEAARLLVVVTDGESHDGEELPAALKAC 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 NHDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTLGE . . :.::::::. : : .....::..::: : ::.::::.::::: . . .::. CCDS72 EAGRVTRYGIAVLGHYLRRQRDPSSFLREIRTIASDPDERFFFNVTDEAALTDIVDALGD 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 QIFSIEGT-VQGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSHGHLI .::..::. ... ..: .::::.:::. .: ...: :::. :.:... :: . CCDS72 RIFGLEGSHAENESSFGLEMSQIGFSTHR--LKDGILFGMVGAYDWGGSVLW-LEGGHRL 360 370 380 390 400 420 430 440 450 460 470 pF1KB9 FP-----KQAFDQILQDRNHSSYLGYSVAAIST-GESTHFVAGAPRANYTGQIVLYSVNE :: .. : :: ::..::::::... : :..:::: . :... ..... CCDS72 FPPRMALEDEFPPALQ--NHAAYLGYSVSSMLLRGGRRLFLSGAPRFRHRGKVIAFQLKK 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB9 NGNITVIQAHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTI .: . : :. .:.:::::::: :: .:.:.: ::::::.:::... .:: ::::.. . CCDS72 DGAVRVAQSLQGEQIGSYFGSELCPLDTDRDGTTDVLLVAAPMFLGPQNKETGRVYVYLV 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB9 KEGILGQHQFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGAVYIYNGH . : : :: ...::: :..:: :.:.::: :: ::.:::. ..::.:.:.: CCDS72 GQQSLLTLQGTLQPEPPQDARFGFAMGALPDLNQDGFADVAVGAPLEDGHQGALYLYHGT 530 540 550 560 570 580 600 610 620 630 640 650 pF1KB9 QGTIRTKYSQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQSI :. .: . .:.: .. .. :.:::::.:: ::.::...::..:: : .. : :. : CCDS72 QSGVRPHPAQRIAAA--SMPHALSYFGRSVDGRLDLDGDDLVDVAVGAQGAAILLSSRPI 590 600 610 620 630 640 660 670 680 690 700 pF1KB9 ADVAIEASFTPEKITLVNKNAQ--------IILKLCFSAKFR-PTKQNNQVAIVYNITLD . .. ::. :..:... . . :::.. : : . ..: . .. .:: CCDS72 VHLTPSLEVTPQAISVVQRDCRRRGQEAVCLTAALCFQVTSRTPGRWDHQFYMRFTASLD 650 660 670 680 690 700 710 720 730 740 750 760 pF1KB9 ADGFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHIIYIQEPSDVVNSLDLRVDISLE ..:.. : .. . : :. . :... .: . ... . :: . . : : ..:. CCDS72 EWTAGARAAFDGSGQRLSPRRLR--LSVGNV-TCEQLHFHVLDTSDYLRPVALTVTFALD 710 720 730 740 750 760 770 780 790 800 810 pF1KB9 N---PGTSPALEAYSETAKVFSIPFHKDCGEDGLCISDLVLDVRQ-IPAAQEQPFIVSNQ : :: :.:. : :. .:: :::: :. :..::::.: . : .... ::.: . CCDS72 NTTKPG--PVLNEGSPTSIQKLVPFSKDCGPDNECVTDLVLQVNMDIRGSRKAPFVVRGG 770 780 790 800 810 820 820 830 840 850 860 870 pF1KB9 NKRLTFSVTLKNKRESAYNTGIVVDFSENLFFASFSLPVDGTEVTCQVAA-SQKSVACDV ... :.::.:..:.::::.. . ::.:: .::.. : . . . :: : .. :.: CCDS72 RRKVLVSTTLENRKENAYNTSLSLIFSRNLHLASLT-PQRESPIKVECAAPSAHARLCSV 830 840 850 860 870 880 890 900 910 920 930 pF1KB9 GYPALKREQQVTFTINFDFNLQNLQNQASLSFQALSESQEENKA--DNLVNLKIPLLYDA :.:... .::: ..:.:. ..: .:. ... : :.: :.: . :: .. . . :. CCDS72 GHPVFQTGAKVTFLLEFEFSCSSLLSQVFVKLTASSDSLERNGTLQDNTAQTSAYIQYEP 880 890 900 910 920 930 940 950 960 970 980 990 pF1KB9 EIHLTRSTNINFYEISSDGNVPSIVHSFEDVGPKFIFSLKVTT-GSVPVSMATVIIHIPQ .. .. .... ::. :..: ::.: .:.: . : :: . .: CCDS72 HLLFSSESTLHRYEVHPYGTLPV------GPGPEFKTTLRVQNLGCYVVSGLIISALLPA 940 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KB9 YTKEKNPLMYLTGVQTDKAGDISCNADINPLKIGQTSSSVSFKSENFRHTKELNCRTASC .. : .. :. : :..:. : : : : . :...::..:: ...: CCDS72 VAHGGNYFLSLSQVITNNASCIVQNLTEPP---GPP-----VHPEELQHTNRLNGSNTQC 1000 1010 1020 1030 1040 1060 1070 1080 1090 1100 1110 pF1KB9 SNVTCWLKDVHMKGEYFVNVTTRIWNGTFASSTFQTVQLTAAAEINTYNPEIY-VIEDNT . : : : .. : :.. . : : . :... .... :..: . . . : . CCDS72 QVVRCHLGQLAKGTEVSVGLLRLVHNEFFRRAKFKSLTVVSTFELGTEEGSVLQLTEASR 1050 1060 1070 1080 1090 1100 1120 1130 1140 1150 1160 1170 pF1KB9 VTIPLMIMKPDEKAEVPTGVIIGSIIAGILLLLALVAILWKLGFFKRKYEKMTKNPDEID . :. . . . ..:::...:.::: :: ::::::: .: : :.: CCDS72 WSESLLEVVQTRPILISLWILIGSVLGGLLLLALLVFCLWKLGFFAHK-----KIPEEEK 1110 1120 1130 1140 1150 1160 1180 pF1KB9 ETTELSS CCDS72 REEKLEQ >>CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188 aa) initn: 1908 init1: 591 opt: 2042 Z-score: 2477.0 bits: 470.3 E(32554): 1.2e-131 Smith-Waterman score: 2471; 35.9% identity (67.2% similar) in 1217 aa overlap (10-1178:4-1188) 10 20 30 40 50 pF1KB9 MGPERTGAAPLPLLLVLALS--QGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINP : :... ::: :. . ..:. . ... : . :::.::: . CCDS45 MDLPRGLVVAWALSLWPGFTD---TFNMDTRKPRVIPGSRTAFFGYTVQQH-DI 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 KGN-WLLVGSPWSGFPENRMGDVYKCPVDLSTATCEKLNLQTSTSIPNVTEMKTNMSLGL .:: ::.::.: .. :::::::: ..: :::: : . ::.: : :: ::: CCDS45 SGNKWLVVGAPLETNGYQKTGDVYKCPV--IHGNCTKLNLGRVT-LSNVSERKDNMRLGL 60 70 80 90 100 120 130 140 150 160 170 pF1KB9 ILTRNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSLIDVVV :. : ..::.:.:::...::..:::::.:: .. .:..: . .:: : : . .:.:. CCDS45 SLATNPKDNSFLACSPLWSHECGSSYYTTGMCSRVNSNFRFSKTVAPALQRCQTYMDIVI 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 VCDESNSIYPWDAVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIV : : ::::::: :..:: .... . ::: . :::..::... :.:: :.. .... CCDS45 VLDGSNSIYPWVEVQHFLINILKKFYIGPGQIQVGVVQYGEDVVHEFHLNDYRSVKDVVE 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB9 ATSQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSMLKAVID :.:. : :: : : .:..::. :.. .:::..: :::.:.:::::::. :. ::. CCDS45 AASHIEQRGGTETRTAFGIEFARSEAFQ--KGGRKGAKKVMIVITDGESHDSPDLEKVIQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB9 QCNHDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTL : ..::. :...::::: :: ... .....::: ::: : ...::::.::::: . . .: CCDS45 QSERDNVTRYAVAVLGYYNRRGINPETFLNEIKYIASDPDDKHFFNVTDEAALKDIVDAL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB9 GEQIFSIEGTVQGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSHGHL :..:::.::: .. .: .::::.:::. .: ..::::::. :.:.....:: :.. CCDS45 GDRIFSLEGTNKNETSFGLEMSQTGFSSHVV--EDGVLLGAVGAYDWNGAVLKETSAGKV 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB9 IFPKQAFDQILQD--RNHSSYLGYSVAAI-STGESTHFVAGAPRANYTGQIVLYSVNENG : .... . . . .::..::::.:... :. .. .:::::: :.::...:.....: CCDS45 IPLRESYLKEFPEELKNHGAYLGYTVTSVVSSRQGRVYVAGAPRFNHTGKVILFTMHNNR 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB9 NITVIQAHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTIKE ..:. :: ::.:::::::: . :::.: : .:::::::::::... .:.:.::.. ... CCDS45 SLTIHQAMRGQQIGSYFGSEITSVDIDGDGVTDVLLVGAPMYFNE-GRERGKVYVYELRQ 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB9 GILGQHQFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGAVYIYNGHQG ... . :. .. .:.::::.::.. :.:.:..:::.::.:::....::.::..: .: CCDS45 NLFVYNGTLKDSHSYQNARFGSSIASVRDLNQDSYNDVVVGAPLEDNHAGAIYIFHGFRG 530 540 550 560 570 580 600 610 620 630 640 650 pF1KB9 TIRTKYSQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQSIAD .: .:.: .:. : . ::::: :. : ::: :.. :...::.:..: :::. ... CCDS45 SILKTPKQRITASELA--TGLQYFGCSIHGQLDLNEDGLIDLAVGALGNAVILWSRPVVQ 590 600 610 620 630 640 660 670 680 690 700 pF1KB9 VAIEASFTPEKITLVNKNAQ--------IILKLCFSAKF-RPTKQNNQVAIVYNITLDAD . : : ::.. ... . . :::. : : :.. :.: :: :.: CCDS45 INASLHFEPSKINIFHRDCKRSGRDATCLAAFLCFTPIFLAPHFQTTTVGIRYNATMDE- 650 660 670 680 690 710 720 730 740 750 760 pF1KB9 GFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHI-IYIQEPSDVVNSLDLRVDISLEN : : :. . :...: .. ......: :.: ... . .: :. . . :. :::. CCDS45 ---RRYTPRAHLDEGGDRFTNRAVLLSSGQELCERINFHVLDTADYVKPVTFSVEYSLED 700 710 720 730 740 750 770 780 790 800 810 pF1KB9 PGTSPALEAYSETAKVFSIPFHKDCGEDGLCISDLVLDVRQ-IPAAQE-------QP--- : .: :. :. :.:: . :.:: :. :::::.:. .:.:.: .: CCDS45 PDHGPMLDDGWPTTLRVSVPFWNGCNEDEHCVPDLVLDARSDLPTAMEYCQRVLRKPAQD 760 770 780 790 800 810 820 830 840 850 pF1KB9 ------------FIVSNQNKRLTFSVTLKNKRESAYNTGIVVDFSENLFFASF--SLPVD ::. . .:.. .::.:. :.::.: . .. : :: :::. . : CCDS45 CSAYTLSFDTTVFIIESTRQRVAVEATLENRGENAYSTVLNISQSANLQFASLIQKEDSD 820 830 840 850 860 870 860 870 880 890 900 910 pF1KB9 GT-EVTCQVAASQKSVACDVGYPALKREQQVTFTINFDFNLQNLQNQASLSFQALSESQE :. : . . ::.: :.:.:: .. . .:.: ..:.:. . . .. . . : :.:.: CCDS45 GSIECVNEERRLQKQV-CNVSYPFFRAKAKVAFRLDFEFSKSIFLHHLEIELAAGSDSNE 880 890 900 910 920 930 920 930 940 950 960 970 pF1KB9 EN--KADNLVNLKIPLLYDAEIHLTRSTNINFYEISSDGNVPSIVHSFEDVGPKF--IFS .. : ::.. :.. : :.:.. .:::.... ::.. . : .. .. .:: : :: CCDS45 RDSTKEDNVAPLRFHLKYEADVLFTRSSSLSHYEVKPN----SSLERYDGIGPPFSCIFR 940 950 960 970 980 990 980 990 1000 1010 1020 1030 pF1KB9 LKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCNADINPLKIGQTSSS .. . : :. . : :: :. : :. : ::.: . ::: : . : CCDS45 IQ-NLGLFPIHGMMMKITIPIATRSGNRLLKLRDFLTDEA-NTSCNIWGNSTEYRPTPVE 1000 1010 1020 1030 1040 1040 1050 1060 1070 1080 1090 pF1KB9 VSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIWNGTFASSTFQTVQL :..:.. .:: ... ...: .. : . : .. .: .. . ...... CCDS45 -----EDLRRAPQLNHSNSDVVSINCNIRLVPNQ-EINFHLLGNLWLRSLKALKYKSMKI 1050 1060 1070 1080 1090 1100 1100 1110 1120 1130 1140 1150 pF1KB9 --TAAAEINTYNPEIYVIEDNTVTIPLMIMKPDEKAEVPTGVIIGSIIAGILLLLALVAI .:: . . ..: :. :: . : . : : .: .:: .:.:: ..:.::: :: CCDS45 MVNAALQRQFHSPFIFREEDPSRQIVFEISK-QEDWQVPIWIIVGSTLGGLLLLALLVLA 1110 1120 1130 1140 1150 1160 1160 1170 1180 pF1KB9 LWKLGFFKRKYEKMTKNPDEIDETTELSS :::::::. .. . : .. : CCDS45 LWKLGFFRSARRRREPGLDPTPKVLE 1170 1180 >>CCDS76204.1 ITGA10 gene_id:8515|Hs108|chr1 (1024 aa) initn: 1513 init1: 597 opt: 1886 Z-score: 2288.1 bits: 435.2 E(32554): 4e-121 Smith-Waterman score: 1953; 34.7% identity (65.2% similar) in 1029 aa overlap (169-1172:19-1015) 140 150 160 170 180 190 pF1KB9 CGNQYYTTGVCSDISPDFQLSASFSPATQPCPSLIDVVVVCDESNSIYPWDAVKNFLEKF ::. .:::.: : :::::::. :..::... CCDS76 MELPFVTHLFLPLVFLTGCPTYMDVVIVLDGSNSIYPWSEVQTFLRRL 10 20 30 40 200 210 220 230 240 250 pF1KB9 VQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIVATSQTSQYGGDLTNTFGAIQY : : : : . ::::.::...: ..:. ..::::.. :... :. : :.: ::. CCDS76 VGKLFIDPEQIQVGLVQYGESPVHEWSLGDFRTKEEVVRAAKNLSRREGRETKTAQAIMV 50 60 70 80 90 100 260 270 280 290 300 310 pF1KB9 ARKYAYSAASGGRRSATKVMVVVTDGESHDGSMLKAVIDQCNHDNILRFGIAVLGYLNRN : ..: . ::: :....::::::::::: : :.. :. . :.::::::. : CCDS76 ACTEGFSQSHGGRPEAARLLVVVTDGESHDGEELPAALKACEAGRVTRYGIAVLGHYLRR 110 120 130 140 150 160 320 330 340 350 360 370 pF1KB9 ALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTLGEQIFSIEGT-VQGGDNFQME : .....::..::: : ::.::::.::::: . . .::..::..::. ... ..: .: CCDS76 QRDPSSFLREIRTIASDPDERFFFNVTDEAALTDIVDALGDRIFGLEGSHAENESSFGLE 170 180 190 200 210 220 380 390 400 410 420 430 pF1KB9 MSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSHGHLIFP-----KQAFDQILQDRN :::.:::. .: ...: :::. :.:... :: .:: .. : :: : CCDS76 MSQIGFSTHR--LKDGILFGMVGAYDWGGSVLW-LEGGHRLFPPRMALEDEFPPALQ--N 230 240 250 260 270 280 440 450 460 470 480 490 pF1KB9 HSSYLGYSVAAIST-GESTHFVAGAPRANYTGQIVLYSVNENGNITVIQAHRGDQIGSYF :..::::::... : :..:::: . :... ......: . : :. .:.:::::: CCDS76 HAAYLGYSVSSMLLRGGRRLFLSGAPRFRHRGKVIAFQLKKDGAVRVAQSLQGEQIGSYF 290 300 310 320 330 340 500 510 520 530 540 550 pF1KB9 GSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTIKEGILGQHQFLEGPEGIEN :: :: .:.:.: ::::::.:::... .:: ::::.. . . : : :: .. CCDS76 GSELCPLDTDRDGTTDVLLVAAPMFLGPQNKETGRVYVYLVGQQSLLTLQGTLQPEPPQD 350 360 370 380 390 400 560 570 580 590 600 610 pF1KB9 TRFGSAIAALSDINMDGFNDVIVGSPLENQNSGAVYIYNGHQGTIRTKYSQKILGSDGAF .::: :..:: :.:.::: :: ::.:::. ..::.:.:.: :. .: . .:.: .. .. CCDS76 ARFGFAMGALPDLNQDGFADVAVGAPLEDGHQGALYLYHGTQSGVRPHPAQRIAAA--SM 410 420 430 440 450 460 620 630 640 650 660 670 pF1KB9 RSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQSIADVAIEASFTPEKITLVNK :.:::::.:: ::.::...::..:: : .. : :. :. .. ::. :..:.. CCDS76 PHALSYFGRSVDGRLDLDGDDLVDVAVGAQGAAILLSSRPIVHLTPSLEVTPQAISVVQR 470 480 490 500 510 520 680 690 700 710 720 pF1KB9 NAQ--------IILKLCFSAKFR-PTKQNNQVAIVYNITLDADGFSSRVTSRGLFKENNE . . . :::.. : : . ..: . .. .:: ..:.. : .. . CCDS76 DCRRRGQEAVCLTAALCFQVTSRTPGRWDHQFYMRFTASLDEWTAGARAAFDGSGQRLSP 530 540 550 560 570 580 730 740 750 760 770 pF1KB9 RCLQKNMVVNQAQSCPEHIIYIQEPSDVVNSLDLRVDISLEN---PGTSPALEAYSETAK : :. . :... .: . ... . :: . . : : ..:.: :: :.:. : :. CCDS76 RRLR--LSVGNV-TCEQLHFHVLDTSDYLRPVALTVTFALDNTTKPG--PVLNEGSPTSI 590 600 610 620 630 780 790 800 810 820 830 pF1KB9 VFSIPFHKDCGEDGLCISDLVLDVRQ-IPAAQEQPFIVSNQNKRLTFSVTLKNKRESAYN .:: :::: :. :..::::.: . : .... ::.: . ... :.::.:..:.::: CCDS76 QKLVPFSKDCGPDNECVTDLVLQVNMDIRGSRKAPFVVRGGRRKVLVSTTLENRKENAYN 640 650 660 670 680 690 840 850 860 870 880 890 pF1KB9 TGIVVDFSENLFFASFSLPVDGTEVTCQVAA-SQKSVACDVGYPALKREQQVTFTINFDF :.. . ::.:: .::.. : . . . :: : .. :.::.:... .::: ..:.: CCDS76 TSLSLIFSRNLHLASLT-PQRESPIKVECAAPSAHARLCSVGHPVFQTGAKVTFLLEFEF 700 710 720 730 740 750 900 910 920 930 940 950 pF1KB9 NLQNLQNQASLSFQALSESQEENKA--DNLVNLKIPLLYDAEIHLTRSTNINFYEISSDG . ..: .:. ... : :.: :.: . :: .. . . :. .. .. .... ::. : CCDS76 SCSSLLSQVFVKLTASSDSLERNGTLQDNTAQTSAYIQYEPHLLFSSESTLHRYEVHPYG 760 770 780 790 800 810 960 970 980 990 1000 1010 pF1KB9 NVPSIVHSFEDVGPKFIFSLKVTT-GSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKA ..: ::.: .:.: . : :: . .: .. : .. :. : :..: CCDS76 TLPV------GPGPEFKTTLRVQNLGCYVVSGLIISALLPAVAHGGNYFLSLSQVITNNA 820 830 840 850 860 1020 1030 1040 1050 1060 1070 pF1KB9 GDISCNADINPLKIGQTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVN . : : : : . :...::..:: ...:. : : : .. : :. CCDS76 SCIVQNLTEPP---GPP-----VHPEELQHTNRLNGSNTQCQVVRCHLGQLAKGTEVSVG 870 880 890 900 910 920 1080 1090 1100 1110 1120 1130 pF1KB9 VTTRIWNGTFASSTFQTVQLTAAAEINTYNPEIY-VIEDNTVTIPLMIMKPDEKAEVPTG . . : : . :... .... :..: . . . : . . :. . . . CCDS76 LLRLVHNEFFRRAKFKSLTVVSTFELGTEEGSVLQLTEASRWSESLLEVVQTRPILISLW 930 940 950 960 970 980 1140 1150 1160 1170 1180 pF1KB9 VIIGSIIAGILLLLALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS ..:::...:.::: :: ::::::: .: : :.: CCDS76 ILIGSVLGGLLLLALLVFCLWKLGFFAHK-----KIPEEEKREEKLEQ 990 1000 1010 1020 >>CCDS3955.1 ITGA1 gene_id:3672|Hs108|chr5 (1179 aa) initn: 1552 init1: 687 opt: 1742 Z-score: 2111.6 bits: 402.7 E(32554): 2.7e-111 Smith-Waterman score: 2902; 40.7% identity (71.6% similar) in 1209 aa overlap (1-1165:1-1175) 10 20 30 40 50 60 pF1KB9 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG :.: : : : . : .: ::...:: . .. :::: ..:::.:::. : .: CCDS39 MAP-RPRARPGVAVACCWLLTVVLRCCVSFNVDVKNSMTFSGPVEDMFGYTVQQYENEEG 10 20 30 40 50 70 80 90 100 110 pF1KB9 NWLLVGSPWSGFPENRMGDVYKCPVDLSTAT-CEKLNLQTSTSIPNVTEMKTNMSLGLIL .:.:.::: : :.:: :::::::: . . : ::.: ..::::::::.: ::..: : CCDS39 KWVLIGSPLVGQPKNRTGDVYKCPVGRGESLPCVKLDLPVNTSIPNVTEVKENMTFGSTL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 TRNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSLIDVVVVC . : .::::.::::.: .::. .::::.:::.:: ::. :..:. : : . .:.:.: CCDS39 VTN-PNGGFLACGPLYAYRCGHLHYTTGICSDVSPTFQVVNSIAPV-QECSTQLDIVIVL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 DESNSIYPWDAVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIVAT : ::::::::.: ::. ... .:::: .::::..::..: :::: :.. ::..::. CCDS39 DGSNSIYPWDSVTAFLNDLLERMDIGPKQTQVGIVQYGENVTHEFNLNKYSSTEEVLVAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 SQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSMLKAVIDQC .. : :: : : .:. ::: :.. : :.::.. ::::.::::::::. :: ::..: CCDS39 KKIVQRGGRQTMTALGIDTARKEAFTEARGARRGVKKVMVIVTDGESHDNHRLKKVIQDC 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 NHDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTLGE . .:: ::.::.:: ::. :.:.....:::.::: :::..::::::: ::. . :::: CCDS39 EDENIQRFSIAILGSYNRGNLSTEKFVEEIKSIASEPTEKHFFNVSDELALVTIVKTLGE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 QIFSIEGTV-QGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIV-QKTSHGHL .::..:.:. :.. .:.:::::.:::: :: .: .:::::::. :.::.: ::.:. . CCDS39 RIFALEATADQSAASFEMEMSQTGFSAHYS--QDWVMLGAVGAYDWNGTVVMQKASQ--I 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB9 IFPKQA-FDQILQDRNH--SSYLGYSV--AAISTGESTHFVAGAPRANYTGQIVLYSVNE :.:... :. .:. .:::::.: :. :.:. . ..:: :: :.:::...: . : CCDS39 IIPRNTTFNVESTKKNEPLASYLGYTVNSATASSGD-VLYIAGQPRYNHTGQVIIYRM-E 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB9 NGNITVIQAHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTI .::: ..:. :.::::::::.: ..:.:::. ::.:::::::::. :.:.:.::.... CCDS39 DGNIKILQTLSGEQIGSYFGSILTTTDIDKDSNTDILLVGAPMYMGTEKEEQGKVYVYAL 480 490 500 510 520 530 540 550 560 570 pF1KB9 KEGILGQHQFLEGPEGI------------EN------TRFGSAIAALSDINMDGFNDVIV .. . .. :: . :: .:::.::::..:.:.:::::... CCDS39 NQTRFEYQMSLEPIKQTCCSSRQHNSCTTENKNEPCGARFGTAIAAVKDLNLDGFNDIVI 540 550 560 570 580 590 580 590 600 610 620 630 pF1KB9 GSPLENQNSGAVYIYNGHQGTIRTKYSQKI-LGSDGAFRSHLQYFGRSLDGYGDLNGDSI :.:::....::::::.: ::: .:.:.: :.:: . :..::.:. : :::::.. CCDS39 GAPLEDDHGGAVYIYHGSGKTIRKEYAQRIPSGGDG---KTLKFFGQSIHGEMDLNGDGL 600 610 620 630 640 640 650 660 670 680 pF1KB9 TDVSIGAFGQVVQLWSQSIADVAIEASFTPEKITLVNKNAQIILK--------LCFSAKF :::.::..: .. .::...: : . .: :.:... .:: .. : .::..:. CCDS39 TDVTIGGLGGAALFWSRDVAVVKVTMNFEPNKVNIQKKNCHMEGKETVCINATVCFDVKL 650 660 670 680 690 700 690 700 710 720 730 740 pF1KB9 RPTKQNN--QVAIVYNITLDADGFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHIIY . .:... .. . : .::: : : ::..:. ..:: .:.:..: ... : .: .: CCDS39 K-SKEDTIYEADLQYRVTLD----SLRQISRSFFSGTQERKVQRNITVRKSE-CTKHSFY 710 720 730 740 750 760 750 760 770 780 790 800 pF1KB9 IQEPSDVVNSLDLRVDISLENPGTSPALEAYSETAKVFSIPFHKDCGEDGLCISDLVLDV . . : .:. . .:..: .: ..:.:. .. ::: ::::. ::::: : CCDS39 MLDKHDFQDSVRITLDFNLTDPENGPVLDDSLPNSVHEYIPFAKDCGNKEKCISDLSL-- 770 780 790 800 810 820 810 820 830 840 850 860 pF1KB9 RQIPAAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTGIVVDFSENLFFASF-SLPVDGTE .. ..... .:: .:: ... :.:.:: ..::::: .: .: :: :... .. : CCDS39 -HVATTEKDLLIVRSQNDKFNVSLTVKNTKDSAYNTRTIVHYSPNLVFSGIEAIQKD--- 830 840 850 860 870 870 880 890 900 910 920 pF1KB9 VTCQVAASQKSVACDVGYPALKREQQVTFTINFDFNLQNLQNQASLSFQALSESQE--EN .:. :.....: :::: :.: ..::: : :.:: . :...... ..: :.:.: :. CCDS39 -SCE---SNHNITCKVGYPFLRRGEMVTFKILFQFNTSYLMENVTIYLSATSDSEEPPET 880 890 900 910 920 930 930 940 950 960 970 pF1KB9 KADNLVNLKIPLLYDAEIHLTRSTNINFYEISSDGNVPSIVHSFEDVGPKF-IFSLKVTT .::.::..::. :.. ... :.. :... .:: ...: ::.: .. :: : . CCDS39 LSDNVVNISIPVKYEVGLQFYSSASEYHISIAANETVPEVINSTEDIGNEINIFYLIRKS 940 950 960 970 980 990 980 990 1000 1010 1020 1030 pF1KB9 GSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCNADI--NPLKIGQTSSSVSF :: :. . : .:..:.. :..: ::..... . .: : .:..:. ...... CCDS39 GSFPMPELKLSISFPNMTSNGYPVLYPTGLSSSE--NANCRPHIFEDPFSIN-SGKKMTT 1000 1010 1020 1030 1040 1040 1050 1060 1070 1080 1090 pF1KB9 KSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIWNGTFASSTFQTVQLTAA ....... :.: : . ...:: : . .. :::. .:. :: .: :....:: CCDS39 STDHLKRGTILDCNTCKFATITCNLTSSDISQ---VNVSLILWKPTFIKSYFSSLNLTIR 1050 1060 1070 1080 1090 1100 1100 1110 1120 1130 1140 1150 pF1KB9 AEINTYNPEIYVIEDNTVT-IPLMIMKPDEKAEVPTGVIIGSIIAGILLLLALVAILWKL .:. . : . . .: . ..: : ..:: ::. : .::.:::. :. :::. CCDS39 GELRSENASLVLSSSNQKRELAIQISKDGLPGRVPLWVILLSAFAGLLLLMLLILALWKI 1110 1120 1130 1140 1150 1160 1160 1170 1180 pF1KB9 GFFKRKYEKMTKNPDEIDETTELSS ::::: .: CCDS39 GFFKRPLKKKMEK 1170 >>CCDS32531.1 ITGAE gene_id:3682|Hs108|chr17 (1179 aa) initn: 810 init1: 280 opt: 1012 Z-score: 1222.5 bits: 238.2 E(32554): 9e-62 Smith-Waterman score: 1161; 27.8% identity (60.7% similar) in 1031 aa overlap (174-1166:202-1159) 150 160 170 180 190 200 pF1KB9 YTTGVCSDISPDFQLSASFSPATQPCPSLIDVVVVCDESNSIYPWD--AVKNFLEKFVQG ..... : :.:: : : .:.:. ..... CCDS32 NTARQRRALEKEEEEDKEEEEDEEEEEAGTEIAIILDGSGSIDPPDFQRAKDFISNMMRN 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB9 LDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIVATSQTSQYGGDLTNTFGAIQYARK . . . .:.::.. .. :.: . .. ... .: :. .:.: .:.:.. CCDS32 FYEKCFECNFALVQYGGVIQTEFDLRDSQDVMASLARVQNITQVGS-VTKTASAMQHVLD 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB9 YAYSAASGGRRSATKVMVVVTDGESHDGSM-LKAVIDQCNHDNILRFGIAVLGYLNRNAL .... :.::.:.:::::.::: . . : .::.. . ... ::.:.: : . . CCDS32 SIFTSSHGSRRKASKVMVVLTDGGIFEDPLNLTTVINSPKMQGVERFAIGV-G----EEF 300 310 320 330 340 330 340 350 360 370 380 pF1KB9 DTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAGTLGEQIFSIEGTVQGGDNFQMEMSQ . .:.. ::: : : . :.:.. :: . : .:.:.:::: :: ......: CCDS32 KSARTARELNLIASDPDETHAFKVTNYMALDGLLSKLRYNIISMEGTV--GDALHYQLAQ 350 360 370 380 390 400 390 400 410 420 430 pF1KB9 VGFSADYSSQNDILMLGAVGAFGWSGTIV---QKTSHGHLIFPKQAFDQILQDRNHSSYL .::::. .. ..: ::::::: ::: . .. .:... . : . . ::: CCDS32 IGFSAQILDERQVL-LGAVGAFDWSGGALLYDTRSRRGRFL-NQTAAAAADAEAAQYSYL 410 420 430 440 450 460 440 450 460 470 480 490 pF1KB9 GYSVAAISTGESTHFVAGAPRANYTGQIVLYSVNENG-NITVIQAHRGDQIGSYFGSVLC ::.::.. : ..::::: .. : . . ....: . . . . .:.:.:::::: :: CCDS32 GYAVAVLHKTCSLSYIAGAPRYKHHGAV--FELQKEGREASFLPVLEGEQMGSYFGSELC 470 480 490 500 510 500 510 520 530 540 550 pF1KB9 SVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTIKE--GILGQHQFLEGPEGIENTRF ::.: : :: :::.::.: .. ::::::.. ..: : .. ..: : :. :.:: CCDS32 PVDIDMDGSTDFLLVAAPFYH--VHGEEGRVYVYRLSEQDGSFSLARILSGHPGFTNARF 520 530 540 550 560 570 560 570 580 590 600 pF1KB9 GSAIAALSDINMDGFNDVIVGSPLENQNS------GAVYIYNGHQGTIRTKYSQKILGSD : :.::..:...: ..:: .:.:::. .. :.::::::: . .. ::.: .: CCDS32 GFAMAAMGDLSQDKLTDVAIGAPLEGFGADDGASFGSVYIYNGHWDGLSASPSQRIRAST 580 590 600 610 620 630 610 620 630 640 650 660 pF1KB9 GAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQSIADVAIEASFTPEKITL : ::::: :. : :..::...:...:..::.: . :. .. . . .::: . CCDS32 VA--PGLQYFGMSMAGGFDISGDGLADITVGTLGQAVVFRSRPVVRLKVSMAFTPSALP- 640 650 660 670 680 690 670 680 690 700 710 720 pF1KB9 VNKNAQIILKLCFSAKFRPTKQNNQV-AIVYNITLDADGFSSRVTSRGLFKENNERCLQK .. :. . ..::: . : ... . . :.:::.: ..: : : . . :: CCDS32 IGFNGVVNVRLCFEISSVTTASESGLREALLNFTLDVDVGKQR---RRLQCSDVRSCLGC 700 710 720 730 740 750 730 740 750 760 770 pF1KB9 -NMVVNQAQSCPEHIIYIQE----PSDVVNSLDLRVDISLENP-GTS----PALEAYSET . .: : . ... : : .. ...:. .:..: : . : :. :.: CCDS32 LREWSSGSQLCEDLLLMPTEGELCEEDCFSNASVKVSYQLQTPEGQTDHPQPILDRYTEP 760 770 780 790 800 810 780 790 800 810 820 830 pF1KB9 AKVFSIPFHKDCGEDGLCISDLVLDVRQIPAAQEQPFIVSNQNKRLTFSVTLKNKRESAY .:..:..: : . .:...: :. .. : .: . .:.::....: :. :..: CCDS32 FAIFQLPYEKACKNKLFCVAEL-----QLATTVSQQELVVGLTKELTLNINLTNSGEDSY 820 830 840 850 860 840 850 860 870 880 890 pF1KB9 NTGIVVDFSENLFFASFSLPVDGTEVTC---QVAASQKSVACDVGYPALKREQQVTFTIN :...... .:: . .. : . .. : : .:: . : .:.:.::: ... .. CCDS32 MTSMALNYPRNLQLKRMQKP-PSPNIQCDDPQPVASVLIMNCRIGHPVLKR-SSAHVSVV 870 880 890 900 910 920 900 910 920 930 940 950 pF1KB9 FDFNLQNLQNQASLSFQALSESQEENKADNLVNLKIPLLYDAEIHLTRSTNINFYEISSD .... . . :... ....:.:. . : : : . . .: . : CCDS32 WQLEENAFPNRTADITVTVTNSNERRSLAN------------ETHTLQFRH-GFVAVLSK 930 940 950 960 970 960 970 980 990 1000 1010 pF1KB9 GNVPSI--VHSFEDVGPKFIFSLKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTD ::: :.. . .. . : ..: .. . . : .: :: : :.:. CCDS32 ---PSIMYVNTGQGLSHHKEFLFHVHGENLFGAEYQLQICVP--TK-------LRGLQV- 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KB9 KAGDISCNADINPLKIGQTSSSVSFKSENFRHTKELNCRTASCSNVTCW--LKDVHMKGE . .. : :.:. .. ..: : .: ..: : .. : . . CCDS32 --------VAVKKLTRTQASTVCTW-------SQERACAYSSVQHVEEWHSVSCVIASDK 1020 1030 1040 1050 1060 1080 1090 1100 1110 1120 pF1KB9 YFVNVTTRI-WNGTFASSTFQTV-QLTAAAEINTYNPEIYV---IEDNTVTIPLMIMKPD :.:...: :. . .. : .: .:: ..: .: :.. . : ....: . CCDS32 ENVTVAAEISWD--HSEELLKDVTELQILGEI-SFNKSLYEGLNAENHRTKITVVFLKDE 1070 1080 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 pF1KB9 EKAEVPTGVIIGSIIAGILLLLALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS . .: .:: . ..:.:.:.....::.: :::::::... CCDS32 KYHSLP--IIIKGSVGGLLVLIVILVILFKCGFFKRKYQQLNLESIRKAQLKSENLLEEE 1130 1140 1150 1160 1170 CCDS32 N >>CCDS45470.1 ITGAM gene_id:3684|Hs108|chr16 (1152 aa) initn: 844 init1: 286 opt: 907 Z-score: 1094.8 bits: 214.5 E(32554): 1.2e-54 Smith-Waterman score: 1419; 28.4% identity (61.1% similar) in 1207 aa overlap (14-1166:3-1140) 10 20 30 40 50 60 pF1KB9 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG : :: :. :. : ..:. .: :. ... :: .: :. .: CCDS45 MALRVLLLT--ALTLCHGFNLDTENAMTFQ-ENARGFGQSVVQL---QG 10 20 30 40 70 80 90 100 110 120 pF1KB9 NWLLVGSPWSGFPENRMGDVYKCPVDLSTATCEKLNLQTSTSIPNVTEMKTNMSLGLILT . ..::.: :. :..:.: : ::..:: . :: .: .: .:::::: :. CCDS45 SRVVVGAPQEIVAANQRGSLYQC--DYSTGSCEPIRLQ----VP--VEA-VNMSLGLSLA 50 60 70 80 90 130 140 150 160 170 pF1KB9 RNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDF-QLSASFSPATQPCPSL-IDVVVV . . .:.::: : :... :. :.: .. .. : .: : . ::. :.. . CCDS45 ATTSPPQLLACGPTVHQTCSENTYVKGLCFLFGSNLRQQPQKFPEALRGCPQEDSDIAFL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB9 CDESNSIYPWD--AVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMI : :.:: : : .:.:. .. : .:: .:.::... :. :... .... . CCDS45 IDGSGSIIPHDFRRMKEFVSTVMEQLK--KSKTLFSLMQYSEEFRIHFTFKEFQNNPNPR 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB9 VATSQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSM-LKAV .. .: : :.: .:. . . .. ..:.:..: :..::.::::. . . : CCDS45 SLVKPITQLLGR-THTATGIRKVVRELFNITNGARKNAFKILVVITDGEKFGDPLGYEDV 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB9 IDQCNHDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAG : . ......:. :.: : .:. ... .:...::: : . . :.:.. :: . CCDS45 IPEADREGVIRYVIGV-G----DAFRSEKSRQELNTIASKPPRDHVFQVNNFEALKTIQN 280 290 300 310 320 360 370 380 390 400 410 pF1KB9 TLGEQIFSIEGTVQGGDN-FQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSH : :.::.:::: :... :. :::: :::: .:.. .:..::.. :.: . ::. CCDS45 QLREKIFAIEGTQTGSSSSFEHEMSQEGFSAAITSNGP--LLSTVGSYDWAGGVFLYTSK 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB9 GHLIFPKQAFDQILQDRNHSSYLGYSVAAISTGESTHFVAGAPRANYTGQIVLYSVNENG . : ... .. .: : ..::::..: : .. .: :::: .. : .... : .: CCDS45 EKSTFINMT--RVDSDMN-DAYLGYAAAIILRNRVQSLVLGAPRYQHIGLVAMFRQN-TG 390 400 410 420 430 440 480 490 500 510 520 530 pF1KB9 NITVIQAHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRVYLFTIKE .: :::.:::. :::::::.. ::..:.::: :. . . :.: . . . CCDS45 MWESNANVKGTQIGAYFGASLCSVDVDSNGSTDLVLIGAPHYYEQTRG--GQVSVCPLPR 450 460 470 480 490 540 550 560 570 580 590 pF1KB9 GILGQH--QFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGAVYIYNGH : . : : .: :::.:...:.:.: : ..:: .:.: :..: ::::...: CCDS45 GRARWQCDAVLYGEQGQPWGRFGAALTVLGDVNGDKLTDVAIGAPGEEDNRGAVYLFHGT 500 510 520 530 540 550 600 610 620 630 640 650 pF1KB9 QGT-IRTKYSQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQVVQLWSQS .:. : ..::.: :: . : :::::.::.: ::. :...:...:: :.:. : :: CCDS45 SGSGISPSHSQRIAGSKLSPR--LQYFGQSLSGGQDLTMDGLVDLTVGAQGHVLLLRSQP 560 570 580 590 600 610 660 670 680 690 pF1KB9 IADVAIEASFTPEKIT--LVNKNAQII-------LKLCF----SAKFRPTKQNNQVAIVY . : :.:.... . . : :.. ...:. :.. : . . : ...: CCDS45 VLRVKAIMEFNPREVARNVFECNDQVVKGKEAGEVRVCLHVQKSTRDRLREGQIQSVVTY 620 630 640 650 660 670 700 710 720 730 740 750 pF1KB9 NITLDADGFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHIIYIQEPS---DVVNSLD ...:: :.: ::..:.:... ....:.. .:.: . . .: :. : :. . CCDS45 DLALD----SGRPHSRAVFNETKNSTRRQTQVLGLTQTC--ETLKLQLPNCIEDPVSPIV 680 690 700 710 720 730 760 770 780 790 800 pF1KB9 LRVDISLENPGTS------PALEAYSETAKVFS--IPFHKDCGEDGLCISDLVLDVRQIP ::...:: . : :.: .. ..:. .::.:.::.:..: .:: . CCDS45 LRLNFSLVGTPLSAFGNLRPVLA--EDAQRLFTALFPFEKNCGNDNICQDDLSITF---- 740 750 760 770 780 810 820 830 840 850 860 pF1KB9 AAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTGIVVDFSENLFFASFS-LPVDGTE---- . . .: . .... .::..: :..: : .. : .: . . : : . .. CCDS45 SFMSLDCLVVGGPREFNVTVTVRNDGEDSYRTQVTFFFPLDLSYRKVSTLQNQRSQRSWR 790 800 810 820 830 840 870 880 890 900 910 pF1KB9 VTCQVAASQ------KSVACDVGYPALKREQQVTFTINFDFNLQ-NLQNQASLSFQALSE ..:. :.: ::..:....: . ....:::.:.:: . . .: :. :. .. :: CCDS45 LACESASSTEVSGALKSTSCSINHPIFPENSEVTFNITFDVDSKASLGNKLLLKANVTSE 850 860 870 880 890 900 920 930 940 950 960 970 pF1KB9 SQEENKADNLVNLKIPLLYDAEIHLT-RSTNINFYEISSDGNVPSIV-HSFE--DVGPKF .. . .:..:. : . . .: .... .. ..... :. .. :... ..: . CCDS45 NNMPRTNKTEFQLELPVKYAVYMVVTSHGVSTKYLNFTASENTSRVMQHQYQVSNLGQR- 910 920 930 940 950 960 980 990 1000 1010 1020 pF1KB9 IFSLKVT-TGSVPVSMA-TVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCNADINPLKIG :: .. . ::: . ::: :: : .: :.. .:.. CCDS45 --SLPISLVFLVPVRLNQTVIWDRPQVTFSEN----LSS---------TCHTK------E 970 980 990 1000 1030 1040 1050 1060 1070 1080 pF1KB9 QTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIWNGTFASSTF . : .: .: .:.. .:: : :. . : . .. :. ... . . ... CCDS45 RLPSHSDFLAE-LRKAPVVNCSIAVCQRIQCDIPFFGIQEEFNATLKGNLSFDWYIKTSH 1010 1020 1030 1040 1050 1060 1090 1100 1110 1120 1130 1140 pF1KB9 QTVQLTAAAEINTYNPEIY-VIEDNTVTIPLMIMKPDEKAEVPTGV--IIGSIIAGILLL . . ....::: .: .. .. . . . . : :::. . :.:: ..:.::: CCDS45 NHLLIVSTAEI-LFNDSVFTLLPGQGAFVRSQTETKVEPFEVPNPLPLIVGSSVGGLLLL 1070 1080 1090 1100 1110 1120 1150 1160 1170 1180 pF1KB9 LALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS ..: :.:::::::.:. : CCDS45 ALITAALYKLGFFKRQYKDMMSEGGPPGAEPQ 1130 1140 1150 >>CCDS10711.1 ITGAX gene_id:3687|Hs108|chr16 (1163 aa) initn: 886 init1: 277 opt: 843 Z-score: 1016.7 bits: 200.1 E(32554): 2.6e-50 Smith-Waterman score: 1410; 28.9% identity (59.5% similar) in 1223 aa overlap (5-1171:3-1145) 10 20 30 40 50 60 pF1KB9 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG :: :: ::: ::. . :..:. : : .: :: .: :. : CCDS10 MTRTRAA---LLLFTALATS-----LGFNLDTEELTAFR-VDSAGFGDSVVQYAN--- 10 20 30 40 70 80 90 100 110 120 pF1KB9 NWLLVGSPWSGFPENRMGDVYKCPVDLSTATCEKLNLQTSTSIPNVTEMKTNMSLGLILT .:..::.: . :. : .:.: ::..:: ..:: .: .:::::: :. CCDS10 SWVVVGAPQKITAANQTGGLYQC--GYSTGACEPIGLQ----VP---PEAVNMSLGLSLA 50 60 70 80 90 130 140 150 160 170 pF1KB9 RNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSL-IDVVVVC . . . .:.::: ..:: ..: ::.: ..: ::. . . : :: :.: . CCDS10 STTSPSQLLACGPTVHHECGRNMYLTGLCFLLGPT-QLTQRLPVSRQECPRQEQDIVFLI 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB9 DESNSIYPWD--AVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIV : :.:: . .. ::.. .. .. :. :: .:.:..:. .. :... .. . . . CCDS10 DGSGSISSRNFATMMNFVRAVISQFQ-RPS-TQFSLMQFSNKFQTHFTFEEFRRSSNPLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB9 ATSQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSM-LKAVI ... : : .: : ::: . . . :. :.::.:.:...:.:::... :. : :: CCDS10 LLASVHQLQG-FTYTATAIQNVVHRLFHASYGARRDAAKILIVITDGKKEGDSLDYKDVI 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB9 DQCNHDNILRFGIAV-LGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAG . . .:.:..:.: :.. :::. ::.. ::: :.....:.: : :: . . CCDS10 PMADAAGIIRYAIGVGLAFQNRNSW------KELNDIASKPSQEHIFKVEDFDALKDIQN 280 290 300 310 320 360 370 380 390 400 410 pF1KB9 TLGEQIFSIEGT-VQGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSH : :.::.:::: . ....:..::.: :::: .. .. . :::::.: ::: CCDS10 QLKEKIFAIEGTETTSSSSFELEMAQEGFSAVFTPDGPV--LGAVGSFTWSG-------- 330 340 350 360 370 420 430 440 450 460 pF1KB9 GHLIFPKQ---AFDQILQDR--NHSSYLGYSVA-AISTGESTHFVAGAPRANYTGQIVLY : ...: . .: .. :. ..::::::. :. : .. .: :::: ..::. :.. CCDS10 GAFLYPPNMSPTFINMSQENVDMRDSYLGYSTELALWKGVQS-LVLGAPRYQHTGKAVIF 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB9 SVNENGNITVIQAH-RGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRV . . . ..:. : :::::::. :::::::.: ::..:.::: :. . . :.: CCDS10 T--QVSRQWRMKAEVTGTQIGSYFGASLCSVDVDSDGSTDLVLIGAPHYYEQTRG--GQV 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB9 YLFTIKEGILGQ--HQFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGA . . .: : : .: :::.:...:.:.: : ..::..:.: :..: :: CCDS10 SVCPLPRGWRRWWCDAVLYGEQGHPWGRFGAALTVLGDVNGDKLTDVVIGAPGEEENRGA 500 510 520 530 540 550 590 600 610 620 630 640 pF1KB9 VYIYNGHQG-TIRTKYSQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQV ::...: : .: ..::.: ::. . :.:::::..:.: ::. :...:...:: ::: CCDS10 VYLFHGVLGPSISPSHSQRIAGSQ--LSSRLQYFGQALSGGQDLTQDGLVDLAVGARGQV 560 570 580 590 600 610 650 660 670 680 690 pF1KB9 VQLWSQSIADVAIEASFTPEKIT---------LVNKNAQIILKLCFSAKFRPTKQNNQVA . : .. . :.. .: : .: .:.... . ..:. : . .. CCDS10 LLLRTRPVLWVGVSMQFIPAEIPRSAFECREQVVSEQTLVQSNICLYIDKRSKNLLGSRD 620 630 640 650 660 670 700 710 720 730 740 750 pF1KB9 IVYNITLDADGFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHIIYIQEPS---DVVN . ..::: .:.. :. :.:...: :.. :.. : . . . :: : :. CCDS10 LQSSVTLDLALDPGRLSPRATFQETKNRSLSRVRVLGLKAHCENFNLLL--PSCVEDSVT 680 690 700 710 720 760 770 780 790 800 pF1KB9 SLDLRVDISLEN-P-----GTSPALEAYSETAKVFSIPFHKDCGEDGLCISDLVLDVRQI . ::....: . : . : : : .. . :.::.:.:: : .: ..: .. .. CCDS10 PITLRLNFTLVGKPLLAFRNLRPMLAADAQRYFTASLPFEKNCGADHICQDNLGISF-SF 730 740 750 760 770 780 810 820 830 840 850 860 pF1KB9 PAAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTGIVVDFSENLFFASFSLPVDGTE---- :. . .. ..: .:. : . : :..:.: :. . .: :. ..: . CCDS10 PGLKS---LLVGSNLELNAEVMVWNDGEDSYGTTITFSHPAGL---SYRYVAEGQKQGQL 790 800 810 820 830 840 870 880 890 900 910 pF1KB9 ----VTCQVA--ASQK--SVACDVGYPALKREQQVTFTINFDFNLQN-LQNQASLSFQAL .::. : .:: :..: ... .. :.:: .:: . . : .. :. .. CCDS10 RSLHLTCDSAPVGSQGTWSTSCRINHLIFRGGAQITFLATFDVSPKAVLGDRLLLTANVS 850 860 870 880 890 900 920 930 940 950 960 pF1KB9 SESQEENKADNLVNLKIPLLYDAEI----HLTRSTNINFYEISSDGNVPSIVHSFE--DV ::.. . . .:..:. : . : . .:: : : . . .: .. .. CCDS10 SENNTPRTSKTTFQLELPVKYAVYTVVSSHEQFTKYLNFSE-SEEKESHVAMHRYQVNNL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 GPKFIFSLKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCNADINPLK : . ..:::. . .: ... : . :. . .. :... : CCDS10 GQR----------DLPVSIN---FWVPVELNQEAVWMDVE-VSHPQNPSLRCSSE----K 970 980 990 1000 1030 1040 1050 1060 1070 1080 pF1KB9 IGQTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIWNGTFASS :. .: .: . ..... :.: :.: : . . .. : .. . : . CCDS10 IAPPAS--DFLA-HIQKNPVLDCSIAGCLRFRCDVPSFSVQEELDFTLKGNLSFGWVRQI 1010 1020 1030 1040 1050 1090 1100 1110 1120 1130 1140 pF1KB9 TFQTVQLTAAAEINTYNPEIYV-IEDNTVTIPLMIMKPDEKAEV--PTGVIIGSIIAGIL . :.....::: :.. .: . . . . . :: .: :: .:.:: :.:.: CCDS10 LQKKVSVVSVAEI-TFDTSVYSQLPGQEAFMRAQTTTVLEKYKVHNPTPLIVGSSIGGLL 1060 1070 1080 1090 1100 1110 1150 1160 1170 1180 pF1KB9 LLLALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS :: ..:.:.:.:::::.:..: .. . CCDS10 LLALITAVLYKVGFFKRQYKEMMEEANGQIAPENGTQTPSPPSEK 1120 1130 1140 1150 1160 >>CCDS67014.1 ITGAX gene_id:3687|Hs108|chr16 (1169 aa) initn: 886 init1: 277 opt: 843 Z-score: 1016.7 bits: 200.1 E(32554): 2.6e-50 Smith-Waterman score: 1410; 28.9% identity (59.5% similar) in 1223 aa overlap (5-1171:3-1145) 10 20 30 40 50 60 pF1KB9 MGPERTGAAPLPLLLVLALSQGILNCCLAYNVGLPEAKIFSGPSSEQFGYAVQQFINPKG :: :: ::: ::. . :..:. : : .: :: .: :. : CCDS67 MTRTRAA---LLLFTALATS-----LGFNLDTEELTAFR-VDSAGFGDSVVQYAN--- 10 20 30 40 70 80 90 100 110 120 pF1KB9 NWLLVGSPWSGFPENRMGDVYKCPVDLSTATCEKLNLQTSTSIPNVTEMKTNMSLGLILT .:..::.: . :. : .:.: ::..:: ..:: .: .:::::: :. CCDS67 SWVVVGAPQKITAANQTGGLYQC--GYSTGACEPIGLQ----VP---PEAVNMSLGLSLA 50 60 70 80 90 130 140 150 160 170 pF1KB9 RNMGTGGFLTCGPLWAQQCGNQYYTTGVCSDISPDFQLSASFSPATQPCPSL-IDVVVVC . . . .:.::: ..:: ..: ::.: ..: ::. . . : :: :.: . CCDS67 STTSPSQLLACGPTVHHECGRNMYLTGLCFLLGPT-QLTQRLPVSRQECPRQEQDIVFLI 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB9 DESNSIYPWD--AVKNFLEKFVQGLDIGPTKTQVGLIQYANNPRVVFNLNTYKTKEEMIV : :.:: . .. ::.. .. .. :. :: .:.:..:. .. :... .. . . . CCDS67 DGSGSISSRNFATMMNFVRAVISQFQ-RPS-TQFSLMQFSNKFQTHFTFEEFRRSSNPLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB9 ATSQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMVVVTDGESHDGSM-LKAVI ... : : .: : ::: . . . :. :.::.:.:...:.:::... :. : :: CCDS67 LLASVHQLQG-FTYTATAIQNVVHRLFHASYGARRDAAKILIVITDGKKEGDSLDYKDVI 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB9 DQCNHDNILRFGIAV-LGYLNRNALDTKNLIKEIKAIASIPTERYFFNVSDEAALLEKAG . . .:.:..:.: :.. :::. ::.. ::: :.....:.: : :: . . CCDS67 PMADAAGIIRYAIGVGLAFQNRNSW------KELNDIASKPSQEHIFKVEDFDALKDIQN 280 290 300 310 320 360 370 380 390 400 410 pF1KB9 TLGEQIFSIEGT-VQGGDNFQMEMSQVGFSADYSSQNDILMLGAVGAFGWSGTIVQKTSH : :.::.:::: . ....:..::.: :::: .. .. . :::::.: ::: CCDS67 QLKEKIFAIEGTETTSSSSFELEMAQEGFSAVFTPDGPV--LGAVGSFTWSG-------- 330 340 350 360 370 420 430 440 450 460 pF1KB9 GHLIFPKQ---AFDQILQDR--NHSSYLGYSVA-AISTGESTHFVAGAPRANYTGQIVLY : ...: . .: .. :. ..::::::. :. : .. .: :::: ..::. :.. CCDS67 GAFLYPPNMSPTFINMSQENVDMRDSYLGYSTELALWKGVQS-LVLGAPRYQHTGKAVIF 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB9 SVNENGNITVIQAH-RGDQIGSYFGSVLCSVDVDKDTITDVLLVGAPMYMSDLKKEEGRV . . . ..:. : :::::::. :::::::.: ::..:.::: :. . . :.: CCDS67 T--QVSRQWRMKAEVTGTQIGSYFGASLCSVDVDSDGSTDLVLIGAPHYYEQTRG--GQV 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB9 YLFTIKEGILGQ--HQFLEGPEGIENTRFGSAIAALSDINMDGFNDVIVGSPLENQNSGA . . .: : : .: :::.:...:.:.: : ..::..:.: :..: :: CCDS67 SVCPLPRGWRRWWCDAVLYGEQGHPWGRFGAALTVLGDVNGDKLTDVVIGAPGEEENRGA 500 510 520 530 540 550 590 600 610 620 630 640 pF1KB9 VYIYNGHQG-TIRTKYSQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSITDVSIGAFGQV ::...: : .: ..::.: ::. . :.:::::..:.: ::. :...:...:: ::: CCDS67 VYLFHGVLGPSISPSHSQRIAGSQ--LSSRLQYFGQALSGGQDLTQDGLVDLAVGARGQV 560 570 580 590 600 610 650 660 670 680 690 pF1KB9 VQLWSQSIADVAIEASFTPEKIT---------LVNKNAQIILKLCFSAKFRPTKQNNQVA . : .. . :.. .: : .: .:.... . ..:. : . .. CCDS67 LLLRTRPVLWVGVSMQFIPAEIPRSAFECREQVVSEQTLVQSNICLYIDKRSKNLLGSRD 620 630 640 650 660 670 700 710 720 730 740 750 pF1KB9 IVYNITLDADGFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHIIYIQEPS---DVVN . ..::: .:.. :. :.:...: :.. :.. : . . . :: : :. CCDS67 LQSSVTLDLALDPGRLSPRATFQETKNRSLSRVRVLGLKAHCENFNLLL--PSCVEDSVT 680 690 700 710 720 760 770 780 790 800 pF1KB9 SLDLRVDISLEN-P-----GTSPALEAYSETAKVFSIPFHKDCGEDGLCISDLVLDVRQI . ::....: . : . : : : .. . :.::.:.:: : .: ..: .. .. CCDS67 PITLRLNFTLVGKPLLAFRNLRPMLAADAQRYFTASLPFEKNCGADHICQDNLGISF-SF 730 740 750 760 770 780 810 820 830 840 850 860 pF1KB9 PAAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTGIVVDFSENLFFASFSLPVDGTE---- :. . .. ..: .:. : . : :..:.: :. . .: :. ..: . CCDS67 PGLKS---LLVGSNLELNAEVMVWNDGEDSYGTTITFSHPAGL---SYRYVAEGQKQGQL 790 800 810 820 830 840 870 880 890 900 910 pF1KB9 ----VTCQVA--ASQK--SVACDVGYPALKREQQVTFTINFDFNLQN-LQNQASLSFQAL .::. : .:: :..: ... .. :.:: .:: . . : .. :. .. CCDS67 RSLHLTCDSAPVGSQGTWSTSCRINHLIFRGGAQITFLATFDVSPKAVLGDRLLLTANVS 850 860 870 880 890 900 920 930 940 950 960 pF1KB9 SESQEENKADNLVNLKIPLLYDAEI----HLTRSTNINFYEISSDGNVPSIVHSFE--DV ::.. . . .:..:. : . : . .:: : : . . .: .. .. CCDS67 SENNTPRTSKTTFQLELPVKYAVYTVVSSHEQFTKYLNFSE-SEEKESHVAMHRYQVNNL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 GPKFIFSLKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCNADINPLK : . ..:::. . .: ... : . :. . .. :... : CCDS67 GQR----------DLPVSIN---FWVPVELNQEAVWMDVE-VSHPQNPSLRCSSE----K 970 980 990 1000 1030 1040 1050 1060 1070 1080 pF1KB9 IGQTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNVTTRIWNGTFASS :. .: .: . ..... :.: :.: : . . .. : .. . : . CCDS67 IAPPAS--DFLA-HIQKNPVLDCSIAGCLRFRCDVPSFSVQEELDFTLKGNLSFGWVRQI 1010 1020 1030 1040 1050 1090 1100 1110 1120 1130 1140 pF1KB9 TFQTVQLTAAAEINTYNPEIYV-IEDNTVTIPLMIMKPDEKAEV--PTGVIIGSIIAGIL . :.....::: :.. .: . . . . . :: .: :: .:.:: :.:.: CCDS67 LQKKVSVVSVAEI-TFDTSVYSQLPGQEAFMRAQTTTVLEKYKVHNPTPLIVGSSIGGLL 1060 1070 1080 1090 1100 1110 1150 1160 1170 1180 pF1KB9 LLLALVAILWKLGFFKRKYEKMTKNPDEIDETTELSS :: ..:.:.:.:::::.:..: .. . CCDS67 LLALITAVLYKVGFFKRQYKEMMEEANGQIAPENGTQTPSPPTPHYPQDNV 1120 1130 1140 1150 1160 >>CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086 aa) initn: 601 init1: 160 opt: 777 Z-score: 936.8 bits: 185.2 E(32554): 7.3e-46 Smith-Waterman score: 1103; 28.8% identity (59.8% similar) in 1022 aa overlap (193-1166:89-1041) 170 180 190 200 210 pF1KB9 SPATQPCPSLIDVVVVCDESNSIYPWDAVKNFLEKFV-QGLDIGPTKTQV--GLIQYANN :. :.. . : :: .. . .:.... CCDS45 GAPGEGNSTGSLYQCQSGTGHCLPVTLRGSNYTSKYLGMTLATDPTDGSILFAAVQFSTS 60 70 80 90 100 110 220 230 240 250 260 270 pF1KB9 PRVVFNLNTYKTKEEMIVATSQTSQYGGDLTNTFGAIQYARKYAYSAASGGRRSATKVMV .. :... : .:.. : . .. ::::::::.:. .. :.: .::::.. CCDS45 YKTEFDFSDY-VKRKDPDALLKHVKHMLLLTNTFGAINYVATEVFREELGARPDATKVLI 120 130 140 150 160 170 280 290 300 310 320 330 pF1KB9 VVTDGESHDGSMLKAVIDQCNHDNILRFGIAVLGYLNRNALDTKNLIKEIKAIASIPTER ..::::. :.. . :. : :.:. :.. : . ..::. . .. .:: :. . CCDS45 IITDGEATDSGNIDAAKD------IIRYIIGI-G----KHFQTKESQETLHKFASKPASE 180 190 200 210 220 340 350 360 370 380 390 pF1KB9 YFFNVSDEAALLEKAGT-LGEQIFSIEGTV-QGGDNFQMEMSQVGFSADYSSQNDILMLG : .. : :. : : ..:. :::: : .:.::.:. :.::: : . .. : CCDS45 -FVKILDTFEKLKDLFTELQKKIYVIEGTSKQDLTSFNMELSSSGISADLSRGHAVV--G 230 240 250 260 270 280 400 410 420 430 440 450 pF1KB9 AVGAFGWSGTIVQKTSHGHLIFPKQAF--DQILQDRNHSSYLGYSVAAISTGESTHFVA- :::: :.: ... . . ..: .. : . ...::::.:. . . ..: ..: CCDS45 AVGAKDWAGGFLDLKAD----LQDDTFIGNEPLTPEVRAGYLGYTVTWLPSRQKTSLLAS 290 300 310 320 330 460 470 480 490 500 510 pF1KB9 GAPRANYTGQIVLYSVNENG-NITVIQAHRGDQIGSYFGSVLCSVDVDKDTITDVLLVGA :::: .. :...:.. ..: . . .:. .: :::::::. ::.::::.: :..::.:: CCDS45 GAPRYQHMGRVLLFQEPQGGGHWSQVQTIHGTQIGSYFGGELCGVDVDQDGETELLLIGA 340 350 360 370 380 390 520 530 540 550 560 570 pF1KB9 PMYMSDLKKEEGRVYLFTIKEGILGQHQFLEGPEGIENTRFGSAIAALSDINMDGFNDVI :..... . :::... .. . . . :.: : ::: ::.::.::: ::. :: CCDS45 PLFYGEQRG--GRVFIYQRRQLGFEEVSELQGDPGYPLGRFGEAITALTDINGDGLVDVA 400 410 420 430 440 450 580 590 600 610 620 630 pF1KB9 VGSPLENQNSGAVYIYNGHQGTIRTKYSQKILGSDGAFRSHLQYFGRSLDGYGDLNGDSI ::.:::.: :::::.::..: . . ::.: :.. : .:.::::. : ::.::.. CCDS45 VGAPLEEQ--GAVYIFNGRHGGLSPQPSQRIEGTQ--VLSGIQWFGRSIHGVKDLEGDGL 460 470 480 490 500 510 640 650 660 670 680 pF1KB9 TDVSIGAFGQVVQLWSQSIADVAIEASFTPEKI---------TLVNKNAQ-IILKLCFSA .::..:: .:.. : :. ..:.. ::.: .: . :: . . . .::. CCDS45 ADVAVGAESQMIVLSSRPVVDMVTLMSFSPAEIPVHEVECSYSTSNKMKEGVNITICFQI 520 530 540 550 560 570 690 700 710 720 730 740 pF1KB9 K-FRPTKQNNQVAIVYNITLDADGFSSRVTSRGLFKENNERCLQKNMVVNQAQSCPEHII : . : :. :: . . ::. :: .: :::: .... :..:..:. ..:: . . CCDS45 KSLIPQFQGRLVANL-TYTLQLDGHRTR--RRGLFP-GGRHELRRNIAVTTSMSCTDFSF 580 590 600 610 620 750 760 770 780 790 pF1KB9 YIQE-PSDVVNSLDLRVDISL-ENPGTS---------PALEAYSETAKVFSIPFHKDCGE .. .:... ... ...:: :. :: : . : .... :::.:.::: CCDS45 HFPVCVQDLISPINVSLNFSLWEEEGTPRDQRAGKDIPPILRPSLHSETWEIPFEKNCGE 630 640 650 660 670 680 800 810 820 830 840 850 pF1KB9 DGLCISDLVLDVRQIPAAQEQPFIVSNQNKRLTFSVTLKNKRESAYNTGIVVDFSENLFF : : ..: .. :: .. ... . :. ..:.: .:.:: . . . : .: : CCDS45 DKKCEANLRVSFS--PARSRALRLTAFAS--LSVELSLSNLEEDAYWVQLDLHFPPGLSF 690 700 710 720 730 740 860 870 880 890 900 pF1KB9 ASFSL--PVDGTEVTCQVAASQ-----KSVACDVGYPALKREQQVTFTINFDFNLQNLQN . . : . :.:. . ....:.:. : .: ..:.. . :. .: : . CCDS45 RKVEMLKPHSQIPVSCEELPEESRLLSRALSCNVSSPIFKAGHSVALQMMFN-TLVNSSW 750 760 770 780 790 800 910 920 930 940 950 960 pF1KB9 QASLSFQALSESQEENK---ADNLVNLKIPLLYDAEIHLTRSTNINFYEISSDGNVPSIV :. ..: ..:.. :: .. ::.:: .: . . . ..: .: . :.: CCDS45 GDSVELHANVTCNNEDSDLLEDNSATTIIPILYPINILIQDQEDSTLY-VSFTPKGPKI- 810 820 830 840 850 860 970 980 990 1000 1010 1020 pF1KB9 HSFEDVGPKFIFSLKVTTGSVPVSMATVIIHIPQYTKEKNPLMYLTGVQTDKAGDISCN- :. . . : . .. ..:. : .. .:: .: .:. . .:: . . :. CCDS45 HQVKHMYQVRI-QPSIHDHNIPTLEA--VVGVPQPPSE-GPITHQWSVQMEP--PVPCHY 870 880 890 900 910 1030 1040 1050 1060 1070 pF1KB9 ADINPLKIGQTSSSVSFKSENFRHTKELNCRTASCSNVTCWLKDVHMKGEYFVNV--TTR :.. : .. . . :: : : .. : .:.: : . CCDS45 EDLERLP---DAAEPCLPGALFR-----------CPVV--------FRQEILVQVIGTLE 920 930 940 950 1080 1090 1100 1110 1120 1130 pF1KB9 IWNGTFASSTFQTVQLTAAAEINTYNPEIYVIEDNTVTIPLMIMKPD---EKAEVPTGVI . . ::: :. : .. :. . . . . ..... ..:: : :: . :. CCDS45 LVGEIEASSMFS---LCSSLSISFNSSKHFHLYGSNASLAQVVMKVDVVYEKQMLYLYVL 960 970 980 990 1000 1010 1140 1150 1160 1170 1180 pF1KB9 IGSIIAGILLLLALVAILWKLGFFKRKY-EKMTKNPDEIDETTELSS : :.:.:::: . .:.:.:::::. ::: CCDS45 SG--IGGLLLLLLIFIVLYKVGFFKRNLKEKMEAGRGVPNGIPAEDSEQLASGQEAGDPG 1020 1030 1040 1050 1060 CCDS45 CLKPLHEKDSESGGGKD 1070 1080 1181 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 23:38:13 2016 done: Thu Nov 3 23:38:14 2016 Total Scan time: 4.590 Total Display time: 0.470 Function used was FASTA [36.3.4 Apr, 2011]