FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5101, 1049 aa
1>>>pF1KB5101 1049 - 1049 aa - 1049 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3551+/-0.000911; mu= 17.3955+/- 0.055
mean_var=99.4746+/-19.798, 0's: 0 Z-trim(108.9): 31 B-trim: 0 in 0/51
Lambda= 0.128593
statistics sampled from 10502 (10533) to 10502 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.675), E-opt: 0.2 (0.324), width: 16
Scan time: 5.150
The best scores are: opt bits E(32554)
CCDS8880.1 ITGA5 gene_id:3678|Hs108|chr12 (1049) 7138 1335.4 0
CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063) 2840 538.0 4.1e-152
CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002) 2582 490.1 1e-137
CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048) 2582 490.1 1e-137
CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012) 2133 406.8 1.2e-112
CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039) 2058 392.9 1.9e-108
CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032) 837 166.4 2.9e-40
CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035) 716 143.9 1.7e-33
CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051) 669 135.2 7.1e-31
CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086) 576 118.0 1.1e-25
CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170) 574 117.6 1.6e-25
CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188) 566 116.1 4.4e-25
CCDS32438.1 ITGAD gene_id:3681|Hs108|chr16 (1161) 564 115.8 5.6e-25
CCDS45470.1 ITGAM gene_id:3684|Hs108|chr16 (1152) 526 108.7 7.4e-23
CCDS54004.1 ITGAM gene_id:3684|Hs108|chr16 (1153) 525 108.5 8.4e-23
CCDS10711.1 ITGAX gene_id:3687|Hs108|chr16 (1163) 519 107.4 1.8e-22
CCDS67014.1 ITGAX gene_id:3687|Hs108|chr16 (1169) 519 107.4 1.8e-22
CCDS32531.1 ITGAE gene_id:3682|Hs108|chr17 (1179) 506 105.0 9.9e-22
CCDS76204.1 ITGA10 gene_id:8515|Hs108|chr1 (1024) 491 102.2 6.1e-21
CCDS72869.1 ITGA10 gene_id:8515|Hs108|chr1 (1167) 491 102.2 6.7e-21
CCDS3957.1 ITGA2 gene_id:3673|Hs108|chr5 (1181) 408 86.8 2.9e-16
>>CCDS8880.1 ITGA5 gene_id:3678|Hs108|chr12 (1049 aa)
initn: 7138 init1: 7138 opt: 7138 Z-score: 7153.9 bits: 1335.4 E(32554): 0
Smith-Waterman score: 7138; 100.0% identity (100.0% similar) in 1049 aa overlap (1-1049:1-1049)
10 20 30 40 50 60
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGGFNLDAEAPAVLSGPPGSFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGGFNLDAEAPAVLSGPPGSFF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 GFSVEFYRPGTDGVSVLVGAPKANTSQPGVLQGGAVYLCPWGASPTQCTPIEFDSKGSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GFSVEFYRPGTDGVSVLVGAPKANTSQPGVLQGGAVYLCPWGASPTQCTPIEFDSKGSRL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 LESSLSSSEGEEPVEYKSLQWFGATVRAHGSSILACAPLYSWRTEKEPLSDPVGTCYLST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LESSLSSSEGEEPVEYKSLQWFGATVRAHGSSILACAPLYSWRTEKEPLSDPVGTCYLST
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 DNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPGSYFWQGQILSATQEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 DNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPGSYFWQGQILSATQEQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 IAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTEDFVAGVPKGNLTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 IAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTEDFVAGVPKGNLTY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 GYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLVGAPLLMDRTPDGRPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLVGAPLLMDRTPDGRPQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 EVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQDGYNDVAIGAPFGGET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 EVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQDGYNDVAIGAPFGGET
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 QQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRDLDGNGYPDLIVGSFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 QQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRDLDGNGYPDLIVGSFG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 VDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNPVACINLSFCLNASGKHVADSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 VDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNPVACINLSFCLNASGKHVADSI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 GFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGAREDCREMKIYLRNESEFRDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGAREDCREMKIYLRNESEFRDK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 LSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIEDKAQILLDCGEDNICVPDLQLEVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIEDKAQILLDCGEDNICVPDLQLEVF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 GEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVTAPPEAEYSGLVRHPGNFSSLSCDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVTAPPEAEYSGLVRHPGNFSSLSCDY
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB5 FAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQFDFQILSKNLNNSQSDVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 FAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQFDFQILSKNLNNSQSDVV
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB5 SFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDLGPAVHHVYELINQGPSSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDLGPAVHHVYELINQGPSSI
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB5 SQGVLELSCPQALEGQQLLYVTRVTGLNCTTNHPINPKGLELDPEGSLHHQQKREAPSRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SQGVLELSCPQALEGQQLLYVTRVTGLNCTTNHPINPKGLELDPEGSLHHQQKREAPSRS
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB5 SASSGPQILKCPEAECFRLRCELGPLHQQESQSLQLHFRVWAKTFLQREHQPFSLQCEAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SASSGPQILKCPEAECFRLRCELGPLHQQESQSLQLHFRVWAKTFLQREHQPFSLQCEAV
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB5 YKALKMPYRILPRQLPQKERQVATAVQWTKAEGSYGVPLWIIILAILFGLLLLGLLIYIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 YKALKMPYRILPRQLPQKERQVATAVQWTKAEGSYGVPLWIIILAILFGLLLLGLLIYIL
970 980 990 1000 1010 1020
1030 1040
pF1KB5 YKLGFFKRSLPYGTAMEKAQLKPPATSDA
:::::::::::::::::::::::::::::
CCDS88 YKLGFFKRSLPYGTAMEKAQLKPPATSDA
1030 1040
>>CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063 aa)
initn: 2256 init1: 986 opt: 2840 Z-score: 2844.4 bits: 538.0 E(32554): 4.1e-152
Smith-Waterman score: 3187; 45.5% identity (73.7% similar) in 1062 aa overlap (18-1049:8-1063)
10 20 30 40 50
pF1KB5 MGSRTPESPLHAVQLRWGPR-RRPPLL-PLL-----LLLLPPPPRVGGFNLDAEAPAVLS
::: . ::. :: : .: : .::::.: .: :
CCDS31 MSPGASRGPRGSQAPLIAPLCCAAAALGMLLWSPACQAFNLDVEKLTVYS
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 GPPGSFFGFSVEFYRPGTDGVSVLVGAPKANTSQPGVLQGGAVYLCPWGASPT-QCTPIE
:: ::.::..:.:. : . .:::::::::::::: ...::::: ::: : . :: :
CCDS31 GPKGSYFGYAVDFHIPDARTASVLVGAPKANTSQPDIVEGGAVYYCPWPAEGSAQCRQIP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 FDSKGSRLLESSLSSSEGEEPVEYKSLQWFGATVRAHGSSILACAPLYSWRTEKE-PLSD
::. ..: .. . . .::.:.:: :::::::.:: ....:::::: ::: : : .:
CCDS31 FDTTNNRKIRVNGT----KEPIEFKSNQWFGATVKAHKGKVVACAPLYHWRTLKPTPEKD
120 130 140 150 160
180 190 200 210 220 230
pF1KB5 PVGTCYLSTDNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPGSYFWQG
::::::.. .::. :..:::.. . ::::::.::: .: :.: ...:::::..:::
CCDS31 PVGTCYVAIQNFSAYAEFSPCRNSNADPEGQGYCQAGFSLDFYKNGDLIVGGPGSFYWQG
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB5 QILSATQEQIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTEDFVA
:...:. .: .: . .. . :. ::. : . :::::::::::.:::.::. ...::
CCDS31 QVITASVADIIANYSFKDILRKLAGEKQTEVAPASYDDSYLGYSVAAGEFTGDSQQELVA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB5 GVPKGNLTYGYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLVGAPLLM
:.:.: ..:::.:.:..:. . ::.::::::::::.:...:::.:::::.::::::.:
CCDS31 GIPRGAQNFGYVSIINSTDMTFIQNFTGEQMASYFGYTVVVSDVNSDGLDDVLVGAPLFM
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB5 DRTPDGRPQEVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQDGYNDVA
.: .. :.:::..:.::: . . : . ::: . ::::::... ::::.::::::.:
CCDS31 EREFESNPREVGQIYLYLQVSSLLFRDPQI-LTGTETFGRFGSAMAHLGDLNQDGYNDIA
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB5 IGAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRDLDGNGY
::.::.:. :.: :... :. ::..::::::: .::. .:. :: .::: :.: : :
CCDS31 IGVPFAGKDQRGKVLIYNGNKDGLNTKPSQVLQGVWASHAVPSGFGFTLRGDSDIDKNDY
410 420 430 440 450 460
480 490 500 510 520
pF1KB5 PDLIVGSFGVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGN--PVACINLSFCL
::::::.::. :..:::.::.:...:.: . : ..: :...:.. . .::..: :
CCDS31 PDLIVGAFGTGKVAVYRARPVVTVDAQLLLHPMIINLENKTCQVPDSMTSAACFSLRVCA
470 480 490 500 510 520
530 540 550 560 570 580
pF1KB5 NASGKHVADSIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGAREDCREMKI
...:. .:..: . .:.::: ::::...:.::: ..:: . :.:. ..:... .
CCDS31 SVTGQSIANTIVLMAEVQLDSLKQKGAIKRTLFLDNHQAHRVFPLVIKRQKSHQCQDFIV
530 540 550 560 570 580
590 600 610 620 630 640
pF1KB5 YLRNESEFRDKLSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIEDKAQILLDCGEDN
:::.:.:::::::::.:.::.::: .. .. ..: :.: .. . ..:.::.::::::
CCDS31 YLRDETEFRDKLSPINISLNYSLDESTFKEGLEVKPILNYYRENIVSEQAHILVDCGEDN
590 600 610 620 630 640
650 660 670 680 690 700
pF1KB5 ICVPDLQLEVFGEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVTAPPEAEYSGLVRH
.:::::.: . ....: .::.: : : ..:.: ::: :::::: : : ::.: :. :.
CCDS31 LCVPDLKLSARPDKHQVIIGDENHLMLIINARNEGEG-AYEAELFVMIPEEADYVGIERN
650 660 670 680 690 700
710 720 730 740 750 760
pF1KB5 PGNFSSLSCDYFAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQFDFQILS
.: :::.: : .:..:::::::: .:.. ::::.::.:. :. .:.::.:: :
CCDS31 NKGFRPLSCEYKMENVTRMVVCDLGNPMVSGTNYSLGLRFAVPRLEKTNMSINFDLQIRS
710 720 730 740 750 760
770 780 790 800 810 820
pF1KB5 KNLNNSQSDVVSFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDLGPAVHHV
.: .: .:. ::..... : ::: . :::.: ...:. .:.:...:.:::..:: :.:.
CCDS31 SNKDNPDSNFVSLQINITAVAQVEIRGVSHPPQIVLPIHNWEPEEEPHKEEEVGPLVEHI
770 780 790 800 810 820
830 840 850 860 870 880
pF1KB5 YELINQGPSSISQGVLELSCPQALEGQQLLYVTRVTGLN---CTTNHPINPKGL------
::: : :::.::. .::.. : . . . :::. .. :. : : :::. .
CCDS31 YELHNIGPSTISDTILEVGWPFSARDEFLLYIFHIQTLGPLQCQPNPNINPQDIKPAASP
830 840 850 860 870 880
890 900 910 920 930
pF1KB5 ELDPEGSL--------HHQQKREAPSRSSASSGP-QILKCPEAECFRLRCELGPLHQQES
: :: : : .::.. ..: .::.: . ::... : .: :. ::
CCDS31 EDTPELSAFLRNSTIPHLVRKRDVHVVEFHRQSPAKILNCTNIECLQISCAVGRLEGGES
890 900 910 920 930 940
940 950 960 970 980 990
pF1KB5 QSLQLHFRVWAKTFLQREHQPFSLQCEAVYKALKMPYRILPRQLPQKERQVATAVQWTKA
:... :.::.:::::...:..: . ... :::: : .::. . :.: :.
CCDS31 AVLKVRSRLWAHTFLQRKNDPYALASLVSFEVKKMPYTDQPAKLPEGSIVIKTSVIWATP
950 960 970 980 990 1000
1000 1010 1020 1030 1040
pF1KB5 EGSYGVPLWIIILAILFGLLLLGLLIYILYKLGFFKRSLPYGTAM-EKAQLKPPATSDA
. :...:::.::::::.:::.:..: :.: ::: :. : : .. :: : .:
CCDS31 NVSFSIPLWVIILAILLGLLVLAILTLALWKCGFFDRARPPQEDMTDREQLTNDKTPEA
1010 1020 1030 1040 1050 1060
>>CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002 aa)
initn: 1766 init1: 1007 opt: 2582 Z-score: 2586.1 bits: 490.1 E(32554): 1e-137
Smith-Waterman score: 3063; 46.3% identity (74.6% similar) in 986 aa overlap (76-1043:20-992)
50 60 70 80 90 100
pF1KB5 AEAPAVLSGPPGSFFGFSVEFYRPGTDGVSVLVGAPKANTSQPGVLQGGAVYLCPWGASP
.:::::::::.:::...:: : : : .:
CCDS46 MLLGTLLLILYILMLCRMFLLVGAPKANTTQPGIVEGGQVLKCDW-SST
10 20 30 40
110 120 130 140 150 160
pF1KB5 TQCTPIEFDSKGSRLLESSLSSSEGEEPVEYKSLQWFGATVRAHGSSILACAPLYSWRTE
.: :::::. :.: . ..:.:.:: :::::.::.. ..:::::::: ::::
CCDS46 RRCQPIEFDATGNR-------DYAKDDPLEFKSHQWFGASVRSKQDKILACAPLYHWRTE
50 60 70 80 90 100
170 180 190 200 210 220
pF1KB5 KEPLSDPVGTCYLSTDNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPG
. .:::::.: .. :. .:::::::. : :::.:::::: .:::. ::.:::::
CCDS46 MKQEREPVGTCFL--QDGTKTVEYAPCRSQDIDADGQGFCQGGFSIDFTKADRVLLGGPG
110 120 130 140 150
230 240 250 260 270 280
pF1KB5 SYFWQGQILSATQEQIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDD
:..::::..: .:. .: :. ..:: :: :..:.::::::::::::.:.::
CCDS46 SFYWQGQLISDQVAEIVSKYDPNVYSIKYNNQLATRTAQAIFDDSYLGYSVAVGDFNGDG
160 170 180 190 200 210
290 300 310 320 330 340
pF1KB5 TEDFVAGVPKGNLTYGYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLV
.:::.:::.. : :.: : .:... :::::.:::::.:::..:::::.::: :...
CCDS46 IDDFVSGVPRAARTLGMVYIYDGKNMSSLYNFTGEQMAAYFGFSVAATDINGDDYADVFI
220 230 240 250 260 270
350 360 370 380 390 400
pF1KB5 GAPLLMDRTPDGRPQEVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQD
::::.::: ::. ::::.: : ::. .: : :.: . :.::::...::::::::
CCDS46 GAPLFMDRGSDGKLQEVGQVSVSLQRASG--DFQTTKLNGFEVFARFGSAIAPLGDLDQD
280 290 300 310 320 330
410 420 430 440 450 460
pF1KB5 GYNDVAIGAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRD
:.::.::.::.::: ..:.:..: : ::.. :::.:. ::: : :: ...:. :
CCDS46 GFNDIAIAAPYGGEDKKGIVYIFNGRSTGLNAVPSQILEGQWAARSMPPSFGYSMKGATD
340 350 360 370 380 390
470 480 490 500 510 520
pF1KB5 LDGNGYPDLIVGSFGVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNP--VACI
.: :::::::::.::::.:..::.::.....:.: ..:...: ....::: :. :.:.
CCDS46 IDKNGYPDLIVGAFGVDRAILYRARPVITVNAGLEVYPSILNQDNKTCSLPGTALKVSCF
400 410 420 430 440 450
530 540 550 560 570 580
pF1KB5 NLSFCLNASGKHVAD-SIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGARE
:. :::.:.:: : ...: ::: :: ::::..:::::: ::. . .... :. :.
CCDS46 NVRFCLKADGKGVLPRKLNFQVELLLDKLKQKGAIRRALFLYSRSPSHSKNMTISRGGLM
460 470 480 490 500 510
590 600 610 620 630 640
pF1KB5 DCREMKIYLRNESEFRDKLSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIEDKAQIL
.:.:. :::.::::::::.:: : ... :: .. .:. ::.: :. . . : .:.::
CCDS46 QCEELIAYLRDESEFRDKLTPITIFMEYRLDYRTAADTTGLQPILNQFTPANISRQAHIL
520 530 540 550 560 570
650 660 670 680 690 700
pF1KB5 LDCGEDNICVPDLQLEVFGEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVTAPPEAE
:::::::.: : :.. : ..:...:.:: : :.: .::: ::: :::::: :. : .:.
CCDS46 LDCGEDNVCKPKLEVSVDSDQKKIYIGDDNPLTLIVKAQNQGEG-AYEAELIVSIPLQAD
580 590 600 610 620 630
710 720 730 740 750 760
pF1KB5 YSGLVRHPGNFSSLSCDYFAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQ
. :.::. .. ::: . . ::.: .:::::::::::..: .::::.: . . ...
CCDS46 FIGVVRNNEALARLSCAFKTENQTRQVVCDLGNPMKAGTQLLAGLRFSVHQQSEMDTSVK
640 650 660 670 680 690
770 780 790 800 810 820
pF1KB5 FDFQILSKNLNNSQSDVVSFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDL
::.:: :.:: .. : ::: .... . : : . :::.:. :..:. .:. ...:. :::.
CCDS46 FDLQIQSSNLFDKVSPVVSHKVDLAVLAAVEIRGVSSPDHVFLPIPNWEHKENPETEEDV
700 710 720 730 740 750
830 840 850 860 870
pF1KB5 GPAVHHVYELINQGPSSISQGVLELSCPQALEGQQLLYVTR--VTG-LNCTTNHPINPKG
::.:.:.::: :.::::.:...:.:. : ... :::. . . : .:::.. :::
CCDS46 GPVVQHIYELRNNGPSSFSKAMLHLQWPYKYNNNTLLYILHYDIDGPMNCTSDMEINPLR
760 770 780 790 800 810
880 890 900 910 920
pF1KB5 LEL------DPEGSLHHQQKRE--APSRSSASSGPQI--LKCPEAECFRLRCELGPLHQQ
... . . .. : .:. .:. : : .: : : :.:... :..: : .
CCDS46 IKISSLQTTEKNDTVAGQGERDHLITKRDLALSEGDIHTLGCGVAQCLKIVCQVGRLDRG
820 830 840 850 860 870
930 940 950 960 970 980
pF1KB5 ESQSLQLHFRVWAKTFLQREHQ--PFSLQCEAVYKALKMPYRILPRQLPQKERQVATAVQ
.: : .. .:..::...:.: .::. : ......::. :: . . :.: :
CCDS46 KSAILYVKSLLWTETFMNKENQNHSYSLKSSASFNVIEFPYKNLPIEDITNSTLVTTNVT
880 890 900 910 920 930
990 1000 1010 1020 1030 1040
pF1KB5 WTKAEGSYGVPLWIIILAILFGLLLLGLLIYILYKLGFFKRSLPYGTAMEKAQLKPPATS
: . . ::.:.::::.: :::::..:....:..::::: : .:. ::.:
CCDS46 WGIQPAPMPVPVWVIILAVLAGLLLLAVLVFVMYRMGFFKRVRPPQEEQEREQLQPHENG
940 950 960 970 980 990
pF1KB5 DA
CCDS46 EGNSET
1000
>>CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048 aa)
initn: 1711 init1: 1007 opt: 2582 Z-score: 2585.9 bits: 490.1 E(32554): 1e-137
Smith-Waterman score: 3220; 46.3% identity (74.2% similar) in 1049 aa overlap (14-1043:8-1038)
10 20 30 40 50 60
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGGFNLDAEAPAVLSGPPGSFF
.:: ::: : :: ::: : .::::...:: ::: ::.:
CCDS22 MAFPPRRRLRLGPRGLPLLLSGLLL-----PLCRAFNLDVDSPAEYSGPEGSYF
10 20 30 40
70 80 90 100 110
pF1KB5 GFSVEFYRPGTDG-VSVLVGAPKANTSQPGVLQGGAVYLCPWGASPTQCTPIEFDSKGSR
::.:.:. :.... . .:::::::::.:::...:: : : : .: .: :::::. :.:
CCDS22 GFAVDFFVPSASSRMFLLVGAPKANTTQPGIVEGGQVLKCDW-SSTRRCQPIEFDATGNR
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB5 LLESSLSSSEGEEPVEYKSLQWFGATVRAHGSSILACAPLYSWRTEKEPLSDPVGTCYLS
. ..:.:.:: :::::.::.. ..:::::::: :::: . .:::::.:.
CCDS22 -------DYAKDDPLEFKSHQWFGASVRSKQDKILACAPLYHWRTEMKQEREPVGTCFLQ
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB5 TDNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPGSYFWQGQILSATQE
:. .:::::::. : :::.:::::: .:::. ::.::::::..::::..:
CCDS22 DG--TKTVEYAPCRSQDIDADGQGFCQGGFSIDFTKADRVLLGGPGSFYWQGQLISDQVA
170 180 190 200 210
240 250 260 270 280 290
pF1KB5 QIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTEDFVAGVPKGNLT
.:. .: :. ..:: :: :..:.::::::::::::.:.:: .:::.:::.. :
CCDS22 EIVSKYDPNVYSIKYNNQLATRTAQAIFDDSYLGYSVAVGDFNGDGIDDFVSGVPRAART
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB5 YGYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLVGAPLLMDRTPDGRP
:.: : .:... :::::.:::::.:::..:::::.::: :...::::.::: ::.
CCDS22 LGMVYIYDGKNMSSLYNFTGEQMAAYFGFSVAATDINGDDYADVFIGAPLFMDRGSDGKL
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 QEVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQDGYNDVAIGAPFGGE
::::.: : ::. .: : :.: . :.::::...:::::::::.::.::.::.:::
CCDS22 QEVGQVSVSLQRASG--DFQTTKLNGFEVFARFGSAIAPLGDLDQDGFNDIAIAAPYGGE
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB5 TQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRDLDGNGYPDLIVGSF
..:.:..: : ::.. :::.:. ::: : :: ...:. :.: :::::::::.:
CCDS22 DKKGIVYIFNGRSTGLNAVPSQILEGQWAARSMPPSFGYSMKGATDIDKNGYPDLIVGAF
400 410 420 430 440 450
480 490 500 510 520 530
pF1KB5 GVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNP--VACINLSFCLNASGKHVA
:::.:..::.::.....:.: ..:...: ....::: :. :.:.:. :::.:.:: :
CCDS22 GVDRAILYRARPVITVNAGLEVYPSILNQDNKTCSLPGTALKVSCFNVRFCLKADGKGVL
460 470 480 490 500 510
540 550 560 570 580 590
pF1KB5 D-SIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGAREDCREMKIYLRNESE
...: ::: :: ::::..:::::: ::. . .... :. :. .:.:. :::.:::
CCDS22 PRKLNFQVELLLDKLKQKGAIRRALFLYSRSPSHSKNMTISRGGLMQCEELIAYLRDESE
520 530 540 550 560 570
600 610 620 630 640 650
pF1KB5 FRDKLSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIEDKAQILLDCGEDNICVPDLQ
:::::.:: : ... :: .. .:. ::.: :. . . : .:.:::::::::.: : :.
CCDS22 FRDKLTPITIFMEYRLDYRTAADTTGLQPILNQFTPANISRQAHILLDCGEDNVCKPKLE
580 590 600 610 620 630
660 670 680 690 700 710
pF1KB5 LEVFGEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVTAPPEAEYSGLVRHPGNFSSL
. : ..:...:.:: : :.: .::: ::: :::::: :. : .:.. :.::. .. :
CCDS22 VSVDSDQKKIYIGDDNPLTLIVKAQNQGEG-AYEAELIVSIPLQADFIGVVRNNEALARL
640 650 660 670 680 690
720 730 740 750 760 770
pF1KB5 SCDYFAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQFDFQILSKNLNNSQ
:: . . ::.: .:::::::::::..: .::::.: . . ...::.:: :.:: ..
CCDS22 SCAFKTENQTRQVVCDLGNPMKAGTQLLAGLRFSVHQQSEMDTSVKFDLQIQSSNLFDKV
700 710 720 730 740 750
780 790 800 810 820 830
pF1KB5 SDVVSFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDLGPAVHHVYELINQG
: ::: .... . : : . :::.:. :..:. .:. ...:. :::.::.:.:.::: :.:
CCDS22 SPVVSHKVDLAVLAAVEIRGVSSPDHVFLPIPNWEHKENPETEEDVGPVVQHIYELRNNG
760 770 780 790 800 810
840 850 860 870 880
pF1KB5 PSSISQGVLELSCPQALEGQQLLYVTR--VTG-LNCTTNHPINPKGLEL------DPEGS
:::.:...:.:. : ... :::. . . : .:::.. ::: ... . . .
CCDS22 PSSFSKAMLHLQWPYKYNNNTLLYILHYDIDGPMNCTSDMEINPLRIKISSLQTTEKNDT
820 830 840 850 860 870
890 900 910 920 930 940
pF1KB5 LHHQQKRE--APSRSSASSGPQI--LKCPEAECFRLRCELGPLHQQESQSLQLHFRVWAK
. : .:. .:. : : .: : : :.:... :..: : . .: : .. .:..
CCDS22 VAGQGERDHLITKRDLALSEGDIHTLGCGVAQCLKIVCQVGRLDRGKSAILYVKSLLWTE
880 890 900 910 920 930
950 960 970 980 990 1000
pF1KB5 TFLQREHQ--PFSLQCEAVYKALKMPYRILPRQLPQKERQVATAVQWTKAEGSYGVPLWI
::...:.: .::. : ......::. :: . . :.: : : . . ::.:.
CCDS22 TFMNKENQNHSYSLKSSASFNVIEFPYKNLPIEDITNSTLVTTNVTWGIQPAPMPVPVWV
940 950 960 970 980 990
1010 1020 1030 1040
pF1KB5 IILAILFGLLLLGLLIYILYKLGFFKRSLPYGTAMEKAQLKPPATSDA
::::.: :::::..:....:..::::: : .:. ::.:
CCDS22 IILAVLAGLLLLAVLVFVMYRMGFFKRVRPPQEEQEREQLQPHENGEGNSET
1000 1010 1020 1030 1040
>>CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012 aa)
initn: 1711 init1: 747 opt: 2133 Z-score: 2135.9 bits: 406.8 E(32554): 1.2e-112
Smith-Waterman score: 2956; 44.0% identity (71.3% similar) in 1049 aa overlap (14-1043:8-1002)
10 20 30 40 50 60
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGGFNLDAEAPAVLSGPPGSFF
.:: ::: : :: ::: : .::::...:: ::: ::.:
CCDS46 MAFPPRRRLRLGPRGLPLLLSGLLL-----PLCRAFNLDVDSPAEYSGPEGSYF
10 20 30 40
70 80 90 100 110
pF1KB5 GFSVEFYRPGTDG-VSVLVGAPKANTSQPGVLQGGAVYLCPWGASPTQCTPIEFDSKGSR
::.:.:. :.... . .:::::::::.:::...:: : : : .: .: :::::. :.:
CCDS46 GFAVDFFVPSASSRMFLLVGAPKANTTQPGIVEGGQVLKCDW-SSTRRCQPIEFDATGNR
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB5 LLESSLSSSEGEEPVEYKSLQWFGATVRAHGSSILACAPLYSWRTEKEPLSDPVGTCYLS
. ..:.:.:: :::::.::.. ..:::::::: :::: . .:::::.:
CCDS46 -------DYAKDDPLEFKSHQWFGASVRSKQDKILACAPLYHWRTEMKQEREPVGTCFL-
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB5 TDNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPGSYFWQGQILSATQE
.. :. .::::::: :..:
CCDS46 -QDGTKTVEYAPCRSR------------------------------------QLISDQVA
170 180
240 250 260 270 280 290
pF1KB5 QIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTEDFVAGVPKGNLT
.:. .: :. ..:: :: :..:.::::::::::::.:.:: .:::.:::.. :
CCDS46 EIVSKYDPNVYSIKYNNQLATRTAQAIFDDSYLGYSVAVGDFNGDGIDDFVSGVPRAART
190 200 210 220 230 240
300 310 320 330 340 350
pF1KB5 YGYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLVGAPLLMDRTPDGRP
:.: : .:... :::::.:::::.:::..:::::.::: :...::::.::: ::.
CCDS46 LGMVYIYDGKNMSSLYNFTGEQMAAYFGFSVAATDINGDDYADVFIGAPLFMDRGSDGKL
250 260 270 280 290 300
360 370 380 390 400 410
pF1KB5 QEVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQDGYNDVAIGAPFGGE
::::.: : ::. .: : :.: . :.::::...:::::::::.::.::.::.:::
CCDS46 QEVGQVSVSLQRASG--DFQTTKLNGFEVFARFGSAIAPLGDLDQDGFNDIAIAAPYGGE
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB5 TQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRDLDGNGYPDLIVGSF
..:.:..: : ::.. :::.:. ::: : :: ...:. :.: :::::::::.:
CCDS46 DKKGIVYIFNGRSTGLNAVPSQILEGQWAARSMPPSFGYSMKGATDIDKNGYPDLIVGAF
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB5 GVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNP--VACINLSFCLNASGKHVA
:::.:..::.::.....:.: ..:...: ....::: :. :.:.:. :::.:.:: :
CCDS46 GVDRAILYRARPVITVNAGLEVYPSILNQDNKTCSLPGTALKVSCFNVRFCLKADGKGVL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KB5 D-SIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGAREDCREMKIYLRNESE
...: ::: :: ::::..:::::: ::. . .... :. :. .:.:. :::.:::
CCDS46 PRKLNFQVELLLDKLKQKGAIRRALFLYSRSPSHSKNMTISRGGLMQCEELIAYLRDESE
490 500 510 520 530 540
600 610 620 630 640 650
pF1KB5 FRDKLSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIEDKAQILLDCGEDNICVPDLQ
:::::.:: : ... :: .. .:. ::.: :. . . : .:.:::::::::.: : :.
CCDS46 FRDKLTPITIFMEYRLDYRTAADTTGLQPILNQFTPANISRQAHILLDCGEDNVCKPKLE
550 560 570 580 590 600
660 670 680 690 700 710
pF1KB5 LEVFGEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVTAPPEAEYSGLVRHPGNFSSL
. : ..:...:.:: : :.: .::: ::: :::::: :. : .:.. :.::. .. :
CCDS46 VSVDSDQKKIYIGDDNPLTLIVKAQNQGEG-AYEAELIVSIPLQADFIGVVRNNEALARL
610 620 630 640 650 660
720 730 740 750 760 770
pF1KB5 SCDYFAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQFDFQILSKNLNNSQ
:: . . ::.: .:::::::::::..: .::::.: . . ...::.:: :.:: ..
CCDS46 SCAFKTENQTRQVVCDLGNPMKAGTQLLAGLRFSVHQQSEMDTSVKFDLQIQSSNLFDKV
670 680 690 700 710 720
780 790 800 810 820 830
pF1KB5 SDVVSFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDLGPAVHHVYELINQG
: ::: .... . : : . :::.:. :..:. .:. ...:. :::.::.:.:.::: :.:
CCDS46 SPVVSHKVDLAVLAAVEIRGVSSPDHVFLPIPNWEHKENPETEEDVGPVVQHIYELRNNG
730 740 750 760 770 780
840 850 860 870 880
pF1KB5 PSSISQGVLELSCPQALEGQQLLYVTR--VTG-LNCTTNHPINPKGLEL------DPEGS
:::.:...:.:. : ... :::. . . : .:::.. ::: ... . . .
CCDS46 PSSFSKAMLHLQWPYKYNNNTLLYILHYDIDGPMNCTSDMEINPLRIKISSLQTTEKNDT
790 800 810 820 830 840
890 900 910 920 930 940
pF1KB5 LHHQQKRE--APSRSSASSGPQI--LKCPEAECFRLRCELGPLHQQESQSLQLHFRVWAK
. : .:. .:. : : .: : : :.:... :..: : . .: : .. .:..
CCDS46 VAGQGERDHLITKRDLALSEGDIHTLGCGVAQCLKIVCQVGRLDRGKSAILYVKSLLWTE
850 860 870 880 890 900
950 960 970 980 990 1000
pF1KB5 TFLQREHQ--PFSLQCEAVYKALKMPYRILPRQLPQKERQVATAVQWTKAEGSYGVPLWI
::...:.: .::. : ......::. :: . . :.: : : . . ::.:.
CCDS46 TFMNKENQNHSYSLKSSASFNVIEFPYKNLPIEDITNSTLVTTNVTWGIQPAPMPVPVWV
910 920 930 940 950 960
1010 1020 1030 1040
pF1KB5 IILAILFGLLLLGLLIYILYKLGFFKRSLPYGTAMEKAQLKPPATSDA
::::.: :::::..:....:..::::: : .:. ::.:
CCDS46 IILAVLAGLLLLAVLVFVMYRMGFFKRVRPPQEEQEREQLQPHENGEGNSET
970 980 990 1000 1010
>>CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039 aa)
initn: 1413 init1: 282 opt: 2058 Z-score: 2060.5 bits: 392.9 E(32554): 1.9e-108
Smith-Waterman score: 2299; 39.3% identity (66.5% similar) in 1047 aa overlap (25-1031:13-1029)
10 20 30 40 50
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPP---PPRVGGFNLDAEAPAVLSGPPG
:: .:::: : :: . ..::: . .:: :
CCDS32 MARALCPLQALWLLEWVLLLLGPCAAPP-AWALNLDPVQLTFYAGPNG
10 20 30 40
60 70 80 90 100 110
pF1KB5 SFFGFSVEFYRPGTDGVSVLVGAPKANTSQPGVLQGGAVYLCPWGASPTQCTPIEFDSKG
: ::::..:.. . :...::::. : :. . :.:.:::: : :: . :: .
CCDS32 SQFGFSLDFHKDSHGRVAIVVGAPR--TLGPSQEETGGVFLCPWRAEGGQCPSLLFDLRD
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB5 SRLLESSLSSSEGEEPVE-YKSLQWFGATVRAHGSSILACAPLYSWRT-EK--EPLSDPV
. . : . .. .:. : .::.: . .. :.:::: : . :: : . ::
CCDS32 E-------TRNVGSQTLQTFKARQGLGASVVSWSDVIVACAPWQHWNVLEKTEEAEKTPV
110 120 130 140 150
180 190 200 210 220
pF1KB5 GTCYLSTDNFTRILEYAPCR----------SDFSWAAGQGYCQGGFSAEFTKTGRVVLGG
:.:.:. . : ::.::: .:::: . ::..:::. :..:..:::.
CCDS32 GSCFLAQPESGRRAEYSPCRGNTLSRIYVENDFSW--DKRYCEAGFSSVVTQAGELVLGA
160 170 180 190 200 210
230 240 250 260 270 280
pF1KB5 PGSYFWQGQILSATQEQIAESYYPEYLINLVQGQLQTRQASSI-YDDSYLGYSVAVGEFS
::.:.. : . .: .: :: : :. :..: . ..:. : :.: :::::::::.
CCDS32 PGGYYFLGLLAQAPVADIFSSYRPGILLWHVSSQSLSFDSSNPEYFDGYWGYSVAVGEFD
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB5 GD-DTEDFVAGVPKGNLTYGYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLD
:: .: ..:.:.: . : : : ::. : . :. . :::::::::..::.:::::::
CCDS32 GDLNTTEYVVGAPTWSWTLGAVEILD-SYYQRLHRLRGEQMASYFGHSVAVTDVNGDGRH
280 290 300 310 320 330
350 360 370 380 390
pF1KB5 DLLVGAPLLMDRTPDGRPQEVGRVYVYLQHPAGIEP--TPTLTLTGHDEFGRFGSSLTPL
:::::::: :. : . ::::::..:: : : . .:.: ::: . .:::::...::
CCDS32 DLLVGAPLYMESRADRKLAEVGRVYLFLQ-PRGPHALGAPSLLLTGTQLYGRFGSAIAPL
340 350 360 370 380 390
400 410 420 430 440 450
pF1KB5 GDLDQDGYNDVAIGAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQ-PLWAASHTPDFFGS
::::.:::::.:..::.:: . .: :.:: : :: :.:::::. :. ..: ::
CCDS32 GDLDRDGYNDIAVAAPYGGPSGRGQVLVFLGQSEGLRSRPSQVLDSPFPTGSA----FGF
400 410 420 430 440 450
460 470 480 490 500 510
pF1KB5 ALRGGRDLDGNGYPDLIVGSFGVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGN
.:::. :.: :::::::::..:.....:::..:.:.::..: . .. :: .:: : .
CCDS32 SLRGAVDIDDNGYPDLIVGAYGANQVAVYRAQPVVKASVQLLVQDSL-NPAVKSCVLPQT
460 470 480 490 500
520 530 540 550 560 570
pF1KB5 --PVACINLSFCLNASGKHVADSIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLI
::.:.:...:..:.:... .......::::: :: . : ::.:.:.:.:: : .: .
CCDS32 KTPVSCFNIQMCVGATGHNIPQKLSLNAELQLDRQKPRQG-RRVLLLGSQQAGTTLNLDL
510 520 530 540 550 560
580 590 600 610 620 630
pF1KB5 QNGAREDCREMKIYLRNESEFRDKLSPIHIALNFSLDPQAPVDSHGLRPALHYQSKSRIE
. :. .::.:..:::::::: ..:: :: : :. ::. .. ....
CCDS32 GGKHSPICHTTMAFLRDEADFRDKLSPIVLSLNVSLPPTEA----GMAPAVVLHGDTHVQ
570 580 590 600 610 620
640 650 660 670 680 690
pF1KB5 DKAQILLDCGEDNICVPDLQLEVFGEQNHVYLGDKNALNLTFHAQNVGEGGAYEAELRVT
....:.::::::..:::.::: . . . .: :.:.: . : : ::: :::::: :
CCDS32 EQTRIVLDCGEDDVCVPQLQLTASVTGSPLLVGADNVLELQMDAANEGEG-AYEAELAVH
630 640 650 660 670 680
700 710 720 730 740 750
pF1KB5 APPEAEYSGLVRHPGNFSSLSCDYFAVNQSRLLVCDLGNPMKAGASLWGGLRFTVPHLRD
: :.: . . .: : :. :..:...:.:::::: .:.. .. .: .:..
CCDS32 LPQGAHYMRALSNVEGFERLICNQKKENETRVVLCELGNPMKKNAQIGIAMLVSVGNLEE
690 700 710 720 730 740
760 770 780 790 800 810
pF1KB5 TKKTIQFDFQILSKNLNNSQSDVVSFRLSVEAQAQVTLNGVSKPEAVLFPVSDWHPRDQP
. ....:..:: ::: .: .: .: . . :.:.::: : : : : : : ... :.:
CCDS32 AGESVSFQLQIRSKNSQNPNSKIVLLDVPVRAEAQVELRGNSFP-ASLVVAAEEGEREQ-
750 760 770 780 790 800
820 830 840 850 860 870
pF1KB5 QKEEDLGPAVHHVYELINQGPSSISQGVLELSCPQALEGQQLLYVTRVT---GLNCTTNH
.. .. :: :.:.::: :.::.... : . : . ..:::. . ::.: .
CCDS32 NSLDSWGPKVEHTYELHNNGPGTVNGLHLSIHLPGQSQPSDLLYILDIQPQGGLQCFPQP
810 820 830 840 850 860
880 890 900 910 920
pF1KB5 PINPK----GLEL---DPEGSLHHQQKREA-----PSRSSASSGPQILKCPEAECFRLRC
:.:: :: . .: ::.. :. : . : . : ...: : : ..:
CCDS32 PVNPLKVDWGLPIPSPSPIHPAHHKRDRRQIFLPEPEQPSRLQDPVLVSCDSAPCTVVQC
870 880 890 900 910 920
930 940 950 960 970 980
pF1KB5 ELGPLHQ-QESQSLQLHFRVWAKTFLQREHQPFSLQCEAVYKALKMPYRILPRQLPQKER
.: . . :... : : .: .. :: . : :: .: ... ..:: . : .::. :
CCDS32 DLQEMARGQRAMVTVLAF-LWLPSLYQRPLDQFVLQSHAWFNVSSLPYAVPPLSLPRGEA
930 940 950 960 970 980
990 1000 1010 1020 1030 1040
pF1KB5 QVATAVQWTKAEGSYGVPLWIIILAILFGLLLLGLLIYILYKLGFFKRSLPYGTAMEKAQ
:: : : .: ..:.: .....: ::::: .:. ..:.:::::. :
CCDS32 QVWT--QLLRALEERAIPIWWVLVGVLGGLLLLTILVLAMWKVGFFKRNRPPLEEDDEEG
990 1000 1010 1020 1030
pF1KB5 LKPPATSDA
CCDS32 E
>>CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032 aa)
initn: 663 init1: 147 opt: 837 Z-score: 836.3 bits: 166.4 E(32554): 2.9e-40
Smith-Waterman score: 1174; 27.4% identity (59.7% similar) in 1054 aa overlap (18-1028:10-1007)
10 20 30 40 50 60
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGGFNLDAEAPAVLSGPPGSFF
:::: ..::: : .:.:.:. . .:: ...:
CCDS42 MAWEARREPGPRRAAVRETVMLLLCLGVPTGRPYNVDTESALLYQGPHNTLF
10 20 30 40 50
70 80 90 100 110
pF1KB5 GFSVEFYRPGTDGVSVLVGAPKAN-TSQPGVLQGGAVYLCPWGASPTQ-CTPIEFDSKGS
:.:: .. :.. .::::: :: .. .:.. ::.: : : .: : : ... : ..
CCDS42 GYSVVLHSHGANRW-LLVGAPTANWLANASVINPGAIYRCRIGKNPGQTCEQLQLGSPNG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 RLLESSLSSSEGEEPVEYKSLQWFGATV-RAHG--SSILACAPLYSWRTE---KEPLSDP
. :. .: .. ::.:.:. : : .::..:. . :.. :. . :
CCDS42 E--------PCGKTCLEERDNQWLGVTLSRQPGENGSIVTCG--HRWKNIFYIKNENKLP
120 130 140 150 160
180 190 200 210 220
pF1KB5 VGTCY-LSTDNFTRILEY-APCRSDFSWAAGQGY--CQGGFSAEFTKTGRVVLGGPGSYF
.: :: . : :.. . ::: .:. :... ::.:.:. .:: .:.:.::: .
CCDS42 TGGCYGVPPDLRTELSKRIAPCYQDYVKKFGENFASCQAGISSFYTKD-LIVMGAPGSSY
170 180 190 200 210 220
230 240 250 260 270 280
pF1KB5 WQGQILSATQEQIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTED
: :... . :. . : .: . :.:.. :::::::..:.: .. : .
CCDS42 WTGSLFVYN---ITTNKYKAFLDK--QNQVKF--------GSYLGYSVGAGHFRSQHTTE
230 240 250 260
290 300 310 320 330 340
pF1KB5 FVAGVPKGN-LTYGYVTILNGSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLLVGA
:.:.:. . . .:. .. ... :....:....:::: .: :.:.:.::..::::::
CCDS42 VVGGAPQHEQIGKAYIFSIDEKELNILHEMKGKKLGSYFGASVCAVDLNADGFSDLLVGA
270 280 290 300 310 320
350 360 370 380 390 400
pF1KB5 PLLMDRTPDGRPQEVGRVYVYLQHPAG-IEPTPTLTLTGHDEFG-RFGSSLTPLGDLDQD
:. .. .: :::.::.. .: . . .:.: :... ::: :.. :::.:.:
CCDS42 PM------QSTIREEGRVFVYINSGSGAVMNAMETNLVGSDKYAARFGESIVNLGDIDND
330 340 350 360 370 380
410 420 430 440 450 460
pF1KB5 GYNDVAIGAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRD
:..::::::: . ::..... : :..: :: .. : :.. ..::... : :
CCDS42 GFEDVAIGAP-QEDDLQGAIYIYNGRADGISSTFSQRIEGLQI-SKSLSMFGQSISGQID
390 400 410 420 430
470 480 490 500 510 520
pF1KB5 LDGNGYPDLIVGSFGVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNPVACINL
:.::: :. ::.: :.::. : ::.: ..:::. : : . .: .: : .::.:
CCDS42 ADNNGYVDVAVGAFRSDSAVLLRTRPVVIVDASLS-HPESVNRTKFDCVENGWPSVCIDL
440 450 460 470 480 490
530 540 550 560 570 580
pF1KB5 SFCLNASGKHVADSIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGARE-DC
..:.. .::.: : . ...:: ... . : ....: .. . : :: ..:: .:
CCDS42 TLCFSYKGKEVPGYIVLFYNMSLDVNRKAESPPR-FYFSSNGTSDVITGSIQVSSREANC
500 510 520 530 540 550
590 600 610 620 630
pF1KB5 REMKIYLRNESEFRDKLSPIHIALNFSLDPQ-----APVDSHGLRPALHYQSKSRIEDKA
: . ..:.. :: :.::.: . : :. . . :.: :. .... : :.
CCDS42 RTHQAFMRKD--VRDILTPIQIEAAYHLGPHVISKRSTEEFPPLQPILQQKKEKDIMKKT
560 570 580 590 600 610
640 650 660 670 680 690
pF1KB5 QILLD-CGEDNICVPDLQLEV-FG----EQNHVYL--GDKNALNLTFHAQNVGEGGAYEA
. :...: : :::. . .: ..:..:: :. ..: :. :.:. :::.
CCDS42 INFARFCAHEN-CSADLQVSAKIGFLKPHENKTYLAVGSMKTLMLNVSLFNAGDD-AYET
620 630 640 650 660 670
700 710 720 730 740 750
pF1KB5 ELRVTAPPEAEYSGLVRHPGNFSSLSCDYFAVNQSRLLVCDLGNPMKAGASLWG-GLRFT
:.: : . ... . ....:. . : :..: . : .. .
CCDS42 TLHVKLPVGLYFIKILEL--EEKQINCEVTDNSGVVQLDCSIGYIYVDHLSRIDISFLLD
680 690 700 710 720 730
760 770 780 790 800
pF1KB5 VPHLRDTKKTIQFDFQILSKN---LNNSQSDVVSFRLSVEAQAQVTLNGVSKPEAVLFPV
: : ... ... . .: ..: . . :. . .. ....:..: .: . ..
CCDS42 VSSLSRAEEDLSITVHATCENEEEMDNLKHSRVTVAIPLKYEVKLTVHGFVNPTSFVYGS
740 750 760 770 780 790
810 820 830 840 850 860
pF1KB5 SDWHPRDQPQKEEDLGPAVHHVYELINQGPSSISQGVLELSCPQALEGQ-----QLLYVT
.: ...: : . .. ....:: : : . .:. :... : ..: :
CCDS42 ND---ENEP--ETCMVEKMNLTFHVINTGNSMAPNVSVEIMVPNSFSPQTDKLFNILDVQ
800 810 820 830 840
870 880 890 900 910 920
pF1KB5 RVTGLNCTTNHPINPKGLELDPEGSLHHQQKREAPSRSSASSGPQILKCPEAE--CFRLR
.:: .: .. .:: . . .: .. : ... ..: : .:. :. .
CCDS42 TTTG-ECHFENYQRVCALEQQKSA----MQTLKGIVRFLSKTDKRLLYCIKADPHCLNFL
850 860 870 880 890 900
930 940 950 960 970
pF1KB5 CELGPLHQQESQSLQLHFRVWAKTFLQREHQPFSLQCEAVYKALKMPYRILPRQLP-QKE
:..: ... . :. :... .. . . . .:. : .. : :: . .:.
CCDS42 CNFGKMESGKEASV--HIQLEGRPSILEMDETSALKFEIRATGFPEPN---PRVIELNKD
910 920 930 940 950
980 990 1000 1010 1020 1030
pF1KB5 RQVATAVQWTKAEGSYGVPLWIIILA--ILFGLLLLGLLIYILYKLGFFKRSLPYGTAME
..:: .. . . :.:.. .:.::..: :. :...: :::::
CCDS42 ENVAHVLLEGLHHQRPKRYFTIVIISSSLLLGLIVLLLISYVMWKAGFFKRQYKSILQEE
960 970 980 990 1000 1010
1040
pF1KB5 KAQLKPPATSDA
CCDS42 NRRDSWSYINSKSNDD
1020 1030
>>CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035 aa)
initn: 708 init1: 169 opt: 716 Z-score: 715.0 bits: 143.9 E(32554): 1.7e-33
Smith-Waterman score: 1215; 28.3% identity (59.9% similar) in 1061 aa overlap (19-1028:7-1009)
10 20 30 40 50 60
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGGFNLDAEAPAVLSGPPGSFF
:: : ::: :. .:..::: . :. ..:: :::
CCDS26 MGGPAAPRGAGRLRALLLALVVAGIPAGAYNLDPQRPVHFQGPADSFF
10 20 30 40
70 80 90 100 110
pF1KB5 GFSV-EFYRPGTDGVSVLVGAPKANTS-QPGVLQGGAVYLCPWGASPTQ-CTPIEFDSKG
:..: : .. .: ::::::::... .:.: . :::. : ..: . :: ...
CCDS26 GYAVLEHFHDNTRW--VLVGAPKADSKYSPSVKSPGAVFKCRVHTNPDRRCTELDMARGK
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB5 SRLLESSLSSSEGEEPVEYKSLQWFGATV----RAHGSSILACAPLYSWRT---EKEPLS
.: ..: :. : .. .:.:... .: : .:::: . :.. : . .
CCDS26 NR------GTSCGKTCREDRDDEWMGVSLARQPKADGR-VLACA--HRWKNIYYEADHIL
110 120 130 140 150
180 190 200 210 220
pF1KB5 DPVGTCYLSTDNF-TRILEYAPCRSDFSWAAGQ--GYCQGGFSAEFTKTGRVVLGGPGSY
: : ::. .:. .. :: ... :. : ::.:... ::. ::.:.:::.
CCDS26 -PHGFCYIIPSNLQAKGRTLIPCYEEYKKKYGEEHGSCQAGIAGFFTEE-LVVMGAPGSF
160 170 180 190 200 210
230 240 250 260 270 280
pF1KB5 FWQGQILSATQEQIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTE
.: : : ..... : ..: . ...:. : .::::.:..:.:: .:
CCDS26 YWAGTI---KVLNLTDNTY----LKLNDEVIMNRR----Y--TYLGYAVTAGHFSHPSTI
220 230 240 250 260
290 300 310 320 330 340
pF1KB5 DFVAGVPKGNLTYGYVTILNGSDIRS-----LYNFSGEQMASYFGYAVAATDVNGDGLDD
: :.:.:. . : : :. .: :: ... ::..:.:::: .. :.:.:::::.:
CCDS26 DVVGGAPQDK-GIGKVYIFR-ADRRSGTLIKIFQASGKKMGSYFGSSLCAVDLNGDGLSD
270 280 290 300 310 320
350 360 370 380 390 400
pF1KB5 LLVGAPLLMDRTPDGRPQEVGRVYVYLQHPAGIEPTPTLTLTGHDEFG-RFGSSLTPLGD
::::::.. .. .. :.: ::... : :.::: .. .:: :.. : :
CCDS26 LLVGAPMF------SEIRDEGQVTVYINRGNGALEEQ-LALTGDGAYNAHFGESIASLDD
330 340 350 360 370
410 420 430 440 450 460
pF1KB5 LDQDGYNDVAIGAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALR
::.::. ::::::: . :.:... : ::. . :. :. . . .::...
CCDS26 LDNDGFPDVAIGAP-KEDDFAGAVYIYHGDAGGIVPQYSMKLSG-QKINPVLRMFGQSIS
380 390 400 410 420 430
470 480 490 500 510 520
pF1KB5 GGRDLDGNGYPDLIVGSFGVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLEGNPVA
:: :.:::::::. ::.: :..:. :.::......:. ..:. .: .: .::
CCDS26 GGIDMDGNGYPDVTVGAFMSDSVVLLRARPVITVDVSI-FLPGSINITAPQCHDGQQPVN
440 450 460 470 480 490
530 540 550 560 570
pF1KB5 CINLSFCLNASGKHVADSIGFTVELQLDW-QKQKGGVRRALF--LASRQATLTQTLLIQN
:.:.. :.. :::: ::.. :. : .:.:: . :. : :. .. .:. : .
CCDS26 CLNVTTCFSFHGKHVPGEIGLNYVLMADVAKKEKGQMPRVYFVLLGETMGQVTEKLQLTY
500 510 520 530 540 550
580 590 600 610 620 630
pF1KB5 GAREDCREMKIYLRNESEFRDKLSPIHIALNFSLDPQAPVDSH----GLRPALHYQSKSR
.: ::.. ... . .: .::: . .::. .. . . : :.:.... ..
CCDS26 -MEETCRHYVAHVKR--RVQDVISPIVFEAAYSLSEHVTGEEERELPPLTPVLRWKKGQK
560 570 580 590 600
640 650 660 670 680
pF1KB5 IEDKAQILLD--CGEDNICVPDLQLE------VFGEQN-HVYLGDKNALNLTFHAQNVGE
: .: : ... : .. :. ::::. . :.. .. :: . ..:.. .:.:.
CCDS26 IAQKNQTVFERNCRSED-CAADLQLQGKLLLSSMDEKTLYLALGAVKNISLNISISNLGD
610 620 630 640 650 660
690 700 710 720 730 740
pF1KB5 GGAYEAELRVTAPPEAEYSGLVRHPGNFSSLSCDYFAVNQSRLLVCDLGNP-MKAGASLW
::.:.. .. : . .. .. . ..::. . .: .: :..: : :.. ..
CCDS26 D-AYDANVSFNVSRELFFINMWQK--EEMGISCELL---ESDFLKCSVGFPFMRSKSKYE
670 680 690 700 710 720
750 760 770 780 790 800
pF1KB5 GGLRFTVPHLRDTKKTIQFDFQILSKNLNNSQS---DVVSFRLSVEAQAQVTLNGVSKPE
.. : . :: .....: : : . :.: ... . . . .......:. .:
CCDS26 FSVIFDTSHLSGEEEVLSFIVTAQSGNTERSESLHDNTLVLMVPLMHEVDTSITGIMSPT
730 740 750 760 770 780
810 820 830 840 850
pF1KB5 AVLFPVS-DWHPRDQPQKEEDLGPAVHHVYELINQGPSSISQGVLELSCPQALE--GQQL
. .. : : : . : .. . .. : :::.. . . .: :. : : ..
CCDS26 SFVYGESVDAANFIQLDDLECHFQPINITLQVYNTGPSTLPGSSVSISFPNRLSSGGAEM
790 800 810 820 830 840
860 870 880 890 900 910
pF1KB5 LYVTR-VTGL---NCTTNHPINPKGLELDPEGSLHHQQKREAPSRSSASSGPQILKC--P
..: . :.: ::. .. .: . . :. .: . ..:: ..: : :
CCDS26 FHVQEMVVGQEKGNCSFQKNPTPCIIPQEQENIFH------TIFAFFTKSGRKVLDCEKP
850 860 870 880 890
920 930 940 950 960 970
pF1KB5 EAECFRLRCELGPLHQQESQSLQLHFRVWAKTFLQREHQPFSLQCEAVYKALKMP-YRI-
:. .:... : ..::....... . .: . .. . .: . :. : :.
CCDS26 GISCLTAHCNFSALAKEESRTIDIYMLL--NTEILKKDSSSVIQFMSRAKVKVDPALRVV
900 910 920 930 940 950
980 990 1000 1010 1020
pF1KB5 -LPRQLPQKERQVATAVQWTKAEGSYGVPLWIIILAILFGLLLLGLLIYILYKLGFFKRS
. . :.. : :.. . .: : : ::: ...: :.:.. :: .:.:.:::.:
CCDS26 EIAHGNPEEVTVVFEALHNLEPRG-YVVG-WIIAISLLVGILIFLLLAVLLWKMGFFRRR
960 970 980 990 1000 1010
1030 1040
pF1KB5 LPYGTAMEKAQLKPPATSDA
CCDS26 YKEIIEAEKNRKENEDSWDWVQKNQ
1020 1030
>>CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051 aa)
initn: 575 init1: 141 opt: 669 Z-score: 667.8 bits: 135.2 E(32554): 7.1e-31
Smith-Waterman score: 1071; 27.9% identity (55.1% similar) in 1112 aa overlap (18-1048:4-1045)
10 20 30 40 50
pF1KB5 MGSRTPESPLHAVQLRWGPRRRPPLLPLLLLLLPPPPRVGG-----FNLDAEAPAVL-SG
:: : : :.: : .:: ::::.. .: .:
CCDS11 MGPGPSRAPRAPRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAG
10 20 30 40
60 70 80 90 100 110
pF1KB5 PPGSFFGFSVEFYRPGT--DGVSVLVGAPKANTSQPGVL-QGGAVYLCPWGASPTQCTPI
:::.::.:: ..: . .:.:::. . : . ::::::: : .: .
CCDS11 NPGSLFGYSVALHRQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDDCERM
50 60 70 80 90 100
120 130 140 150 160
pF1KB5 EFDSKGSRLLESSLSSSEGEEPVEYKSLQWFGATVRAHGSS--ILACAPLYS---WRTEK
.. : .. :.. .: .:.:.:: ..: . .:.:: :. : . .
CCDS11 NITVK----------NDPGHHIIED---MWLGVTVASQGPAGRVLVCAHRYTQVLW-SGS
110 120 130 140 150
170 180 190 200 210
pF1KB5 EPLSDPVGTCYL--------STDNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGR
: :: ::. :.:.. . . : :. .. :.:: : :. ::..
CCDS11 EDQRRMVGKCYVRGNDLELDSSDDW-QTYHNEMCNSNTDYLE-TGMCQLGTSGGFTQN-T
160 170 180 190 200
220 230 240 250 260 270
pF1KB5 VVLGGPGSYFWQGQILSATQEQIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAV
: .:.::.: :.:. ... : : : ::.: :.::.. :
CCDS11 VYFGAPGAYNWKGNSYMIQRKEWDLSEYS-YKDPEDQGNL------------YIGYTMQV
210 220 230 240 250
280 290 300 310 320 330
pF1KB5 GEFSGDDTE-DFVAGVPKGNLTYGYVTILN---GSDIRSLYNFSGEQMASYFGYAVAATD
: : . .:.:.:. . .: : .:. :.:.: . : :...::: :.: .:
CCDS11 GSFILHPKNITIVTGAPR-HRHMGAVFLLSQEAGGDLRRRQVLEGSQVGAYFGSAIALAD
260 270 280 290 300 310
340 350 360 370 380 390
pF1KB5 VNGDGLDDLLVGAPLLMDRTPDGRPQEVG-RVYVYLQHPAGIEPT-PTLTLTGHDEFGRF
.:.:: .::::::: ..: .::: .::.... . :. :.: : : . . :
CCDS11 LNNDGWQDLLVGAPYYFERK-----EEVGGAIYVFMNQAGTSFPAHPSLLLHGPSG-SAF
320 330 340 350 360
400 410 420 430 440 450
pF1KB5 GSSLTPLGDLDQDGYNDVAIGAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHT
: :.. .::..:::..:.:.:::: : : :... .. :: .:.::.. .
CCDS11 GLSVASIGDINQDGFQDIAVGAPFEG---LGKVYIYHSSSKGLLRQPQQVIHGEKLGLPG
370 380 390 400 410 420
460 470 480 490 500 510
pF1KB5 PDFFGSALRGGRDLDGNGYPDLIVGSFGVDKAVVYRGRPIVS-ASASLTIFPAMFNPEER
:: .: : :.: : ::::.:::.. :. :. :.::... . .:. ::...:
CCDS11 LATFGYSLSGQMDVDENFYPDLLVGSLS-DHIVLLRARPVINIVHKTLVPRPAVLDPAL-
430 440 450 460 470 480
520 530 540 550 560
pF1KB5 SCSLEGNPVACINLSFCL--NASGKHVADSIGFTVELQLDWQKQKGGVRRALFLASRQAT
:. ..:... .:. : :. . ..:. :. .... : : .:. ...
CCDS11 -CT----ATSCVQVELCFAYNQSAGNPNYRRNITLAYTLEADRDRRPPR--LRFAGSESA
490 500 510 520 530
570 580 590 600 610 620
pF1KB5 LTQTLLIQNGAREDCREMKIYLRNESEFRDKLSPIHIALNFSLDPQAPVDSH-GLR----
. . .. . : :..... : .. .:::: :: :..:.:: . : . :::
CCDS11 VFHGFFSMPEMR--CQKLELLLMDN--LRDKLRPIIISMNYSLPLRMPDRPRLGLRSLDA
540 550 560 570 580 590
630 640 650 660 670
pF1KB5 -PALHYQSKSRIEDKAQILLDCGEDNICVPDLQLEV--FGEQNHV-----YLGDKNALNL
: :. . . . ..:. .:: :: : .::... .::.. : : : :
CCDS11 YPILNQAQALENHTEVQFQKECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLL
600 610 620 630 640 650
680 690 700 710 720 730
pF1KB5 TFHAQNV------GEGGAYEAELRVTAPPEAEYSGLVRHPGNFSSLSCDYFAVNQSRLLV
.... :. :: :.:: : ...:: :. :: :: .:. .:.. .
CCDS11 SINVTNTRTSERSGED-AHEALLTLVVPPALLLSS-VRPPG-----ACQ---ANET--IF
660 670 680 690 700
740 750 760 770 780 790
pF1KB5 CDLGNPMKAGASLWGGLRFTVPHLRDTKKTIQFDFQILSKNLNNSQSDVVSFRLSVEAQA
:.::::.: . . . : : . . .: ..:. ... ... .. . : :.
CCDS11 CELGNPFKRNQRMELLIAFEVIGVTLHTRDLQVQLQLSTSSHQDNLWPMI-LTLLVDYTL
710 720 730 740 750 760
800 810 820 830 840 850
pF1KB5 QVTLNGVSKPEAVLFPVSDWHPRDQPQKEEDLGPAVHHVYELINQGPSSISQGVLELSCP
:..:. :.. .: . .. . ::.: ... ... .: . .. :.: :.
CCDS11 QTSLSMVNHRLQSFFG-GTVMGESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLE
770 780 790 800 810
860 870 880 890 900
pF1KB5 QALE---GQQLLYVTRVT--GLNCTTNHP----INPKGLEL-DPEGSLHHQQKREAPSRS
: :. ::: :..: : . .: ::: .: : :: :.:.
CCDS11 WPYEVSNGKWLLYPTEITVHGNGSWPCRPPGDLINPLNLTLSDPGDRPSSPQRRRRQLDP
820 830 840 850 860 870
910 920 930 940
pF1KB5 SASSGPQ--------------ILKCP--EAECFRLRCELGPLHQQESQSLQLHFRVWAKT
....:: .: : .:.: :.: . : .. .. ::: .:
CCDS11 GGGQGPPPVTLAAAKKAKSETVLTCATGRAHCVWLECPI-P-DAPVVTNVTVKARVWNST
880 890 900 910 920 930
950 960 970 980 990 1000
pF1KB5 FLQREHQPFSLQCEAVYKALKMPYRILPRQLPQKERQVATAVQWTKAEGSYG-VPLWIII
:.. ... :. . .: . : .. .: .. .. .: . . ::...
CCDS11 FIE-DYRDFDRVRVNGWATLFLRTSIPTINMENKTTWFSVDIDSELVEELPAEIELWLVL
940 950 960 970 980 990
1010 1020 1030 1040
pF1KB5 LAILFGLLLLGLLIYILYKLGFFKRSLP---YGTAMEKAQLKP-PATSDA
.:. :::::::.: .:.: :::::. : . .::..: :. ..
CCDS11 VAVGAGLLLLGLIILLLWKCGFFKRARTRALYEAKRQKAEMKSQPSETERLTDDY
1000 1010 1020 1030 1040 1050
>>CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086 aa)
initn: 434 init1: 146 opt: 576 Z-score: 574.3 bits: 118.0 E(32554): 1.1e-25
Smith-Waterman score: 670; 25.0% identity (56.6% similar) in 855 aa overlap (208-1030:270-1037)
180 190 200 210 220 230
pF1KB5 LSTDNFTRILEYAPCRSDFSWAAGQGYCQGGFSAEFTKTGRVVLGGPGSYFWQGQILSAT
:.::.... :..:.:. :. : : .:.
CCDS45 LFTELQKKIYVIEGTSKQDLTSFNMELSSSGISADLSR-GHAVVGAVGAKDWAGGFLDLK
240 250 260 270 280 290
240 250 260 270 280 290
pF1KB5 QEQIAESYYPEYLINLVQGQLQTRQASSIYDDSYLGYSVAVGEFSGDDTEDFVAGVPKGN
. ... . .. : .. . .::::.:. : . : ...:.:. .
CCDS45 ADLQDDTF--------IGNEPLTPEVRA----GYLGYTVTWLP-SRQKTSLLASGAPRYQ
300 310 320 330 340
300 310 320 330 340 350
pF1KB5 LTYGYVTILN----GSDIRSLYNFSGEQMASYFGYAVAATDVNGDGLDDLL-VGAPLLMD
.: : ... :. .. .. : :..:::: . ..::. :: .:: .::::..
CCDS45 -HMGRVLLFQEPQGGGHWSQVQTIHGTQIGSYFGGELCGVDVDQDGETELLLIGAPLFYG
350 360 370 380 390 400
360 370 380 390 400 410
pF1KB5 RTPDGRPQEVGRVYVYLQHPAGIEPTPTLTLTGHDEFGRFGSSLTPLGDLDQDGYNDVAI
. :. :::..: .. :.: . : .:::: ..: : :.. :: :::.
CCDS45 E------QRGGRVFIYQRRQLGFEEVSELQGDPGYPLGRFGEAITALTDINGDGLVDVAV
410 420 430 440 450
420 430 440 450 460 470
pF1KB5 GAPFGGETQQGVVFVFPGGPGGLGSKPSQVLQPLWAASHTPDFFGSALRGGRDLDGNGYP
:::. .::.:..: : :::. .::: .. . : ..:: ...: .::.:.:
CCDS45 GAPL---EEQGAVYIFNGRHGGLSPQPSQRIEGTQVLSGI-QWFGRSIHGVKDLEGDGLA
460 470 480 490 500 510
480 490 500 510 520 530
pF1KB5 DLIVGSFGVDKAVVYRGRPIVSASASLTIFPAMFNPEERSCSLE-GNPVAC-INLSFCLN
:. ::. . . .: .::.:. . ... :: . .: :: .: . .:...:..
CCDS45 DVAVGAES--QMIVLSSRPVVDMVTLMSFSPAEIPVHEVECSYSTSNKMKEGVNITICFQ
520 530 540 550 560 570
540 550 560 570 580
pF1KB5 AS-------GKHVADSIGFTVELQLDWQKQKGGVRRALFLASRQATLTQTLLIQNGARED
. :. ::. .: :::: .. . ::.:: ..:. : ... . .. .
CCDS45 IKSLIPQFQGRLVAN---LTYTLQLDGHRTR---RRGLFPGGRHE-LRRNIAVTTSM--S
580 590 600 610 620
590 600 610 620 630
pF1KB5 CREMKIYLRNESEFRDKLSPIHIALNFSL--DPQAPVDSHG-------LRPALHYQSKSR
: ...... .: .:::...::::: . .: :... :::.:: ..
CCDS45 CTDFSFHF--PVCVQDLISPINVSLNFSLWEEEGTPRDQRAGKDIPPILRPSLHSETWEI
630 640 650 660 670 680
640 650 660 670 680 690
pF1KB5 IEDKAQILLDCGEDNICVPDLQLEVFGEQNH-VYLGDKNALNLTFHAQNVGEGGAYEAEL
.: .::::. : .:.. ... . : .:.. . .:. : :: ..:
CCDS45 PFEK-----NCGEDKKCEANLRVSFSPARSRALRLTAFASLSVELSLSNLEED-AYWVQL
690 700 710 720 730
700 710 720 730 740
pF1KB5 RVTAPPEAEYSGL-VRHPGNFSSLSCDYFAVNQ---SRLLVCDLGNPM-KAGASLWGGLR
. :: . . . .: . .::. . .. :: : :....:. ::: :. .
CCDS45 DLHFPPGLSFRKVEMLKPHSQIPVSCEELPEESRLLSRALSCNVSSPIFKAGHSVALQMM
740 750 760 770 780 790
750 760 770 780 790 800
pF1KB5 FTVPHLRDTKKTIQFDFQILSKNLNNSQSDVVSFRLSVEAQAQVTLNGVSKPEAVLFPVS
:.. . .... .. :: .::. .: .. .:. . : .: ..
CCDS45 FNTLVNSSWGDSVELHANVTC---NNEDSDL------LEDNSATTIIPILYPINIL--IQ
800 810 820 830 840
810 820 830 840 850 860
pF1KB5 DWHPRDQPQKEEDLGPAVHHVYELINQGPSSISQGVLELSCPQALEGQQLLYVTRVTGL-
: . . :: .:.: .. . :. .. . . : .::. :.:.
CCDS45 DQEDSTLYVSFTPKGPKIHQVKHMYQ---VRIQPSIHDHNIP-TLEA--------VVGVP
850 860 870 880 890
870 880 890 900 910 920
pF1KB5 NCTTNHPINPK-GLELDPEGSLHHQQKREAPSRSSASSGPQILKCPEAECFRLRCELGPL
. .. ::. . .....: :... .. :. . ...:: . :: . .
CCDS45 QPPSEGPITHQWSVQMEPPVPCHYEDLERLPDAAEPCLPGALFRCPVV--FRQE-----I
900 910 920 930 940
930 940 950 960 970 980
pF1KB5 HQQESQSLQLHFRVWAKTFLQREHQPFSLQCEAVYKALKMPYRILPRQLPQKERQVATAV
: .:.: .. :... ::: : .. ... .. .: .. ..: .:
CCDS45 LVQVIGTLELVGEIEASSM-------FSL-CSSLSISFNSSKHF---HLYGSNASLAQVV
950 960 970 980 990
990 1000 1010 1020 1030 1040
pF1KB5 QWTKAEGSYGVP-LWIIILAILFGLLLLGLLIYILYKLGFFKRSLPYGTAMEKAQLKPPA
. :.. : :.. .:. . ::::: :.. .:::.:::::.:
CCDS45 M--KVDVVYEKQMLYLYVLSGIGGLLLLLLIFIVLYKVGFFKRNLKEKMEAGRGVPNGIP
1000 1010 1020 1030 1040 1050
pF1KB5 TSDA
CCDS45 AEDSEQLASGQEAGDPGCLKPLHEKDSESGGGKD
1060 1070 1080
1049 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 16:02:12 2016 done: Thu Nov 3 16:02:13 2016
Total Scan time: 5.150 Total Display time: 0.510
Function used was FASTA [36.3.4 Apr, 2011]