FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDB0059, 1137 aa
1>>>pF1KSDB0059 1137 - 1137 aa - 1137 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3801+/-0.000832; mu= 22.4602+/- 0.050
mean_var=78.1053+/-15.650, 0's: 0 Z-trim(107.8): 32 B-trim: 0 in 0/51
Lambda= 0.145122
statistics sampled from 9756 (9787) to 9756 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.301), width: 16
Scan time: 4.520
The best scores are: opt bits E(32554)
CCDS8888.1 ITGA7 gene_id:3679|Hs108|chr12 (1137) 7704 1623.2 0
CCDS55832.1 ITGA7 gene_id:3679|Hs108|chr12 (1141) 7444 1568.8 0
CCDS44914.1 ITGA7 gene_id:3679|Hs108|chr12 (1044) 6509 1373.0 0
CCDS2249.1 ITGA6 gene_id:3655|Hs108|chr2 (1073) 3020 642.5 1.5e-183
CCDS46451.1 ITGA6 gene_id:3655|Hs108|chr2 (1091) 3020 642.5 1.5e-183
CCDS82534.1 ITGA6 gene_id:3655|Hs108|chr2 ( 954) 2582 550.8 5.6e-156
CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035) 811 180.0 2.5e-44
CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032) 634 142.9 3.5e-33
CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170) 559 127.3 2.1e-28
CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188) 553 126.0 5e-28
CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086) 552 125.8 5.4e-28
CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051) 549 125.2 8.2e-28
CCDS45470.1 ITGAM gene_id:3684|Hs108|chr16 (1152) 468 108.2 1.1e-22
CCDS54004.1 ITGAM gene_id:3684|Hs108|chr16 (1153) 466 107.8 1.5e-22
CCDS10711.1 ITGAX gene_id:3687|Hs108|chr16 (1163) 446 103.6 2.8e-21
CCDS67014.1 ITGAX gene_id:3687|Hs108|chr16 (1169) 446 103.6 2.8e-21
CCDS32531.1 ITGAE gene_id:3682|Hs108|chr17 (1179) 442 102.8 5e-21
CCDS32438.1 ITGAD gene_id:3681|Hs108|chr16 (1161) 434 101.1 1.6e-20
CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063) 433 100.9 1.7e-20
CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039) 412 96.5 3.5e-19
CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002) 369 87.5 1.7e-16
CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012) 369 87.5 1.8e-16
CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048) 369 87.5 1.8e-16
>>CCDS8888.1 ITGA7 gene_id:3679|Hs108|chr12 (1137 aa)
initn: 7704 init1: 7704 opt: 7704 Z-score: 8708.3 bits: 1623.2 E(32554): 0
Smith-Waterman score: 7704; 100.0% identity (100.0% similar) in 1137 aa overlap (1-1137:1-1137)
10 20 30 40 50 60
pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVTNIDSSDPDQLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVTNIDSSDPDQLV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD YKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 YKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD SASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD QGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 QGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD VVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 VVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD VSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 VSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD PRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 PRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD RLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 RLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD TEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD LHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEV
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD ELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 ELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD KYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 KYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPN
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD ILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 ILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVF
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD SCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVI
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD PVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 PVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130
pF1KSD VKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 VKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
1090 1100 1110 1120 1130
>>CCDS55832.1 ITGA7 gene_id:3679|Hs108|chr12 (1141 aa)
initn: 7454 init1: 5898 opt: 7444 Z-score: 8414.1 bits: 1568.8 E(32554): 0
Smith-Waterman score: 7444; 97.0% identity (97.3% similar) in 1148 aa overlap (1-1137:1-1141)
10 20 30 40 50 60
pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE
130 140 150 160 170 180
190 200 210 220 230
pF1KSD WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVT-----NIDSSD
:::::::::::::::::::::::::::::::::::::::::::: : . : .
CCDS55 WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGTARVELCAQGSADLAH
190 200 210 220 230 240
240 250 260 270 280
pF1KSD PDQLVY-----KTLDPADRL-PGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRAN
:. : : :: :: : :: :::.::::::::::::::::::::::::::
CCDS55 LDDGPYEAGGEKEQDP--RLIPVPA-----NSYFGFSIDSGKGLVRAEELSFVAGAPRAN
250 260 270 280 290
290 300 310 320 330 340
pF1KSD HKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQE
300 310 320 330 340 350
350 360 370 380 390 400
pF1KSD ELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDG
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD KVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLF
420 430 440 450 460 470
470 480 490 500 510 520
pF1KSD RARPILHVSHEVSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RARPILHVSHEVSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLD
480 490 500 510 520 530
530 540 550 560 570 580
pF1KSD ADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAI
540 550 560 570 580 590
590 600 610 620 630 640
pF1KSD VVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQL
600 610 620 630 640 650
650 660 670 680 690 700
pF1KSD VRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAH
660 670 680 690 700 710
710 720 730 740 750 760
pF1KSD EAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 EAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTS
720 730 740 750 760 770
770 780 790 800 810 820
pF1KSD GISIETTELEVELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GISIETTELEVELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERA
780 790 800 810 820 830
830 840 850 860 870 880
pF1KSD MQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGP
840 850 860 870 880 890
890 900 910 920 930 940
pF1KSD GQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLD
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KSD CARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIK
960 970 980 990 1000 1010
1010 1020 1030 1040 1050 1060
pF1KSD NLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAK
1020 1030 1040 1050 1060 1070
1070 1080 1090 1100 1110 1120
pF1KSD HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPD
1080 1090 1100 1110 1120 1130
1130
pF1KSD GHPGPGTA
::::::::
CCDS55 GHPGPGTA
1140
>>CCDS44914.1 ITGA7 gene_id:3679|Hs108|chr12 (1044 aa)
initn: 6511 init1: 5898 opt: 6509 Z-score: 7356.7 bits: 1373.0 E(32554): 0
Smith-Waterman score: 6509; 94.7% identity (95.8% similar) in 1036 aa overlap (114-1137:17-1044)
90 100 110 120 130 140
pF1KSD QANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKENQ-WLGVSVRSQGPGGKIVTCAH
.:.... : : ..: . :: ::::
CCDS44 MAPFATPMVQALTTTRIQRQAEGFQCWRECGTRRSPFEGK-ETCAH
10 20 30 40
150 160 170 180 190 200
pF1KSD RYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTA
50 60 70 80 90 100
210 220 230 240 250
pF1KSD AAFSPDSHYLLFGAPGTYNWKGLLFVT-----NIDSSDPDQLVY-----KTLDPADRL-P
:::::::::::::::::::::: : . : . :. : : :: :: :
CCDS44 AAFSPDSHYLLFGAPGTYNWKGTARVELCAQGSADLAHLDDGPYEAGGEKEQDP--RLIP
110 120 130 140 150 160
260 270 280 290 300 310
pF1KSD GPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKDSASRLVPEVML
:: :::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VPA-----NSYFGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKDSASRLVPEVML
170 180 190 200 210
320 330 340 350 360 370
pF1KSD SGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISPL
220 230 240 250 260 270
380 390 400 410 420 430
pF1KSD RLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEG
280 290 300 310 320 330
440 450 460 470 480 490
pF1KSD EAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLE
340 350 360 370 380 390
500 510 520 530 540 550
pF1KSD QPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLE
400 410 420 430 440 450
560 570 580 590 600 610
pF1KSD EPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGL
460 470 480 490 500 510
620 630 640 650 660 670
pF1KSD PPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVD
520 530 540 550 560 570
680 690 700 710 720 730
pF1KSD GTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDP
580 590 600 610 620 630
740 750 760 770 780 790
pF1KSD AEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE
640 650 660 670 680 690
800 810 820 830 840 850
pF1KSD LHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQ
700 710 720 730 740 750
860 870 880 890 900 910
pF1KSD SLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDR
760 770 780 790 800 810
920 930 940 950 960 970
pF1KSD RRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFDRAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFDRAA
820 830 840 850 860 870
980 990 1000 1010 1020 1030
pF1KSD VLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAV
880 890 900 910 920 930
1040 1050 1060 1070 1080 1090
pF1KSD VAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQF
940 950 960 970 980 990
1100 1110 1120 1130
pF1KSD KEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
1000 1010 1020 1030 1040
>>CCDS2249.1 ITGA6 gene_id:3655|Hs108|chr2 (1073 aa)
initn: 2525 init1: 635 opt: 3020 Z-score: 3408.6 bits: 642.5 E(32554): 1.5e-183
Smith-Waterman score: 3412; 48.4% identity (76.1% similar) in 1094 aa overlap (12-1083:4-1059)
10 20 30 40 50
pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSR-AVAFNLDVM--GALRKEGEPGSLFGFSVA
:. .: :. : :.:: ..:::::. ...:: :.::::::::.:
CCDS22 MAAAGQLCLLY---LSAGLLSRLGAAFNLDTREDNVIRKYGDPGSLFGFSLA
10 20 30 40
60 70 80 90 100 110
pF1KSD LHRQLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKE
.: ::::. . ::::::.: ::: :.:::::::..: .. . : :...:. :: .:
CCDS22 MHWQLQPEDKRLLLVGAPRAEALPLQRANRTGGLYSCDIT-ARGPCTRIEFDNDADPTSE
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD SKENQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELD
:::.::.::.:.:::::::.:::::::: ::.:. :.::..:::.::::.: :.:..:
CCDS22 SKEDQWMGVTVQSQGPGGKVVTCAHRYEKRQHVNTKQESRDIFGRCYVLSQNLRIEDDMD
110 120 130 140 150 160
180 190 200 210 220
pF1KSD GGEWKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLL---------FV
::.:.::.:: .:::.:: ::::.::.:. : ::..:::::::::::.. :
CCDS22 GGDWSFCDGRLRGHEKFGSCQQGVAATFTKDFHYIVFGAPGTYNWKGIVRVEQKNNTFFD
170 180 190 200 210 220
230 240 250 260 270 280
pF1KSD TNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRA
:: . : .. .: . .: :: :::::::.:::::.: .:..::.:::::
CCDS22 MNIFEDGPYEVGGETEHDESLVPVPA-----NSYLGFSLDSGKGIVSKDEITFVSGAPRA
230 240 250 260 270 280
290 300 310 320 330 340
pF1KSD NHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFER
::.::::.:..: : .:.:: ...:: :.:.:::..::.:::.::: :...::: .:.:
CCDS22 NHSGAVVLLKRDMKSAHLLPEHIFDGEGLASSFGYDVAVVDLNKDGWQDIVIGAPQYFDR
290 300 310 320 330 340
350 360 370 380 390 400
pF1KSD QEELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDG
. :.:::::::.:: :.: ...:.:: :. ::::::.. .::.::::.::::::::.:
CCDS22 DGEVGGAVYVYMNQQGRWNNVKPIRLNGTKDSMFGIAVKNIGDINQDGYPDIAVGAPYDD
350 360 370 380 390 400
410 420 430 440 450 460
pF1KSD DGKVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAV
:::::::::. :. .::.:::.: . ::::..:..:.: :.:::. ::::.:...
CCDS22 LGKVFIYHGSANGINTKPTQVLKGIS---PYFGYSIAGNMDLDRNSYPDVAVGSLSDSVT
410 420 430 440 450 460
470 480 490 500 510 520
pF1KSD LFRARPILHVSHEVSIAPRSIDLEQPN-CAGGHSVCVDLRVCFSYIAVPSSYSPTVALDY
.::.::...... ....: :::.: . :.. ..:.... :: : : :..:.:....
CCDS22 IFRSRPVINIQKTITVTPNRIDLRQKTACGAPSGICLQVKSCFEYTANPAGYNPSISIVG
470 480 490 500 510 520
530 540 550 560 570 580
pF1KSD VLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKL
.:.:. .:: : :: : ... :::. : ::.:...:: . . ::.:..:::
CCDS22 TLEAEKERRKSGLSSRVQFRNQG-SEPKYTQELT--LKRQKQKVCMEETLWLQDNIRDKL
530 540 550 560 570
590 600 610 620 630 640
pF1KSD RAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSN
: : .: : .: : ::.. ..:: : ::::. .:.: . ..::::.:::.:..:.::
CCDS22 RPIPITASVEIQEPSSRRRV--NSLPEVLPILNSDEPKTAHIDVHFLKEGCGDDNVCNSN
580 590 600 610 620 630
650 660 670 680 690 700
pF1KSD LQLVRARFCTRVSDTE-FQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADG
:.: . .:::: .. . :. ::.. :. : .:. : :.::. ::: ::.: .: ::
CCDS22 LKL-EYKFCTREGNQDKFSYLPIQ-KGVPEL-VLKDQKDIALEITVTNSPSNPRNPTKDG
640 650 660 670 680 690
710 720 730 740 750 760
pF1KSD DDAHEAQLLVMLPDSLHYSGVRALD--PAEKPLCLSNENASHVECELGNPMKRGAQVTFY
::::::.:.. .::.: ::. : : : .. :..:.:.:...::::::.::...::::
CCDS22 DDAHEAKLIATFPDTLTYSAYRELRAFPEKQLSCVANQNGSQADCELGNPFKRNSNVTFY
700 710 720 730 740 750
770 780 790 800 810 820
pF1KSD LILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIELPLSIAGMAIPQQLFFSG
:.:::. ....: .:...: : : :.:. : :..:.:.: ::: ::..:.: :.:..:.:
CCDS22 LVLSTTEVTFDTPDLDINLKLETTSNQDNLAPITAKAKVVIELLLSVSGVAKPSQVYFGG
760 770 780 790 800 810
830 840 850 860 870 880
pF1KSD VVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVE
.: ::.::.:: .::: ..:: : : :. : .::.: :::.::.::.::::::: ..::
CCDS22 TVVGEQAMKSEDEVGSLIEYEFRVINLGKPLTNLGTATLNIQWPKEISNGKWLLYLVKVE
820 830 840 850 860 870
890 900 910 920 930 940
pF1KSD LEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEK
.: .: : :. .: :.. :.. : :.: .:. .: . ::.
CCDS22 SKGL----EKVTCEPQKEINSLNLTESHNSRKKREITEKQIDDNRK---FSLF----AER
880 890 900 910 920
950 960 970 980 990 1000
pF1KSD KKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANI
: . ::.:. .. ::: . ::: ..: : : . .:::::::::::: .. :....:: :
CCDS22 KYQ-TLNCSVNV-NCVNIRCPLRGLDSKASLILRSRLWNSTFLEEYSKLNYLDILMRAFI
930 940 950 960 970
1010 1020 1030 1040 1050 1060
pF1KSD TVKSSIKNLMLRDASTVIPVMVYLDPMAVVAE--GVPWWVILLAVLAGLLVLALLVLLLW
: .. .:. : .:.: . : :. : .::. :::::.::.:.:::.:.:::::..::
CCDS22 DVTAAAENIRLPNAGTQVRVTVF--PSKTVAQYSGVPWWIILVAILAGILMLALLVFILW
980 990 1000 1010 1020 1030
1070 1080 1090 1100 1110
pF1KSD KMGFFKRAK--HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPIL
: ::::: : : .:: :: ..:
CCDS22 KCGFFKRNKKDHYDAT---YHKAEIHAQPSDKERLTSDA
1040 1050 1060 1070
>>CCDS46451.1 ITGA6 gene_id:3655|Hs108|chr2 (1091 aa)
initn: 2528 init1: 635 opt: 3020 Z-score: 3408.5 bits: 642.5 E(32554): 1.5e-183
Smith-Waterman score: 3473; 48.0% identity (76.4% similar) in 1113 aa overlap (12-1104:4-1080)
10 20 30 40 50
pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSR-AVAFNLDVM--GALRKEGEPGSLFGFSVA
:. .: :. : :.:: ..:::::. ...:: :.::::::::.:
CCDS46 MAAAGQLCLLY---LSAGLLSRLGAAFNLDTREDNVIRKYGDPGSLFGFSLA
10 20 30 40
60 70 80 90 100 110
pF1KSD LHRQLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKE
.: ::::. . ::::::.: ::: :.:::::::..: .. . : :...:. :: .:
CCDS46 MHWQLQPEDKRLLLVGAPRAEALPLQRANRTGGLYSCDIT-ARGPCTRIEFDNDADPTSE
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD SKENQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELD
:::.::.::.:.:::::::.:::::::: ::.:. :.::..:::.::::.: :.:..:
CCDS46 SKEDQWMGVTVQSQGPGGKVVTCAHRYEKRQHVNTKQESRDIFGRCYVLSQNLRIEDDMD
110 120 130 140 150 160
180 190 200 210 220
pF1KSD GGEWKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLL---------FV
::.:.::.:: .:::.:: ::::.::.:. : ::..:::::::::::.. :
CCDS46 GGDWSFCDGRLRGHEKFGSCQQGVAATFTKDFHYIVFGAPGTYNWKGIVRVEQKNNTFFD
170 180 190 200 210 220
230 240 250 260 270 280
pF1KSD TNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRA
:: . : .. .: . .: :: :::::::.:::::.: .:..::.:::::
CCDS46 MNIFEDGPYEVGGETEHDESLVPVPA-----NSYLGFSLDSGKGIVSKDEITFVSGAPRA
230 240 250 260 270 280
290 300 310 320 330 340
pF1KSD NHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFER
::.::::.:..: : .:.:: ...:: :.:.:::..::.:::.::: :...::: .:.:
CCDS46 NHSGAVVLLKRDMKSAHLLPEHIFDGEGLASSFGYDVAVVDLNKDGWQDIVIGAPQYFDR
290 300 310 320 330 340
350 360 370 380 390 400
pF1KSD QEELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDG
. :.:::::::.:: :.: ...:.:: :. ::::::.. .::.::::.::::::::.:
CCDS46 DGEVGGAVYVYMNQQGRWNNVKPIRLNGTKDSMFGIAVKNIGDINQDGYPDIAVGAPYDD
350 360 370 380 390 400
410 420 430 440 450 460
pF1KSD DGKVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAV
:::::::::. :. .::.:::.: . ::::..:..:.: :.:::. ::::.:...
CCDS46 LGKVFIYHGSANGINTKPTQVLKGIS---PYFGYSIAGNMDLDRNSYPDVAVGSLSDSVT
410 420 430 440 450 460
470 480 490 500 510 520
pF1KSD LFRARPILHVSHEVSIAPRSIDLEQPN-CAGGHSVCVDLRVCFSYIAVPSSYSPTVALDY
.::.::...... ....: :::.: . :.. ..:.... :: : : :..:.:....
CCDS46 IFRSRPVINIQKTITVTPNRIDLRQKTACGAPSGICLQVKSCFEYTANPAGYNPSISIVG
470 480 490 500 510 520
530 540 550 560 570 580
pF1KSD VLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKL
.:.:. .:: : :: : ... :::. : ::.:...:: . . ::.:..:::
CCDS46 TLEAEKERRKSGLSSRVQFRNQG-SEPKYTQELT--LKRQKQKVCMEETLWLQDNIRDKL
530 540 550 560 570
590 600 610 620 630 640
pF1KSD RAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSN
: : .: : .: : ::.. ..:: : ::::. .:.: . ..::::.:::.:..:.::
CCDS46 RPIPITASVEIQEPSSRRRV--NSLPEVLPILNSDEPKTAHIDVHFLKEGCGDDNVCNSN
580 590 600 610 620 630
650 660 670 680 690 700
pF1KSD LQLVRARFCTRVSDTE-FQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADG
:.: . .:::: .. . :. ::.. :. : .:. : :.::. ::: ::.: .: ::
CCDS46 LKL-EYKFCTREGNQDKFSYLPIQ-KGVPEL-VLKDQKDIALEITVTNSPSNPRNPTKDG
640 650 660 670 680 690
710 720 730 740 750 760
pF1KSD DDAHEAQLLVMLPDSLHYSGVRALD--PAEKPLCLSNENASHVECELGNPMKRGAQVTFY
::::::.:.. .::.: ::. : : : .. :..:.:.:...::::::.::...::::
CCDS46 DDAHEAKLIATFPDTLTYSAYRELRAFPEKQLSCVANQNGSQADCELGNPFKRNSNVTFY
700 710 720 730 740 750
770 780 790 800 810 820
pF1KSD LILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIELPLSIAGMAIPQQLFFSG
:.:::. ....: .:...: : : :.:. : :..:.:.: ::: ::..:.: :.:..:.:
CCDS46 LVLSTTEVTFDTPDLDINLKLETTSNQDNLAPITAKAKVVIELLLSVSGVAKPSQVYFGG
760 770 780 790 800 810
830 840 850 860 870 880
pF1KSD VVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVE
.: ::.::.:: .::: ..:: : : :. : .::.: :::.::.::.::::::: ..::
CCDS46 TVVGEQAMKSEDEVGSLIEYEFRVINLGKPLTNLGTATLNIQWPKEISNGKWLLYLVKVE
820 830 840 850 860 870
890 900 910 920 930 940
pF1KSD LEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEK
.: .: : :. .: :.. :.. : :.: .:. .: . ::.
CCDS46 SKG----LEKVTCEPQKEINSLNLTESHNSRKKREITEKQIDDNRK---FSLF----AER
880 890 900 910 920
950 960 970 980 990 1000
pF1KSD KKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANI
: . ::.:. .. ::: . ::: ..: : : . .:::::::::::: .. :....:: :
CCDS46 KYQ-TLNCSVNV-NCVNIRCPLRGLDSKASLILRSRLWNSTFLEEYSKLNYLDILMRAFI
930 940 950 960 970
1010 1020 1030 1040 1050 1060
pF1KSD TVKSSIKNLMLRDASTVIPVMVYLDPMAVVAE--GVPWWVILLAVLAGLLVLALLVLLLW
: .. .:. : .:.: . : :. : .::. :::::.::.:.:::.:.:::::..::
CCDS46 DVTAAAENIRLPNAGTQVRVTVF--PSKTVAQYSGVPWWIILVAILAGILMLALLVFILW
980 990 1000 1010 1020 1030
1070 1080 1090 1100 1110 1120
pF1KSD KMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAA
: :::::... . .::.::::.: .:.:. :. .. ...:
CCDS46 KCGFFKRSRYDD-SVPRYHAVRIRKEEREIKDEKYIDNLEKKQWITKWNENESYS
1040 1050 1060 1070 1080 1090
1130
pF1KSD DGHPELGPDGHPGPGTA
>>CCDS82534.1 ITGA6 gene_id:3655|Hs108|chr2 (954 aa)
initn: 2358 init1: 1160 opt: 2582 Z-score: 2913.8 bits: 550.8 E(32554): 5.6e-156
Smith-Waterman score: 3167; 49.3% identity (77.8% similar) in 970 aa overlap (124-1083:1-940)
100 110 120 130 140 150
pF1KSD CPLSLEETDCYRVDIDQGADMQKESKENQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQI
.::.:.:::::::.:::::::: ::.:.
CCDS82 MGVTVQSQGPGGKVVTCAHRYEKRQHVNTK
10 20 30
160 170 180 190 200 210
pF1KSD LETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLL
:.::..:::.::::.: :.:..:::.:.::.:: .:::.:: ::::.::.:. : ::..
CCDS82 QESRDIFGRCYVLSQNLRIEDDMDGGDWSFCDGRLRGHEKFGSCQQGVAATFTKDFHYIV
40 50 60 70 80 90
220 230 240 250 260 270
pF1KSD FGAPGTYNWKGLLFVTNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKGL
::::::::::::::.:... .::::.:::: : .. : :. .:::::::.:::::.
CCDS82 FGAPGTYNWKGLLFLTSVSYTDPDQFVYKTRPPREQ-PDTFPDVMMNSYLGFSLDSGKGI
100 110 120 130 140
280 290 300 310 320 330
pF1KSD VRAEELSFVAGAPRANHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSD
: .:..::.:::::::.::::.:..: : .:.:: ...:: :.:.:::..::.:::.:
CCDS82 VSKDEITFVSGAPRANHSGAVVLLKRDMKSAHLLPEHIFDGEGLASSFGYDVAVVDLNKD
150 160 170 180 190 200
340 350 360 370 380 390
pF1KSD GWPDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLN
:: :...::: .:.:. :.:::::::.:: :.: ...:.:: :. ::::::.. .::.:
CCDS82 GWQDIVIGAPQYFDRDGEVGGAVYVYMNQQGRWNNVKPIRLNGTKDSMFGIAVKNIGDIN
210 220 230 240 250 260
400 410 420 430 440 450
pF1KSD QDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGN
:::.::::::::.: :::::::::. :. .::.:::.: . ::::..:..:.: :
CCDS82 QDGYPDIAVGAPYDDLGKVFIYHGSANGINTKPTQVLKGIS---PYFGYSIAGNMDLDRN
270 280 290 300 310 320
460 470 480 490 500 510
pF1KSD QYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLEQPN-CAGGHSVCVDLRVCFSY
.:::. ::::.:....::.::...... ....: :::.: . :.. ..:.... :: :
CCDS82 SYPDVAVGSLSDSVTIFRSRPVINIQKTITVTPNRIDLRQKTACGAPSGICLQVKSCFEY
330 340 350 360 370 380
520 530 540 550 560 570
pF1KSD IAVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVC
: :..:.:.... .:.:. .:: : :: : ... :::. : ::.:...::
CCDS82 TANPAGYNPSISIVGTLEAEKERRKSGLSSRVQFRNQG-SEPKYTQELT--LKRQKQKVC
390 400 410 420 430 440
580 590 600 610 620 630
pF1KSD GDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIH
. . ::.:..:::: : .: : .: : ::.. ..:: : ::::. .:.: . ..:
CCDS82 MEETLWLQDNIRDKLRPIPITASVEIQEPSSRRRV--NSLPEVLPILNSDEPKTAHIDVH
450 460 470 480 490 500
640 650 660 670 680 690
pF1KSD FLKQGCGEDKICQSNLQLVRARFCTRVSDTE-FQPLPMDVDGTTALFALSGQPVIGLELM
:::.:::.:..:.:::.: . .:::: .. . :. ::.. :. : .:. : :.::.
CCDS82 FLKEGCGDDNVCNSNLKL-EYKFCTREGNQDKFSYLPIQ-KGVPEL-VLKDQKDIALEIT
510 520 530 540 550
700 710 720 730 740
pF1KSD VTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALD--PAEKPLCLSNENASHVEC
::: ::.: .: ::::::::.:.. .::.: ::. : : : .. :..:.:.:...:
CCDS82 VTNSPSNPRNPTKDGDDAHEAKLIATFPDTLTYSAYRELRAFPEKQLSCVANQNGSQADC
560 570 580 590 600 610
750 760 770 780 790 800
pF1KSD ELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIELPL
:::::.::...:::::.:::. ....: .:...: : : :.:. : :..:.:.: ::: :
CCDS82 ELGNPFKRNSNVTFYLVLSTTEVTFDTPDLDINLKLETTSNQDNLAPITAKAKVVIELLL
620 630 640 650 660 670
810 820 830 840 850 860
pF1KSD SIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPH
:..:.: :.:..:.:.: ::.::.:: .::: ..:: : : :. : .::.: :::.::.
CCDS82 SVSGVAKPSQVYFGGTVVGEQAMKSEDEVGSLIEYEFRVINLGKPLTNLGTATLNIQWPK
680 690 700 710 720 730
870 880 890 900 910 920
pF1KSD EIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGER
::.::::::: ..:: .: . : : :. .: :.. :.. : :.: .:
CCDS82 EISNGKWLLYLVKVESKGLE----KVTCEPQKEINSLNLTESHNSRKKREITEKQIDDNR
740 750 760 770 780 790
930 940 950 960 970 980
pF1KSD QEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEE
. .: . ::.: . ::.:. .. ::: . ::: ..: : : . .::::::::::
CCDS82 K---FSLF----AERKYQ-TLNCSVNV-NCVNIRCPLRGLDSKASLILRSRLWNSTFLEE
800 810 820 830 840
990 1000 1010 1020 1030 1040
pF1KSD YSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAVVAE--GVPWWVILLAV
:: .. :....:: : : .. .:. : .:.: . : :. : .::. :::::.::.:.
CCDS82 YSKLNYLDILMRAFIDVTAAAENIRLPNAGTQVRVTVF--PSKTVAQYSGVPWWIILVAI
850 860 870 880 890 900
1050 1060 1070 1080 1090 1100
pF1KSD LAGLLVLALLVLLLWKMGFFKRAK--HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNN
:::.:.:::::..::: ::::: : : .:: :: ..:
CCDS82 LAGILMLALLVFILWKCGFFKRNKKDHYDAT---YHKAEIHAQPSDKERLTSDA
910 920 930 940 950
1110 1120 1130
pF1KSD WGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
>>CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035 aa)
initn: 513 init1: 206 opt: 811 Z-score: 909.4 bits: 180.0 E(32554): 2.5e-44
Smith-Waterman score: 1257; 28.0% identity (57.4% similar) in 1103 aa overlap (9-1067:7-1009)
10 20 30 40 50 60
pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR
: ::. . :. .:.: . : :.::: . .. .: :.::..: :
CCDS26 MGGPAAPRGAGRLRALLLALVVAGI--PAGAYNLDPQRPVHFQGPADSFFGYAVLEHF
10 20 30 40 50
70 80 90 100 110
pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLE-ETDCYRVDIDQGADMQ----
. . : :.:::::.: . . ... :..: : . . . : ..:. .: .
CCDS26 HDNTR---WVLVGAPKADSKYSPSVKSPGAVFKCRVHTNPDRRCTELDMARGKNRGTSCG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD ---KESKENQWLGVSV-RSQGPGGKIVTCAHRYEA-RQRVDQILETRDMIGRCFVLSQDL
.:.....:.:::. :. :....::::.. ..:.:: : :... ..:
CCDS26 KTCREDRDDEWMGVSLARQPKADGRVLACAHRWKNIYYEADHILPH----GFCYIIPSNL
120 130 140 150 160
180 190 200 210 220
pF1KSD AIRDELDGGEWKFC--EGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFV
. : : : . . :. : :: : :. :. . ...::::.. : : . :
CCDS26 QAK----GRTLIPCYEEYKKKYGEEHGSCQAGIAGFFTEE--LVVMGAPGSFYWAGTIKV
170 180 190 200 210 220
230 240 250 260 270 280
pF1KSD TNIDSSDPDQLVYKTLDPADRLPGPAGDLALN---SYLGFSIDSGKGLVRAEELSFVAGA
:. :. : : .. .: .:::... .:. . . .. :.::
CCDS26 LNLT----DNTYLKLND----------EVIMNRRYTYLGYAVTAGH-FSHPSTIDVVGGA
230 240 250 260
290 300 310 320 330 340
pF1KSD PRANHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYF
:. . : : :.: : : :. . ::... : :: :: ..:::.:: ::.::::.:
CCDS26 PQDKGIGKVYIFRADRRSGTLIKIFQASGKKMGSYFGSSLCAVDLNGDGLSDLLVGAPMF
270 280 290 300 310 320
350 360 370 380 390 400
pF1KSD FERQEELGGAVYVYLNQG-GHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGA
: ..: : : ::.:.: : : :. .. :: :.: : ::..:::::.:.::
CCDS26 SEIRDE--GQVTVYINRGNGALEEQLALTGDGAYNAHFGESIASLDDLDNDGFPDVAIGA
330 340 350 360 370 380
410 420 430 440 450
pF1KSD PFDGD--GKVFIYHGSSLGVVAKPSQVLEGEAVG--IKSFGYSLSGSLDMDGNQYPDLLV
: . : : :.::::.. :.: . :. : :. .. .. :: :.::..::::: :::. :
CCDS26 PKEDDFAGAVYIYHGDAGGIVPQYSMKLSGQKINPVLRMFGQSISGGIDMDGNGYPDVTV
390 400 410 420 430 440
460 470 480 490 500 510
pF1KSD GS-LADTAVLFRARPILHVSHEVSI-APRSIDLEQPNCAGGHSV--CVDLRVCFSYIAVP
:. ..:..::.::::.. : .::: : ::.. :.: :.. :... .:::.
CCDS26 GAFMSDSVVLLRARPVITV--DVSIFLPGSINITAPQCHDGQQPVNCLNVTTCFSF---H
450 460 470 480 490 500
520 530 540 550 560 570
pF1KSD SSYSP-TVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDA
... : ..:.::: ::. .. .::.::: :. : : :.. . : .. ...:
CCDS26 GKHVPGEIGLNYVLMADVAKKEKGQMPRVYFVL--LGETMGQVTEKLQLTYM-EETCRHY
510 520 530 540 550
580 590 600 610 620 630
pF1KSD MFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVAPIL--NAHQPSTQRAEIHF
. .... :.: . :: .:::. .. . :::..:.: . : .:. . :
CCDS26 VAHVKRRVQDVISPIVFEAAYSLSEHVTGEEE--RELPPLTPVLRWKKGQKIAQKNQTVF
560 570 580 590 600 610
640 650 660 670 680 690
pF1KSD LKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVT
.. .:: : ..::: . . : ..: : .::.. :.:.. ..
CCDS26 ERNCRSED--CAADLQL------------QGKLLLSSMDEKTLYLALGAVKNISLNISIS
620 630 640 650 660
700 710 720 730 740 750
pF1KSD NLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHVECELGN
:: ::::..:.. . : . . . : . ... ..: .:
CCDS26 NL----------GDDAYDANVSFNVSRELFF--INMWQKEEMGISCELLESDFLKCSVGF
670 680 690 700 710
760 770 780 790 800
pF1KSD P-MKRGAQVTFYLILSTSGISIETTELEVELLLATISEQELHPVSARARVFI-----ELP
: :. .. : .:..:: .: : : . . . .. . . . :.. :.
CCDS26 PFMRSKSKYEFSVIFDTSHLSGEEEVLSFIVTAQSGNTERSESLHDNTLVLMVPLMHEVD
720 730 740 750 760 770
810 820 830 840 850 860
pF1KSD LSIAGMAIPQQLFFSGVVRGERAMQSERDVGSK---VKYEVTVSNQGQSLRTLGSAFLNI
::.:. : .. .. : . .: . :. . .. . : : : : :: .. ..:
CCDS26 TSITGIMSPTSFVYGESVDAANFIQLD-DLECHFQPINITLQVYNTGPS--TLPGSSVSI
780 790 800 810 820
870 880 890 900 910 920
pF1KSD MWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQE
.:.....: .. .: :. :: .:: :: . : :
CCDS26 SFPNRLSSGGAEMFHVQ-EMVVGQ---EKGNCSFQKN-----------------PTPCII
830 840 850 860
930 940 950 960 970 980
pF1KSD PGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSF--DRAAVLHVWGRLWN
: :... . . . .: .::: . .:.. : . .. ... .. .. : :
CCDS26 PQEQENIFHTIFAFFTKSGRK--VLDCEKPGISCLTAHCNFSALAKEESRTIDIY-MLLN
870 880 890 900 910 920
990 1000 1010 1020 1030
pF1KSD STFLEEYSAVKSLEVIVRANITVKSSIKNLML-----RDASTVIPVMVYLDPMAVVAEGV
. .:.. :. . .. . ::.. : ... . . .....:. .. :.: . :. :
CCDS26 TEILKKDSS-SVIQFMSRAKVKVDPALRVVEIAHGNPEEVTVVFEALHNLEPRGYVV-G-
930 940 950 960 970 980
1040 1050 1060 1070 1080 1090
pF1KSD PWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKT
:.: ...:.:.:.. ::..::::::::.:
CCDS26 --WIIAISLLVGILIFLLLAVLLWKMGFFRRRYKEIIEAEKNRKENEDSWDWVQKNQ
990 1000 1010 1020 1030
1100 1110 1120 1130
pF1KSD GTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
>>CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032 aa)
initn: 541 init1: 120 opt: 634 Z-score: 709.1 bits: 142.9 E(32554): 3.5e-33
Smith-Waterman score: 1068; 27.2% identity (56.7% similar) in 1104 aa overlap (1-1067:1-1007)
10 20 30 40 50 60
pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR
:: :.: . ::. : . .:.:. .:: .: ..:::.::.::
CCDS42 MAWEARREPGPRRAAVRETVMLLLCLGVPTGRPYNVDTESALLYQGPHNTLFGYSVVLHS
10 20 30 40 50 60
70 80 90 100 110
pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETD-CYRVDIDQ--GADMQK-
. : ::::::: : : . .. :... : .. . . : .... . : :
CCDS42 HGANR---WLLVGAPTANWLANASVINPGAIYRCRIGKNPGQTCEQLQLGSPNGEPCGKT
70 80 90 100 110
120 130 140 150 160 170
pF1KSD --ESKENQWLGVSV-RSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIR
: ..::::::.. :. : .:.::::.::.. . . :.. : :. . :: :
CCDS42 CLEERDNQWLGVTLSRQPGENGSIVTCGHRWKNIFYIKN--ENKLPTGGCYGVPPDL--R
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD DELDGGEWKFC--EGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVTNI
::. . : . . :.:. :: : .. .. : ...::::. : : ::: ::
CCDS42 TELSK-RIAPCYQDYVKKFGENFASCQAGISSFYTKD--LIVMGAPGSSYWTGSLFVYNI
180 190 200 210 220 230
240 250 260 270 280
pF1KSD DSSDPDQLVYKT-LDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELS-FVAGAPRAN
.. ::. :: ... ..::::.:. : : :... . :.:::. .
CCDS42 TTNK-----YKAFLDKQNQV-------KFGSYLGYSV--GAGHFRSQHTTEVVGGAPQHE
240 250 260 270
290 300 310 320 330 340
pF1KSD HKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQE
. : . :. : . . : .:..: : :: :. ..:::.::. ::.::::. .:
CCDS42 QIGKAYIFSIDEKELNILHEM-KGKKLGSYFGASVCAVDLNADGFSDLLVGAPMQSTIRE
280 290 300 310 320 330
350 360 370 380 390 400
pF1KSD ELGGAVYVYLNQG-GHWAGISPLRLCGSPD--SMFGISLAVLGDLNQDGFPDIAVGAPFD
: : :.::.:.: : . : :: . :: :.. :::...::: :.:.::: .
CCDS42 E--GRVFVYINSGSGAVMNAMETNLVGSDKYAARFGESIVNLGDIDNDGFEDVAIGAPQE
340 350 360 370 380 390
410 420 430 440 450 460
pF1KSD GD--GKVFIYHGSSLGVVAKPSQVLEGEAVG--IKSFGYSLSGSLDMDGNQYPDLLVGSL
: : ..::.: . :. . :: .:: .. .. :: :.::..: :.: : :. ::..
CCDS42 DDLQGAIYIYNGRADGISSTFSQRIEGLQISKSLSMFGQSISGQIDADNNGYVDVAVGAF
400 410 420 430 440 450
470 480 490 500 510
pF1KSD -ADTAVLFRARPILHVSHEVSIAPRSIDLEQPNCA--GGHSVCVDLRVCFSYIA--VPSS
.:.:::.:.::.. :. .: :.:.. . .:. : :::.:: .:::: . ::.
CCDS42 RSDSAVLLRTRPVVIVDASLS-HPESVNRTKFDCVENGWPSVCIDLTLCFSYKGKEVPG-
460 470 480 490 500 510
520 530 540 550 560 570
pF1KSD YSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQ
..: : .. :..:. .. :: : : . . .:.. .. . . : .
CCDS42 ---YIVLFYNMSLDVNRKAESP-PRFYFSSNGTSDV---ITGSIQVSSR-EANCRTHQAF
520 530 540 550 560
580 590 600 610 620 630
pF1KSD LQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPST-QRAEIHFLKQG
....:.: : : . .: : :.. . . .::. :::. .. . .. :.: .
CCDS42 MRKDVRDILTPIQIEAAYHLG-PHVISKRSTEEFPPLQPILQQKKEKDIMKKTINFARF-
570 580 590 600 610 620
640 650 660 670 680 690
pF1KSD CGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPS
:.... :...:: : :.. ..: .. : : :.... .. :.. . :
CCDS42 CAHEN-CSADLQ-VSAKIGF------LKPH----ENKTYL-AVGSMKTLMLNVSLFNA--
630 640 650 660
700 710 720 730 740 750
pF1KSD DPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDPAEKPL-CLSNENAS--HVECELGNP
::::.:. : : :: .:.. .. :. :: . : ..:.. ...: .:
CCDS42 --------GDDAYETTLHVKLPVGLYF--IKILELEEKQINCEVTDNSGVVQLDCSIGYI
670 680 690 700 710
760 770 780 790 800
pF1KSD -MKRGAQVTFYLILSTSGISIETTELEVELLLATISEQELHPVSARARVFIELPL-----
. . ... . ..:..:..: .: . . . .:.:. .. ..:: . .::
CCDS42 YVDHLSRIDISFLLDVSSLSRAEEDLSITVHATCENEEEMDNLK-HSRVTVAIPLKYEVK
720 730 740 750 760 770
810 820 830 840 850 860
pF1KSD -SIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWP
.. :.. : .. ... ..: : . :.. : : :.:. .. ..:: :
CCDS42 LTVHGFVNPTSFVYGSNDENE----PETCMVEKMNLTFHVINTGNSMAP--NVSVEIMVP
780 790 800 810 820
870 880 890 900 910 920
pF1KSD HEIA-NGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPG
. .. . :. ..:. :. : :.. .: . :::. .
CCDS42 NSFSPQTDKLFNILDVQTTTGE-------C-------HFENYQR------VCALEQQKSA
830 840 850 860
930 940 950 960 970 980
pF1KSD ERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFD--RAAVLHVWGRLWNST
. .. . .:...:. : : .. .:. : : . ... . : .:. .: .
CCDS42 MQTLKGIVRF-LSKTDKR---LLYCIKADPHCLNFLCNFGKMESGKEASVHI--QLEGRP
870 880 890 900 910 920
990 1000 1010 1020 1030 1040
pF1KSD FLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILL
. :.. ...:. .::. . . . . : .: :.. . .:
CCDS42 SILEMDETSALKFEIRATGFPEPNPRVIELNKDENVAHVLLEGLHHQRPKRYFTIVIISS
930 940 950 960 970 980
1050 1060 1070 1080 1090 1100
pF1KSD AVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTGTILRNN
..: ::.:: :. ..:: :::::
CCDS42 SLLLGLIVLLLISYVMWKAGFFKRQYKSILQEENRRDSWSYINSKSNDD
990 1000 1010 1020 1030
>>CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170 aa)
initn: 435 init1: 195 opt: 559 Z-score: 623.5 bits: 127.3 E(32554): 2.1e-28
Smith-Waterman score: 684; 26.1% identity (52.8% similar) in 940 aa overlap (185-1091:335-1143)
160 170 180 190 200 210
pF1KSD ETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTAAAFSPD--SHYL
:: . .. .: .. .....: : .
CCDS32 KPASEFVKILDTFEKLKDLFTELQKKIYVIEGTSK-QDLTSFNMELSSSGISADLSRGHA
310 320 330 340 350 360
220 230 240 250 260 270
pF1KSD LFGAPGTYNWKGLLFVTNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKG
. :: :. .: : .. . : .: . . : : : :: :::...
CCDS32 VVGAVGAKDWAGGFLDLKADLQDDTFIGNEPLTPEVR----AG------YLGYTVT---W
370 380 390 400 410
280 290 300 310 320 330
pF1KSD LVRAEELSFVA-GAPRANHKGAVVILRKDSASRLVPEVM-LSGERLTSGFGYSLAVADLN
: .. :..: :::: .: : :..... ... .:. . : .. : :: : .:..
CCDS32 LPSRQKTSLLASGAPRYQHMGRVLLFQEPQGGGHWSQVQTIHGTQIGSYFGGELCGVDVD
420 430 440 450 460 470
340 350 360 370 380
pF1KSD SDGWPDLI-VGAPYFFERQEELGGAVYVYLNQGGHWAGISPLRLC-GSPDSMFGISLAVL
.:: .:. .::: :. .:. :: :..: . . .: :. : : . :: ....:
CCDS32 QDGETELLLIGAPLFYGEQR--GGRVFIYQRRQLGFEEVSELQGDPGYPLGRFGEAITAL
480 490 500 510 520
390 400 410 420 430 440
pF1KSD GDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEGEAV--GIKSFGYSLSGS
:.: ::. :.:::::.. .: :.:..: :. .::: .:: : ::. :: :. :
CCDS32 TDINGDGLVDVAVGAPLEEQGAVYIFNGRHGGLSPQPSQRIEGTQVLSGIQWFGRSIHGV
530 540 550 560 570 580
450 460 470 480 490 500
pF1KSD LDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLEQPNCAGGHSVC----
:..:. :. ::. .. :: .::.. . .:..: : ... .:. . :
CCDS32 KDLEGDGLADVAVGAESQMIVL-SSRPVVDMVTLMSFSPAEIPVHEVECSYSTSNKMKEG
590 600 610 620 630 640
510 520 530 540 550
pF1KSD VDLRVCFSYIA-VPSSYSPTVA-LDYVLDADTDR-RLRGQVPRVTFLSRNLEEPKHQASG
:.. .::. . .:. . :: : :.:. : : : :: : .:.
CCDS32 VNITICFQIKSLIPQFQGRLVANLTYTLQLDGHRTRRRGLFP----------GGRHELRR
650 660 670 680 690
560 570 580 590 600 610
pF1KSD TVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQ----TPRLRRQAPGQGLPPVA
.. . . . : : :.. :.: . : :.:..:: ::: .: : :. .::.
CCDS32 NIAVTTSMS--CTDFSFHFPVCVQDLISPINVSLNFSLWEEEGTPRDQR-AQGKDIPPIL
700 710 720 730 740 750
620 630 640 650 660 670
pF1KSD -PILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTT
: :. .. :: : ...::::: :..:: ::: :.: . :
CCDS32 RPSLH-----SETWEIPF-EKNCGEDKKCEANL---------RVS---FSPARSRALRLT
760 770 780 790
680 690 700 710 720 730
pF1KSD ALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDP-AE
:. .:: .:: ..:: .::. .:: . .: .: . :. : : ..
CCDS32 AFASLS------VELSLSNLE----------EDAYWVQLDLHFPPGLSFRKVEMLKPHSQ
800 810 820 830 840
740 750 760 770 780
pF1KSD KPL-C--LSNEN---ASHVECELGNPM-KRGAQVTFYLILSTSGISI--ETTELEVELLL
:. : : .:. . . :....:. : : .:.. ....: : ...::....
CCDS32 IPVSCEELPEESRLLSRALSCNVSSPIFKAGHSVALQMMFNTLVNSSWGDSVELHANVTC
850 860 870 880 890 900
790 800 810 820 830 840
pF1KSD ATISEQELHPVSARARVFIELPLSIAGMAIPQQ---LFFSGVVRGERAMQSERDVGSKVK
. . . :. :: . . : :..: . :. :. : . .: . : : .
CCDS32 NNEDSDLLEDNSATTIIPILYPINI--LIQDQEDSTLYVSFTPKGPKIHQ----VKHMYQ
910 920 930 940 950
850 860 870 880 890 900
pF1KSD YEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNI
.. : . ... :: : ... :. ..: . . .:..: : : :
CCDS32 VRIQPSIHDHNIPTL-EAVVGV--PQPPSEGP-ITHQWSVQME----P-------PVPC-
960 970 980 990
910 920 930 940 950 960
pF1KSD LHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFS
: . : .: :. :: : :. .:
CCDS32 -HYE----DLERL----PDAAEP-------------------------CLPGA----LFR
1000 1010 1020
970 980 990 1000 1010 1020
pF1KSD CPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIP
::. : . ...: : : .. : : . . . .:. .:: . . . ...
CCDS32 CPVV-FRQEILVQVIGTL---ELVGEIEASSMFSLCSSLSISFNSSKHFHLYGSNASLAQ
1030 1040 1050 1060 1070
1030 1040 1050 1060 1070 1080
pF1KSD VMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAV
:.. .: :: : .. .:. ..:::.: :. ..:.:.::::: . . . .
CCDS32 VVMKVD---VVYEKQMLYLYVLSGIGGLLLLLLIFIVLYKVGFFKRNLKEKMEAGRGVPN
1080 1090 1100 1110 1120 1130
1090 1100 1110 1120 1130
pF1KSD KIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
:: :: .:.
CCDS32 GIPAEDSEQLASGQEAGDPGCLKPLHEKDSESGGGKD
1140 1150 1160 1170
>>CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188 aa)
initn: 461 init1: 150 opt: 553 Z-score: 616.6 bits: 126.0 E(32554): 5e-28
Smith-Waterman score: 731; 24.8% identity (54.7% similar) in 937 aa overlap (164-1069:330-1173)
140 150 160 170 180 190
pF1KSD GGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDG-GEWKFC-EGRPQGH
: .... :..: .:. :. : :: ...
CCDS45 LGYYNRRGINPETFLNEIKYIASDPDDKHFFNVTDEAALKDIVDALGDRIFSLEGTNKNE
300 310 320 330 340 350
200 210 220 230 240
pF1KSD EQFGF--CQQGTAAAFSPDSHYLLFGAPGTYNWKG-LLFVTNIDSSDPDQLVYKTLDPAD
.::. : : .. :. .:.:: :.:.:.: .: :. . : . : : .
CCDS45 TSFGLEMSQTGFSSHVVEDG--VLLGAVGAYDWNGAVLKETSAGKVIPLRESYLKEFP-E
360 370 380 390 400 410
250 260 270 280 290 300
pF1KSD RLPGPAGDLALNSYLGFSIDSGKGLVRAEELS-FVAGAPRANHKGAVVILRKDSASRLVP
.: . . .:::... : .: ... .:::::: :: : :... . :.
CCDS45 ELKNHG------AYLGYTVTS---VVSSRQGRVYVAGAPRFNHTGKVILFTMHNNRSLTI
420 430 440 450 460
310 320 330 340 350 360
pF1KSD EVMLSGERLTSGFGYSLAVADLNSDGWPD-LIVGAPYFFERQEELGGAVYVYLNQGGHWA
. . :... : :: .. .:...:: : :.::::..:.. .: : :::: . . ..
CCDS45 HQAMRGQQIGSYFGSEITSVDIDGDGVTDVLLVGAPMYFNEGRERG-KVYVYELRQNLFV
470 480 490 500 510 520
370 380 390 400 410 420
pF1KSD GISPLRLCGS-PDSMFGISLAVLGDLNQDGFPDIAVGAPFDGD--GKVFIYHGSSLGVVA
. :. : .. :: :.: . :::::.. :..::::.. . : ..:.:: ...
CCDS45 YNGTLKDSHSYQNARFGSSIASVRDLNQDSYNDVVVGAPLEDNHAGAIYIFHGFRGSILK
530 540 550 560 570 580
430 440 450 460 470 480
pF1KSD KPSQ-VLEGE-AVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEV
:.: . .: :.:.. :: :. :.::.. . :: ::.:.. ::.. .::..... .
CCDS45 TPKQRITASELATGLQYFGCSIHGQLDLNEDGLIDLAVGALGN-AVILWSRPVVQINASL
590 600 610 620 630 640
490 500 510 520 530
pF1KSD SIAPRSIDLEQPNC--AGGHSVCVDLRVCFSYIAV-PSSYSPTVALDYVLDADTDRRLRG
. : .:.. . .: .: ..:. .::. : . : . ::.. : .: :.:
CCDS45 HFEPSKINIFHRDCKRSGRDATCLAAFLCFTPIFLAPHFQTTTVGIRY--NATMDERRY-
650 660 670 680 690 700
540 550 560 570 580 590
pF1KSD QVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQ
.::. .:.: . .. . : . ...: :.. ... : .. .. .. :::.
CCDS45 -TPRA-----HLDEGGDRFTNRAVLLSSGQELCERINFHVLDTA-DYVKPVTFSVEYSLE
710 720 730 740 750
600 610 620 630 640 650
pF1KSD TPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQL-VRA-----
: .: :.:. :.: :. . : . ::.::. : .: : .:.
CCDS45 DP-------DHG-----PMLDDGWPTTLRVSVPFWN-GCNEDEHCVPDLVLDARSDLPTA
760 770 780 790 800
660 670 680 690 700
pF1KSD -RFCTRV-----SDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGD
..: :: .: : .: ::... : . ...: . : :.
CCDS45 MEYCQRVLRKPAQDCSAYTLSFD---TTVFIIESTRQRVAVEATLEN----------RGE
810 820 830 840
710 720 730 740 750 760
pF1KSD DAHEAQLLVMLPDSLHYSG-VRALDPAEKPLCLSNENASHVE-CELGNPMKRG-AQVTFY
.:. . : . .:.... .. : . :...: . . :... :. :. :.:.:
CCDS45 NAYSTVLNISQSANLQFASLIQKEDSDGSIECVNEERRLQKQVCNVSYPFFRAKAKVAFR
850 860 870 880 890 900
770 780 790 800 810 820
pF1KSD LILSTSGISIETTELEVELLLATIS-EQELHPVSARARVFIELPLSIAGMAIPQQLFFSG
: . : :: .::.:: .. : :.. . : . ..: . .. .
CCDS45 LDFEFSK-SIFLHHLEIELAAGSDSNERDSTKEDNVAPLRFHLKYEADVLFTRSSSLSHY
910 920 930 940 950 960
830 840 850 860 870 880
pF1KSD VVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVE
:. . ... .: . ..: : : . . ...: : .:. :: .
CCDS45 EVKPNSSLERYDGIGPPFSCIFRIQNLG--LFPIHGMMMKITIPIATRSGNRLL-----K
970 980 990 1000 1010 1020
890 900 910 920 930 940
pF1KSD LEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEK
:. . :. : : . : : : :. :... ..
CCDS45 LRDFLTDEANTSCNIWGN-------STEYR------PTPVEEDLRRAPQLN-------HS
1030 1040 1050 1060
950 960 970 980 990 1000
pF1KSD KKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANI
..... . :: . : .. .:. : :: .. . ::....: : .
CCDS45 NSDVV------SINCNIRLVP----NQEINFHLLGNLWLRSL--KALKYKSMKIMVNAAL
1070 1080 1090 1100
1010 1020 1030 1040 1050 1060
pF1KSD TVKSSIKNLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKM
.. . ...:. . .. .. . :: :.:. ..:.:::.:::::: :::.
CCDS45 Q-RQFHSPFIFREEDPSRQIVFEISKQE--DWQVPIWIIVGSTLGGLLLLALLVLALWKL
1110 1120 1130 1140 1150 1160
1070 1080 1090 1100 1110 1120
pF1KSD GFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADG
:::. :.
CCDS45 GFFRSARRRREPGLDPTPKVLE
1170 1180
1137 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 08:25:18 2016 done: Thu Nov 3 08:25:19 2016
Total Scan time: 4.520 Total Display time: 0.470
Function used was FASTA [36.3.4 Apr, 2011]