FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDB0059, 1137 aa 1>>>pF1KSDB0059 1137 - 1137 aa - 1137 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3801+/-0.000832; mu= 22.4602+/- 0.050 mean_var=78.1053+/-15.650, 0's: 0 Z-trim(107.8): 32 B-trim: 0 in 0/51 Lambda= 0.145122 statistics sampled from 9756 (9787) to 9756 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.301), width: 16 Scan time: 4.520 The best scores are: opt bits E(32554) CCDS8888.1 ITGA7 gene_id:3679|Hs108|chr12 (1137) 7704 1623.2 0 CCDS55832.1 ITGA7 gene_id:3679|Hs108|chr12 (1141) 7444 1568.8 0 CCDS44914.1 ITGA7 gene_id:3679|Hs108|chr12 (1044) 6509 1373.0 0 CCDS2249.1 ITGA6 gene_id:3655|Hs108|chr2 (1073) 3020 642.5 1.5e-183 CCDS46451.1 ITGA6 gene_id:3655|Hs108|chr2 (1091) 3020 642.5 1.5e-183 CCDS82534.1 ITGA6 gene_id:3655|Hs108|chr2 ( 954) 2582 550.8 5.6e-156 CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035) 811 180.0 2.5e-44 CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032) 634 142.9 3.5e-33 CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170) 559 127.3 2.1e-28 CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188) 553 126.0 5e-28 CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086) 552 125.8 5.4e-28 CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051) 549 125.2 8.2e-28 CCDS45470.1 ITGAM gene_id:3684|Hs108|chr16 (1152) 468 108.2 1.1e-22 CCDS54004.1 ITGAM gene_id:3684|Hs108|chr16 (1153) 466 107.8 1.5e-22 CCDS10711.1 ITGAX gene_id:3687|Hs108|chr16 (1163) 446 103.6 2.8e-21 CCDS67014.1 ITGAX gene_id:3687|Hs108|chr16 (1169) 446 103.6 2.8e-21 CCDS32531.1 ITGAE gene_id:3682|Hs108|chr17 (1179) 442 102.8 5e-21 CCDS32438.1 ITGAD gene_id:3681|Hs108|chr16 (1161) 434 101.1 1.6e-20 CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063) 433 100.9 1.7e-20 CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039) 412 96.5 3.5e-19 CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002) 369 87.5 1.7e-16 CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012) 369 87.5 1.8e-16 CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048) 369 87.5 1.8e-16 >>CCDS8888.1 ITGA7 gene_id:3679|Hs108|chr12 (1137 aa) initn: 7704 init1: 7704 opt: 7704 Z-score: 8708.3 bits: 1623.2 E(32554): 0 Smith-Waterman score: 7704; 100.0% identity (100.0% similar) in 1137 aa overlap (1-1137:1-1137) 10 20 30 40 50 60 pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVTNIDSSDPDQLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVTNIDSSDPDQLV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD YKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 YKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD SASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 SASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD QGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 QGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD VVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 VVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD VSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 VSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD PRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 PRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD RLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 RLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD TEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 TEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD LHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 LHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEV 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD ELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 ELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD KYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 KYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPN 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD ILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 ILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVF 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD SCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 SCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVI 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD PVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 PVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 pF1KSD VKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 VKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA 1090 1100 1110 1120 1130 >>CCDS55832.1 ITGA7 gene_id:3679|Hs108|chr12 (1141 aa) initn: 7454 init1: 5898 opt: 7444 Z-score: 8414.1 bits: 1568.8 E(32554): 0 Smith-Waterman score: 7444; 97.0% identity (97.3% similar) in 1148 aa overlap (1-1137:1-1141) 10 20 30 40 50 60 pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGE 130 140 150 160 170 180 190 200 210 220 230 pF1KSD WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVT-----NIDSSD :::::::::::::::::::::::::::::::::::::::::::: : . : . CCDS55 WKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGTARVELCAQGSADLAH 190 200 210 220 230 240 240 250 260 270 280 pF1KSD PDQLVY-----KTLDPADRL-PGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRAN :. : : :: :: : :: :::.:::::::::::::::::::::::::: CCDS55 LDDGPYEAGGEKEQDP--RLIPVPA-----NSYFGFSIDSGKGLVRAEELSFVAGAPRAN 250 260 270 280 290 290 300 310 320 330 340 pF1KSD HKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQE 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD ELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDG 360 370 380 390 400 410 410 420 430 440 450 460 pF1KSD KVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLF 420 430 440 450 460 470 470 480 490 500 510 520 pF1KSD RARPILHVSHEVSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RARPILHVSHEVSIAPRSIDLEQPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLD 480 490 500 510 520 530 530 540 550 560 570 580 pF1KSD ADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAI 540 550 560 570 580 590 590 600 610 620 630 640 pF1KSD VVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQL 600 610 620 630 640 650 650 660 670 680 690 700 pF1KSD VRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAH 660 670 680 690 700 710 710 720 730 740 750 760 pF1KSD EAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 EAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTS 720 730 740 750 760 770 770 780 790 800 810 820 pF1KSD GISIETTELEVELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GISIETTELEVELLLATISEQELHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERA 780 790 800 810 820 830 830 840 850 860 870 880 pF1KSD MQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGP 840 850 860 870 880 890 890 900 910 920 930 940 pF1KSD GQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLD 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KSD CARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIK 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 1060 pF1KSD NLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAK 1020 1030 1040 1050 1060 1070 1070 1080 1090 1100 1110 1120 pF1KSD HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPD 1080 1090 1100 1110 1120 1130 1130 pF1KSD GHPGPGTA :::::::: CCDS55 GHPGPGTA 1140 >>CCDS44914.1 ITGA7 gene_id:3679|Hs108|chr12 (1044 aa) initn: 6511 init1: 5898 opt: 6509 Z-score: 7356.7 bits: 1373.0 E(32554): 0 Smith-Waterman score: 6509; 94.7% identity (95.8% similar) in 1036 aa overlap (114-1137:17-1044) 90 100 110 120 130 140 pF1KSD QANRTGGLFACPLSLEETDCYRVDIDQGADMQKESKENQ-WLGVSVRSQGPGGKIVTCAH .:.... : : ..: . :: :::: CCDS44 MAPFATPMVQALTTTRIQRQAEGFQCWRECGTRRSPFEGK-ETCAH 10 20 30 40 150 160 170 180 190 200 pF1KSD RYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTA 50 60 70 80 90 100 210 220 230 240 250 pF1KSD AAFSPDSHYLLFGAPGTYNWKGLLFVT-----NIDSSDPDQLVY-----KTLDPADRL-P :::::::::::::::::::::: : . : . :. : : :: :: : CCDS44 AAFSPDSHYLLFGAPGTYNWKGTARVELCAQGSADLAHLDDGPYEAGGEKEQDP--RLIP 110 120 130 140 150 160 260 270 280 290 300 310 pF1KSD GPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKDSASRLVPEVML :: :::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VPA-----NSYFGFSIDSGKGLVRAEELSFVAGAPRANHKGAVVILRKDSASRLVPEVML 170 180 190 200 210 320 330 340 350 360 370 pF1KSD SGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISPL 220 230 240 250 260 270 380 390 400 410 420 430 pF1KSD RLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEG 280 290 300 310 320 330 440 450 460 470 480 490 pF1KSD EAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLE 340 350 360 370 380 390 500 510 520 530 540 550 pF1KSD QPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QPNCAGGHSVCVDLRVCFSYIAVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLE 400 410 420 430 440 450 560 570 580 590 600 610 pF1KSD EPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGL 460 470 480 490 500 510 620 630 640 650 660 670 pF1KSD PPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVD 520 530 540 550 560 570 680 690 700 710 720 730 pF1KSD GTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GTTALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDP 580 590 600 610 620 630 740 750 760 770 780 790 pF1KSD AEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AEKPLCLSNENASHVECELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE 640 650 660 670 680 690 800 810 820 830 840 850 pF1KSD LHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LHPVSARARVFIELPLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQ 700 710 720 730 740 750 860 870 880 890 900 910 pF1KSD SLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDR 760 770 780 790 800 810 920 930 940 950 960 970 pF1KSD RRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFDRAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFDRAA 820 830 840 850 860 870 980 990 1000 1010 1020 1030 pF1KSD VLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAV 880 890 900 910 920 930 1040 1050 1060 1070 1080 1090 pF1KSD VAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQF 940 950 960 970 980 990 1100 1110 1120 1130 pF1KSD KEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA :::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA 1000 1010 1020 1030 1040 >>CCDS2249.1 ITGA6 gene_id:3655|Hs108|chr2 (1073 aa) initn: 2525 init1: 635 opt: 3020 Z-score: 3408.6 bits: 642.5 E(32554): 1.5e-183 Smith-Waterman score: 3412; 48.4% identity (76.1% similar) in 1094 aa overlap (12-1083:4-1059) 10 20 30 40 50 pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSR-AVAFNLDVM--GALRKEGEPGSLFGFSVA :. .: :. : :.:: ..:::::. ...:: :.::::::::.: CCDS22 MAAAGQLCLLY---LSAGLLSRLGAAFNLDTREDNVIRKYGDPGSLFGFSLA 10 20 30 40 60 70 80 90 100 110 pF1KSD LHRQLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKE .: ::::. . ::::::.: ::: :.:::::::..: .. . : :...:. :: .: CCDS22 MHWQLQPEDKRLLLVGAPRAEALPLQRANRTGGLYSCDIT-ARGPCTRIEFDNDADPTSE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD SKENQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELD :::.::.::.:.:::::::.:::::::: ::.:. :.::..:::.::::.: :.:..: CCDS22 SKEDQWMGVTVQSQGPGGKVVTCAHRYEKRQHVNTKQESRDIFGRCYVLSQNLRIEDDMD 110 120 130 140 150 160 180 190 200 210 220 pF1KSD GGEWKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLL---------FV ::.:.::.:: .:::.:: ::::.::.:. : ::..:::::::::::.. : CCDS22 GGDWSFCDGRLRGHEKFGSCQQGVAATFTKDFHYIVFGAPGTYNWKGIVRVEQKNNTFFD 170 180 190 200 210 220 230 240 250 260 270 280 pF1KSD TNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRA :: . : .. .: . .: :: :::::::.:::::.: .:..::.::::: CCDS22 MNIFEDGPYEVGGETEHDESLVPVPA-----NSYLGFSLDSGKGIVSKDEITFVSGAPRA 230 240 250 260 270 280 290 300 310 320 330 340 pF1KSD NHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFER ::.::::.:..: : .:.:: ...:: :.:.:::..::.:::.::: :...::: .:.: CCDS22 NHSGAVVLLKRDMKSAHLLPEHIFDGEGLASSFGYDVAVVDLNKDGWQDIVIGAPQYFDR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KSD QEELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDG . :.:::::::.:: :.: ...:.:: :. ::::::.. .::.::::.::::::::.: CCDS22 DGEVGGAVYVYMNQQGRWNNVKPIRLNGTKDSMFGIAVKNIGDINQDGYPDIAVGAPYDD 350 360 370 380 390 400 410 420 430 440 450 460 pF1KSD DGKVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAV :::::::::. :. .::.:::.: . ::::..:..:.: :.:::. ::::.:... CCDS22 LGKVFIYHGSANGINTKPTQVLKGIS---PYFGYSIAGNMDLDRNSYPDVAVGSLSDSVT 410 420 430 440 450 460 470 480 490 500 510 520 pF1KSD LFRARPILHVSHEVSIAPRSIDLEQPN-CAGGHSVCVDLRVCFSYIAVPSSYSPTVALDY .::.::...... ....: :::.: . :.. ..:.... :: : : :..:.:.... CCDS22 IFRSRPVINIQKTITVTPNRIDLRQKTACGAPSGICLQVKSCFEYTANPAGYNPSISIVG 470 480 490 500 510 520 530 540 550 560 570 580 pF1KSD VLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKL .:.:. .:: : :: : ... :::. : ::.:...:: . . ::.:..::: CCDS22 TLEAEKERRKSGLSSRVQFRNQG-SEPKYTQELT--LKRQKQKVCMEETLWLQDNIRDKL 530 540 550 560 570 590 600 610 620 630 640 pF1KSD RAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSN : : .: : .: : ::.. ..:: : ::::. .:.: . ..::::.:::.:..:.:: CCDS22 RPIPITASVEIQEPSSRRRV--NSLPEVLPILNSDEPKTAHIDVHFLKEGCGDDNVCNSN 580 590 600 610 620 630 650 660 670 680 690 700 pF1KSD LQLVRARFCTRVSDTE-FQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADG :.: . .:::: .. . :. ::.. :. : .:. : :.::. ::: ::.: .: :: CCDS22 LKL-EYKFCTREGNQDKFSYLPIQ-KGVPEL-VLKDQKDIALEITVTNSPSNPRNPTKDG 640 650 660 670 680 690 710 720 730 740 750 760 pF1KSD DDAHEAQLLVMLPDSLHYSGVRALD--PAEKPLCLSNENASHVECELGNPMKRGAQVTFY ::::::.:.. .::.: ::. : : : .. :..:.:.:...::::::.::...:::: CCDS22 DDAHEAKLIATFPDTLTYSAYRELRAFPEKQLSCVANQNGSQADCELGNPFKRNSNVTFY 700 710 720 730 740 750 770 780 790 800 810 820 pF1KSD LILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIELPLSIAGMAIPQQLFFSG :.:::. ....: .:...: : : :.:. : :..:.:.: ::: ::..:.: :.:..:.: CCDS22 LVLSTTEVTFDTPDLDINLKLETTSNQDNLAPITAKAKVVIELLLSVSGVAKPSQVYFGG 760 770 780 790 800 810 830 840 850 860 870 880 pF1KSD VVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVE .: ::.::.:: .::: ..:: : : :. : .::.: :::.::.::.::::::: ..:: CCDS22 TVVGEQAMKSEDEVGSLIEYEFRVINLGKPLTNLGTATLNIQWPKEISNGKWLLYLVKVE 820 830 840 850 860 870 890 900 910 920 930 940 pF1KSD LEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEK .: .: : :. .: :.. :.. : :.: .:. .: . ::. CCDS22 SKGL----EKVTCEPQKEINSLNLTESHNSRKKREITEKQIDDNRK---FSLF----AER 880 890 900 910 920 950 960 970 980 990 1000 pF1KSD KKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANI : . ::.:. .. ::: . ::: ..: : : . .:::::::::::: .. :....:: : CCDS22 KYQ-TLNCSVNV-NCVNIRCPLRGLDSKASLILRSRLWNSTFLEEYSKLNYLDILMRAFI 930 940 950 960 970 1010 1020 1030 1040 1050 1060 pF1KSD TVKSSIKNLMLRDASTVIPVMVYLDPMAVVAE--GVPWWVILLAVLAGLLVLALLVLLLW : .. .:. : .:.: . : :. : .::. :::::.::.:.:::.:.:::::..:: CCDS22 DVTAAAENIRLPNAGTQVRVTVF--PSKTVAQYSGVPWWIILVAILAGILMLALLVFILW 980 990 1000 1010 1020 1030 1070 1080 1090 1100 1110 pF1KSD KMGFFKRAK--HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPIL : ::::: : : .:: :: ..: CCDS22 KCGFFKRNKKDHYDAT---YHKAEIHAQPSDKERLTSDA 1040 1050 1060 1070 >>CCDS46451.1 ITGA6 gene_id:3655|Hs108|chr2 (1091 aa) initn: 2528 init1: 635 opt: 3020 Z-score: 3408.5 bits: 642.5 E(32554): 1.5e-183 Smith-Waterman score: 3473; 48.0% identity (76.4% similar) in 1113 aa overlap (12-1104:4-1080) 10 20 30 40 50 pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSR-AVAFNLDVM--GALRKEGEPGSLFGFSVA :. .: :. : :.:: ..:::::. ...:: :.::::::::.: CCDS46 MAAAGQLCLLY---LSAGLLSRLGAAFNLDTREDNVIRKYGDPGSLFGFSLA 10 20 30 40 60 70 80 90 100 110 pF1KSD LHRQLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETDCYRVDIDQGADMQKE .: ::::. . ::::::.: ::: :.:::::::..: .. . : :...:. :: .: CCDS46 MHWQLQPEDKRLLLVGAPRAEALPLQRANRTGGLYSCDIT-ARGPCTRIEFDNDADPTSE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD SKENQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELD :::.::.::.:.:::::::.:::::::: ::.:. :.::..:::.::::.: :.:..: CCDS46 SKEDQWMGVTVQSQGPGGKVVTCAHRYEKRQHVNTKQESRDIFGRCYVLSQNLRIEDDMD 110 120 130 140 150 160 180 190 200 210 220 pF1KSD GGEWKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLL---------FV ::.:.::.:: .:::.:: ::::.::.:. : ::..:::::::::::.. : CCDS46 GGDWSFCDGRLRGHEKFGSCQQGVAATFTKDFHYIVFGAPGTYNWKGIVRVEQKNNTFFD 170 180 190 200 210 220 230 240 250 260 270 280 pF1KSD TNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELSFVAGAPRA :: . : .. .: . .: :: :::::::.:::::.: .:..::.::::: CCDS46 MNIFEDGPYEVGGETEHDESLVPVPA-----NSYLGFSLDSGKGIVSKDEITFVSGAPRA 230 240 250 260 270 280 290 300 310 320 330 340 pF1KSD NHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFER ::.::::.:..: : .:.:: ...:: :.:.:::..::.:::.::: :...::: .:.: CCDS46 NHSGAVVLLKRDMKSAHLLPEHIFDGEGLASSFGYDVAVVDLNKDGWQDIVIGAPQYFDR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KSD QEELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGAPFDG . :.:::::::.:: :.: ...:.:: :. ::::::.. .::.::::.::::::::.: CCDS46 DGEVGGAVYVYMNQQGRWNNVKPIRLNGTKDSMFGIAVKNIGDINQDGYPDIAVGAPYDD 350 360 370 380 390 400 410 420 430 440 450 460 pF1KSD DGKVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAV :::::::::. :. .::.:::.: . ::::..:..:.: :.:::. ::::.:... CCDS46 LGKVFIYHGSANGINTKPTQVLKGIS---PYFGYSIAGNMDLDRNSYPDVAVGSLSDSVT 410 420 430 440 450 460 470 480 490 500 510 520 pF1KSD LFRARPILHVSHEVSIAPRSIDLEQPN-CAGGHSVCVDLRVCFSYIAVPSSYSPTVALDY .::.::...... ....: :::.: . :.. ..:.... :: : : :..:.:.... CCDS46 IFRSRPVINIQKTITVTPNRIDLRQKTACGAPSGICLQVKSCFEYTANPAGYNPSISIVG 470 480 490 500 510 520 530 540 550 560 570 580 pF1KSD VLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKL .:.:. .:: : :: : ... :::. : ::.:...:: . . ::.:..::: CCDS46 TLEAEKERRKSGLSSRVQFRNQG-SEPKYTQELT--LKRQKQKVCMEETLWLQDNIRDKL 530 540 550 560 570 590 600 610 620 630 640 pF1KSD RAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSN : : .: : .: : ::.. ..:: : ::::. .:.: . ..::::.:::.:..:.:: CCDS46 RPIPITASVEIQEPSSRRRV--NSLPEVLPILNSDEPKTAHIDVHFLKEGCGDDNVCNSN 580 590 600 610 620 630 650 660 670 680 690 700 pF1KSD LQLVRARFCTRVSDTE-FQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADG :.: . .:::: .. . :. ::.. :. : .:. : :.::. ::: ::.: .: :: CCDS46 LKL-EYKFCTREGNQDKFSYLPIQ-KGVPEL-VLKDQKDIALEITVTNSPSNPRNPTKDG 640 650 660 670 680 690 710 720 730 740 750 760 pF1KSD DDAHEAQLLVMLPDSLHYSGVRALD--PAEKPLCLSNENASHVECELGNPMKRGAQVTFY ::::::.:.. .::.: ::. : : : .. :..:.:.:...::::::.::...:::: CCDS46 DDAHEAKLIATFPDTLTYSAYRELRAFPEKQLSCVANQNGSQADCELGNPFKRNSNVTFY 700 710 720 730 740 750 770 780 790 800 810 820 pF1KSD LILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIELPLSIAGMAIPQQLFFSG :.:::. ....: .:...: : : :.:. : :..:.:.: ::: ::..:.: :.:..:.: CCDS46 LVLSTTEVTFDTPDLDINLKLETTSNQDNLAPITAKAKVVIELLLSVSGVAKPSQVYFGG 760 770 780 790 800 810 830 840 850 860 870 880 pF1KSD VVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVE .: ::.::.:: .::: ..:: : : :. : .::.: :::.::.::.::::::: ..:: CCDS46 TVVGEQAMKSEDEVGSLIEYEFRVINLGKPLTNLGTATLNIQWPKEISNGKWLLYLVKVE 820 830 840 850 860 870 890 900 910 920 930 940 pF1KSD LEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEK .: .: : :. .: :.. :.. : :.: .:. .: . ::. CCDS46 SKG----LEKVTCEPQKEINSLNLTESHNSRKKREITEKQIDDNRK---FSLF----AER 880 890 900 910 920 950 960 970 980 990 1000 pF1KSD KKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANI : . ::.:. .. ::: . ::: ..: : : . .:::::::::::: .. :....:: : CCDS46 KYQ-TLNCSVNV-NCVNIRCPLRGLDSKASLILRSRLWNSTFLEEYSKLNYLDILMRAFI 930 940 950 960 970 1010 1020 1030 1040 1050 1060 pF1KSD TVKSSIKNLMLRDASTVIPVMVYLDPMAVVAE--GVPWWVILLAVLAGLLVLALLVLLLW : .. .:. : .:.: . : :. : .::. :::::.::.:.:::.:.:::::..:: CCDS46 DVTAAAENIRLPNAGTQVRVTVF--PSKTVAQYSGVPWWIILVAILAGILMLALLVFILW 980 990 1000 1010 1020 1030 1070 1080 1090 1100 1110 1120 pF1KSD KMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAA : :::::... . .::.::::.: .:.:. :. .. ...: CCDS46 KCGFFKRSRYDD-SVPRYHAVRIRKEEREIKDEKYIDNLEKKQWITKWNENESYS 1040 1050 1060 1070 1080 1090 1130 pF1KSD DGHPELGPDGHPGPGTA >>CCDS82534.1 ITGA6 gene_id:3655|Hs108|chr2 (954 aa) initn: 2358 init1: 1160 opt: 2582 Z-score: 2913.8 bits: 550.8 E(32554): 5.6e-156 Smith-Waterman score: 3167; 49.3% identity (77.8% similar) in 970 aa overlap (124-1083:1-940) 100 110 120 130 140 150 pF1KSD CPLSLEETDCYRVDIDQGADMQKESKENQWLGVSVRSQGPGGKIVTCAHRYEARQRVDQI .::.:.:::::::.:::::::: ::.:. CCDS82 MGVTVQSQGPGGKVVTCAHRYEKRQHVNTK 10 20 30 160 170 180 190 200 210 pF1KSD LETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTAAAFSPDSHYLL :.::..:::.::::.: :.:..:::.:.::.:: .:::.:: ::::.::.:. : ::.. CCDS82 QESRDIFGRCYVLSQNLRIEDDMDGGDWSFCDGRLRGHEKFGSCQQGVAATFTKDFHYIV 40 50 60 70 80 90 220 230 240 250 260 270 pF1KSD FGAPGTYNWKGLLFVTNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKGL ::::::::::::::.:... .::::.:::: : .. : :. .:::::::.:::::. CCDS82 FGAPGTYNWKGLLFLTSVSYTDPDQFVYKTRPPREQ-PDTFPDVMMNSYLGFSLDSGKGI 100 110 120 130 140 280 290 300 310 320 330 pF1KSD VRAEELSFVAGAPRANHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSD : .:..::.:::::::.::::.:..: : .:.:: ...:: :.:.:::..::.:::.: CCDS82 VSKDEITFVSGAPRANHSGAVVLLKRDMKSAHLLPEHIFDGEGLASSFGYDVAVVDLNKD 150 160 170 180 190 200 340 350 360 370 380 390 pF1KSD GWPDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISPLRLCGSPDSMFGISLAVLGDLN :: :...::: .:.:. :.:::::::.:: :.: ...:.:: :. ::::::.. .::.: CCDS82 GWQDIVIGAPQYFDRDGEVGGAVYVYMNQQGRWNNVKPIRLNGTKDSMFGIAVKNIGDIN 210 220 230 240 250 260 400 410 420 430 440 450 pF1KSD QDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEGEAVGIKSFGYSLSGSLDMDGN :::.::::::::.: :::::::::. :. .::.:::.: . ::::..:..:.: : CCDS82 QDGYPDIAVGAPYDDLGKVFIYHGSANGINTKPTQVLKGIS---PYFGYSIAGNMDLDRN 270 280 290 300 310 320 460 470 480 490 500 510 pF1KSD QYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLEQPN-CAGGHSVCVDLRVCFSY .:::. ::::.:....::.::...... ....: :::.: . :.. ..:.... :: : CCDS82 SYPDVAVGSLSDSVTIFRSRPVINIQKTITVTPNRIDLRQKTACGAPSGICLQVKSCFEY 330 340 350 360 370 380 520 530 540 550 560 570 pF1KSD IAVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVC : :..:.:.... .:.:. .:: : :: : ... :::. : ::.:...:: CCDS82 TANPAGYNPSISIVGTLEAEKERRKSGLSSRVQFRNQG-SEPKYTQELT--LKRQKQKVC 390 400 410 420 430 440 580 590 600 610 620 630 pF1KSD GDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIH . . ::.:..:::: : .: : .: : ::.. ..:: : ::::. .:.: . ..: CCDS82 MEETLWLQDNIRDKLRPIPITASVEIQEPSSRRRV--NSLPEVLPILNSDEPKTAHIDVH 450 460 470 480 490 500 640 650 660 670 680 690 pF1KSD FLKQGCGEDKICQSNLQLVRARFCTRVSDTE-FQPLPMDVDGTTALFALSGQPVIGLELM :::.:::.:..:.:::.: . .:::: .. . :. ::.. :. : .:. : :.::. CCDS82 FLKEGCGDDNVCNSNLKL-EYKFCTREGNQDKFSYLPIQ-KGVPEL-VLKDQKDIALEIT 510 520 530 540 550 700 710 720 730 740 pF1KSD VTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALD--PAEKPLCLSNENASHVEC ::: ::.: .: ::::::::.:.. .::.: ::. : : : .. :..:.:.:...: CCDS82 VTNSPSNPRNPTKDGDDAHEAKLIATFPDTLTYSAYRELRAFPEKQLSCVANQNGSQADC 560 570 580 590 600 610 750 760 770 780 790 800 pF1KSD ELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIELPL :::::.::...:::::.:::. ....: .:...: : : :.:. : :..:.:.: ::: : CCDS82 ELGNPFKRNSNVTFYLVLSTTEVTFDTPDLDINLKLETTSNQDNLAPITAKAKVVIELLL 620 630 640 650 660 670 810 820 830 840 850 860 pF1KSD SIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPH :..:.: :.:..:.:.: ::.::.:: .::: ..:: : : :. : .::.: :::.::. CCDS82 SVSGVAKPSQVYFGGTVVGEQAMKSEDEVGSLIEYEFRVINLGKPLTNLGTATLNIQWPK 680 690 700 710 720 730 870 880 890 900 910 920 pF1KSD EIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGER ::.::::::: ..:: .: . : : :. .: :.. :.. : :.: .: CCDS82 EISNGKWLLYLVKVESKGLE----KVTCEPQKEINSLNLTESHNSRKKREITEKQIDDNR 740 750 760 770 780 790 930 940 950 960 970 980 pF1KSD QEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEE . .: . ::.: . ::.:. .. ::: . ::: ..: : : . .:::::::::: CCDS82 K---FSLF----AERKYQ-TLNCSVNV-NCVNIRCPLRGLDSKASLILRSRLWNSTFLEE 800 810 820 830 840 990 1000 1010 1020 1030 1040 pF1KSD YSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAVVAE--GVPWWVILLAV :: .. :....:: : : .. .:. : .:.: . : :. : .::. :::::.::.:. CCDS82 YSKLNYLDILMRAFIDVTAAAENIRLPNAGTQVRVTVF--PSKTVAQYSGVPWWIILVAI 850 860 870 880 890 900 1050 1060 1070 1080 1090 1100 pF1KSD LAGLLVLALLVLLLWKMGFFKRAK--HPEATVPQYHAVKIPREDRQQFKEEKTGTILRNN :::.:.:::::..::: ::::: : : .:: :: ..: CCDS82 LAGILMLALLVFILWKCGFFKRNKKDHYDAT---YHKAEIHAQPSDKERLTSDA 910 920 930 940 950 1110 1120 1130 pF1KSD WGSPRREGPDAHPILAADGHPELGPDGHPGPGTA >>CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035 aa) initn: 513 init1: 206 opt: 811 Z-score: 909.4 bits: 180.0 E(32554): 2.5e-44 Smith-Waterman score: 1257; 28.0% identity (57.4% similar) in 1103 aa overlap (9-1067:7-1009) 10 20 30 40 50 60 pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR : ::. . :. .:.: . : :.::: . .. .: :.::..: : CCDS26 MGGPAAPRGAGRLRALLLALVVAGI--PAGAYNLDPQRPVHFQGPADSFFGYAVLEHF 10 20 30 40 50 70 80 90 100 110 pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLE-ETDCYRVDIDQGADMQ---- . . : :.:::::.: . . ... :..: : . . . : ..:. .: . CCDS26 HDNTR---WVLVGAPKADSKYSPSVKSPGAVFKCRVHTNPDRRCTELDMARGKNRGTSCG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD ---KESKENQWLGVSV-RSQGPGGKIVTCAHRYEA-RQRVDQILETRDMIGRCFVLSQDL .:.....:.:::. :. :....::::.. ..:.:: : :... ..: CCDS26 KTCREDRDDEWMGVSLARQPKADGRVLACAHRWKNIYYEADHILPH----GFCYIIPSNL 120 130 140 150 160 180 190 200 210 220 pF1KSD AIRDELDGGEWKFC--EGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFV . : : : . . :. : :: : :. :. . ...::::.. : : . : CCDS26 QAK----GRTLIPCYEEYKKKYGEEHGSCQAGIAGFFTEE--LVVMGAPGSFYWAGTIKV 170 180 190 200 210 220 230 240 250 260 270 280 pF1KSD TNIDSSDPDQLVYKTLDPADRLPGPAGDLALN---SYLGFSIDSGKGLVRAEELSFVAGA :. :. : : .. .: .:::... .:. . . .. :.:: CCDS26 LNLT----DNTYLKLND----------EVIMNRRYTYLGYAVTAGH-FSHPSTIDVVGGA 230 240 250 260 290 300 310 320 330 340 pF1KSD PRANHKGAVVILRKDSAS-RLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYF :. . : : :.: : : :. . ::... : :: :: ..:::.:: ::.::::.: CCDS26 PQDKGIGKVYIFRADRRSGTLIKIFQASGKKMGSYFGSSLCAVDLNGDGLSDLLVGAPMF 270 280 290 300 310 320 350 360 370 380 390 400 pF1KSD FERQEELGGAVYVYLNQG-GHWAGISPLRLCGSPDSMFGISLAVLGDLNQDGFPDIAVGA : ..: : : ::.:.: : : :. .. :: :.: : ::..:::::.:.:: CCDS26 SEIRDE--GQVTVYINRGNGALEEQLALTGDGAYNAHFGESIASLDDLDNDGFPDVAIGA 330 340 350 360 370 380 410 420 430 440 450 pF1KSD PFDGD--GKVFIYHGSSLGVVAKPSQVLEGEAVG--IKSFGYSLSGSLDMDGNQYPDLLV : . : : :.::::.. :.: . :. : :. .. .. :: :.::..::::: :::. : CCDS26 PKEDDFAGAVYIYHGDAGGIVPQYSMKLSGQKINPVLRMFGQSISGGIDMDGNGYPDVTV 390 400 410 420 430 440 460 470 480 490 500 510 pF1KSD GS-LADTAVLFRARPILHVSHEVSI-APRSIDLEQPNCAGGHSV--CVDLRVCFSYIAVP :. ..:..::.::::.. : .::: : ::.. :.: :.. :... .:::. CCDS26 GAFMSDSVVLLRARPVITV--DVSIFLPGSINITAPQCHDGQQPVNCLNVTTCFSF---H 450 460 470 480 490 500 520 530 540 550 560 570 pF1KSD SSYSP-TVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDA ... : ..:.::: ::. .. .::.::: :. : : :.. . : .. ...: CCDS26 GKHVPGEIGLNYVLMADVAKKEKGQMPRVYFVL--LGETMGQVTEKLQLTYM-EETCRHY 510 520 530 540 550 580 590 600 610 620 630 pF1KSD MFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVAPIL--NAHQPSTQRAEIHF . .... :.: . :: .:::. .. . :::..:.: . : .:. . : CCDS26 VAHVKRRVQDVISPIVFEAAYSLSEHVTGEEE--RELPPLTPVLRWKKGQKIAQKNQTVF 560 570 580 590 600 610 640 650 660 670 680 690 pF1KSD LKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVT .. .:: : ..::: . . : ..: : .::.. :.:.. .. CCDS26 ERNCRSED--CAADLQL------------QGKLLLSSMDEKTLYLALGAVKNISLNISIS 620 630 640 650 660 700 710 720 730 740 750 pF1KSD NLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHVECELGN :: ::::..:.. . : . . . : . ... ..: .: CCDS26 NL----------GDDAYDANVSFNVSRELFF--INMWQKEEMGISCELLESDFLKCSVGF 670 680 690 700 710 760 770 780 790 800 pF1KSD P-MKRGAQVTFYLILSTSGISIETTELEVELLLATISEQELHPVSARARVFI-----ELP : :. .. : .:..:: .: : : . . . .. . . . :.. :. CCDS26 PFMRSKSKYEFSVIFDTSHLSGEEEVLSFIVTAQSGNTERSESLHDNTLVLMVPLMHEVD 720 730 740 750 760 770 810 820 830 840 850 860 pF1KSD LSIAGMAIPQQLFFSGVVRGERAMQSERDVGSK---VKYEVTVSNQGQSLRTLGSAFLNI ::.:. : .. .. : . .: . :. . .. . : : : : :: .. ..: CCDS26 TSITGIMSPTSFVYGESVDAANFIQLD-DLECHFQPINITLQVYNTGPS--TLPGSSVSI 780 790 800 810 820 870 880 890 900 910 920 pF1KSD MWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQE .:.....: .. .: :. :: .:: :: . : : CCDS26 SFPNRLSSGGAEMFHVQ-EMVVGQ---EKGNCSFQKN-----------------PTPCII 830 840 850 860 930 940 950 960 970 980 pF1KSD PGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSF--DRAAVLHVWGRLWN : :... . . . .: .::: . .:.. : . .. ... .. .. : : CCDS26 PQEQENIFHTIFAFFTKSGRK--VLDCEKPGISCLTAHCNFSALAKEESRTIDIY-MLLN 870 880 890 900 910 920 990 1000 1010 1020 1030 pF1KSD STFLEEYSAVKSLEVIVRANITVKSSIKNLML-----RDASTVIPVMVYLDPMAVVAEGV . .:.. :. . .. . ::.. : ... . . .....:. .. :.: . :. : CCDS26 TEILKKDSS-SVIQFMSRAKVKVDPALRVVEIAHGNPEEVTVVFEALHNLEPRGYVV-G- 930 940 950 960 970 980 1040 1050 1060 1070 1080 1090 pF1KSD PWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKT :.: ...:.:.:.. ::..::::::::.: CCDS26 --WIIAISLLVGILIFLLLAVLLWKMGFFRRRYKEIIEAEKNRKENEDSWDWVQKNQ 990 1000 1010 1020 1030 1100 1110 1120 1130 pF1KSD GTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA >>CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032 aa) initn: 541 init1: 120 opt: 634 Z-score: 709.1 bits: 142.9 E(32554): 3.5e-33 Smith-Waterman score: 1068; 27.2% identity (56.7% similar) in 1104 aa overlap (1-1067:1-1007) 10 20 30 40 50 60 pF1KSD MAGARSRDPWGASGICYLFGSLLVELLFSRAVAFNLDVMGALRKEGEPGSLFGFSVALHR :: :.: . ::. : . .:.:. .:: .: ..:::.::.:: CCDS42 MAWEARREPGPRRAAVRETVMLLLCLGVPTGRPYNVDTESALLYQGPHNTLFGYSVVLHS 10 20 30 40 50 60 70 80 90 100 110 pF1KSD QLQPRPQSWLLVGAPQALALPGQQANRTGGLFACPLSLEETD-CYRVDIDQ--GADMQK- . : ::::::: : : . .. :... : .. . . : .... . : : CCDS42 HGANR---WLLVGAPTANWLANASVINPGAIYRCRIGKNPGQTCEQLQLGSPNGEPCGKT 70 80 90 100 110 120 130 140 150 160 170 pF1KSD --ESKENQWLGVSV-RSQGPGGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIR : ..::::::.. :. : .:.::::.::.. . . :.. : :. . :: : CCDS42 CLEERDNQWLGVTLSRQPGENGSIVTCGHRWKNIFYIKN--ENKLPTGGCYGVPPDL--R 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD DELDGGEWKFC--EGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPGTYNWKGLLFVTNI ::. . : . . :.:. :: : .. .. : ...::::. : : ::: :: CCDS42 TELSK-RIAPCYQDYVKKFGENFASCQAGISSFYTKD--LIVMGAPGSSYWTGSLFVYNI 180 190 200 210 220 230 240 250 260 270 280 pF1KSD DSSDPDQLVYKT-LDPADRLPGPAGDLALNSYLGFSIDSGKGLVRAEELS-FVAGAPRAN .. ::. :: ... ..::::.:. : : :... . :.:::. . CCDS42 TTNK-----YKAFLDKQNQV-------KFGSYLGYSV--GAGHFRSQHTTEVVGGAPQHE 240 250 260 270 290 300 310 320 330 340 pF1KSD HKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGWPDLIVGAPYFFERQE . : . :. : . . : .:..: : :: :. ..:::.::. ::.::::. .: CCDS42 QIGKAYIFSIDEKELNILHEM-KGKKLGSYFGASVCAVDLNADGFSDLLVGAPMQSTIRE 280 290 300 310 320 330 350 360 370 380 390 400 pF1KSD ELGGAVYVYLNQG-GHWAGISPLRLCGSPD--SMFGISLAVLGDLNQDGFPDIAVGAPFD : : :.::.:.: : . : :: . :: :.. :::...::: :.:.::: . CCDS42 E--GRVFVYINSGSGAVMNAMETNLVGSDKYAARFGESIVNLGDIDNDGFEDVAIGAPQE 340 350 360 370 380 390 410 420 430 440 450 460 pF1KSD GD--GKVFIYHGSSLGVVAKPSQVLEGEAVG--IKSFGYSLSGSLDMDGNQYPDLLVGSL : : ..::.: . :. . :: .:: .. .. :: :.::..: :.: : :. ::.. CCDS42 DDLQGAIYIYNGRADGISSTFSQRIEGLQISKSLSMFGQSISGQIDADNNGYVDVAVGAF 400 410 420 430 440 450 470 480 490 500 510 pF1KSD -ADTAVLFRARPILHVSHEVSIAPRSIDLEQPNCA--GGHSVCVDLRVCFSYIA--VPSS .:.:::.:.::.. :. .: :.:.. . .:. : :::.:: .:::: . ::. CCDS42 RSDSAVLLRTRPVVIVDASLS-HPESVNRTKFDCVENGWPSVCIDLTLCFSYKGKEVPG- 460 470 480 490 500 510 520 530 540 550 560 570 pF1KSD YSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQ ..: : .. :..:. .. :: : : . . .:.. .. . . : . CCDS42 ---YIVLFYNMSLDVNRKAESP-PRFYFSSNGTSDV---ITGSIQVSSR-EANCRTHQAF 520 530 540 550 560 580 590 600 610 620 630 pF1KSD LQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVAPILNAHQPST-QRAEIHFLKQG ....:.: : : . .: : :.. . . .::. :::. .. . .. :.: . CCDS42 MRKDVRDILTPIQIEAAYHLG-PHVISKRSTEEFPPLQPILQQKKEKDIMKKTINFARF- 570 580 590 600 610 620 640 650 660 670 680 690 pF1KSD CGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPS :.... :...:: : :.. ..: .. : : :.... .. :.. . : CCDS42 CAHEN-CSADLQ-VSAKIGF------LKPH----ENKTYL-AVGSMKTLMLNVSLFNA-- 630 640 650 660 700 710 720 730 740 750 pF1KSD DPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDPAEKPL-CLSNENAS--HVECELGNP ::::.:. : : :: .:.. .. :. :: . : ..:.. ...: .: CCDS42 --------GDDAYETTLHVKLPVGLYF--IKILELEEKQINCEVTDNSGVVQLDCSIGYI 670 680 690 700 710 760 770 780 790 800 pF1KSD -MKRGAQVTFYLILSTSGISIETTELEVELLLATISEQELHPVSARARVFIELPL----- . . ... . ..:..:..: .: . . . .:.:. .. ..:: . .:: CCDS42 YVDHLSRIDISFLLDVSSLSRAEEDLSITVHATCENEEEMDNLK-HSRVTVAIPLKYEVK 720 730 740 750 760 770 810 820 830 840 850 860 pF1KSD -SIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWP .. :.. : .. ... ..: : . :.. : : :.:. .. ..:: : CCDS42 LTVHGFVNPTSFVYGSNDENE----PETCMVEKMNLTFHVINTGNSMAP--NVSVEIMVP 780 790 800 810 820 870 880 890 900 910 920 pF1KSD HEIA-NGKWLLYPMQVELEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPG . .. . :. ..:. :. : :.. .: . :::. . CCDS42 NSFSPQTDKLFNILDVQTTTGE-------C-------HFENYQR------VCALEQQKSA 830 840 850 860 930 940 950 960 970 980 pF1KSD ERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFSCPLYSFD--RAAVLHVWGRLWNST . .. . .:...:. : : .. .:. : : . ... . : .:. .: . CCDS42 MQTLKGIVRF-LSKTDKR---LLYCIKADPHCLNFLCNFGKMESGKEASVHI--QLEGRP 870 880 890 900 910 920 990 1000 1010 1020 1030 1040 pF1KSD FLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILL . :.. ...:. .::. . . . . : .: :.. . .: CCDS42 SILEMDETSALKFEIRATGFPEPNPRVIELNKDENVAHVLLEGLHHQRPKRYFTIVIISS 930 940 950 960 970 980 1050 1060 1070 1080 1090 1100 pF1KSD AVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTGTILRNN ..: ::.:: :. ..:: ::::: CCDS42 SLLLGLIVLLLISYVMWKAGFFKRQYKSILQEENRRDSWSYINSKSNDD 990 1000 1010 1020 1030 >>CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170 aa) initn: 435 init1: 195 opt: 559 Z-score: 623.5 bits: 127.3 E(32554): 2.1e-28 Smith-Waterman score: 684; 26.1% identity (52.8% similar) in 940 aa overlap (185-1091:335-1143) 160 170 180 190 200 210 pF1KSD ETRDMIGRCFVLSQDLAIRDELDGGEWKFCEGRPQGHEQFGFCQQGTAAAFSPD--SHYL :: . .. .: .. .....: : . CCDS32 KPASEFVKILDTFEKLKDLFTELQKKIYVIEGTSK-QDLTSFNMELSSSGISADLSRGHA 310 320 330 340 350 360 220 230 240 250 260 270 pF1KSD LFGAPGTYNWKGLLFVTNIDSSDPDQLVYKTLDPADRLPGPAGDLALNSYLGFSIDSGKG . :: :. .: : .. . : .: . . : : : :: :::... CCDS32 VVGAVGAKDWAGGFLDLKADLQDDTFIGNEPLTPEVR----AG------YLGYTVT---W 370 380 390 400 410 280 290 300 310 320 330 pF1KSD LVRAEELSFVA-GAPRANHKGAVVILRKDSASRLVPEVM-LSGERLTSGFGYSLAVADLN : .. :..: :::: .: : :..... ... .:. . : .. : :: : .:.. CCDS32 LPSRQKTSLLASGAPRYQHMGRVLLFQEPQGGGHWSQVQTIHGTQIGSYFGGELCGVDVD 420 430 440 450 460 470 340 350 360 370 380 pF1KSD SDGWPDLI-VGAPYFFERQEELGGAVYVYLNQGGHWAGISPLRLC-GSPDSMFGISLAVL .:: .:. .::: :. .:. :: :..: . . .: :. : : . :: ....: CCDS32 QDGETELLLIGAPLFYGEQR--GGRVFIYQRRQLGFEEVSELQGDPGYPLGRFGEAITAL 480 490 500 510 520 390 400 410 420 430 440 pF1KSD GDLNQDGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEGEAV--GIKSFGYSLSGS :.: ::. :.:::::.. .: :.:..: :. .::: .:: : ::. :: :. : CCDS32 TDINGDGLVDVAVGAPLEEQGAVYIFNGRHGGLSPQPSQRIEGTQVLSGIQWFGRSIHGV 530 540 550 560 570 580 450 460 470 480 490 500 pF1KSD LDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLEQPNCAGGHSVC---- :..:. :. ::. .. :: .::.. . .:..: : ... .:. . : CCDS32 KDLEGDGLADVAVGAESQMIVL-SSRPVVDMVTLMSFSPAEIPVHEVECSYSTSNKMKEG 590 600 610 620 630 640 510 520 530 540 550 pF1KSD VDLRVCFSYIA-VPSSYSPTVA-LDYVLDADTDR-RLRGQVPRVTFLSRNLEEPKHQASG :.. .::. . .:. . :: : :.:. : : : :: : .:. CCDS32 VNITICFQIKSLIPQFQGRLVANLTYTLQLDGHRTRRRGLFP----------GGRHELRR 650 660 670 680 690 560 570 580 590 600 610 pF1KSD TVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQ----TPRLRRQAPGQGLPPVA .. . . . : : :.. :.: . : :.:..:: ::: .: : :. .::. CCDS32 NIAVTTSMS--CTDFSFHFPVCVQDLISPINVSLNFSLWEEEGTPRDQR-AQGKDIPPIL 700 710 720 730 740 750 620 630 640 650 660 670 pF1KSD -PILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTT : :. .. :: : ...::::: :..:: ::: :.: . : CCDS32 RPSLH-----SETWEIPF-EKNCGEDKKCEANL---------RVS---FSPARSRALRLT 760 770 780 790 680 690 700 710 720 730 pF1KSD ALFALSGQPVIGLELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDP-AE :. .:: .:: ..:: .::. .:: . .: .: . :. : : .. CCDS32 AFASLS------VELSLSNLE----------EDAYWVQLDLHFPPGLSFRKVEMLKPHSQ 800 810 820 830 840 740 750 760 770 780 pF1KSD KPL-C--LSNEN---ASHVECELGNPM-KRGAQVTFYLILSTSGISI--ETTELEVELLL :. : : .:. . . :....:. : : .:.. ....: : ...::.... CCDS32 IPVSCEELPEESRLLSRALSCNVSSPIFKAGHSVALQMMFNTLVNSSWGDSVELHANVTC 850 860 870 880 890 900 790 800 810 820 830 840 pF1KSD ATISEQELHPVSARARVFIELPLSIAGMAIPQQ---LFFSGVVRGERAMQSERDVGSKVK . . . :. :: . . : :..: . :. :. : . .: . : : . CCDS32 NNEDSDLLEDNSATTIIPILYPINI--LIQDQEDSTLYVSFTPKGPKIHQ----VKHMYQ 910 920 930 940 950 850 860 870 880 890 900 pF1KSD YEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVELEGGQGPGQKGLCSPRPNI .. : . ... :: : ... :. ..: . . .:..: : : : CCDS32 VRIQPSIHDHNIPTL-EAVVGV--PQPPSEGP-ITHQWSVQME----P-------PVPC- 960 970 980 990 910 920 930 940 950 960 pF1KSD LHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEKKKNITLDCARGTANCVVFS : . : .: :. :: : :. .: CCDS32 -HYE----DLERL----PDAAEP-------------------------CLPGA----LFR 1000 1010 1020 970 980 990 1000 1010 1020 pF1KSD CPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIP ::. : . ...: : : .. : : . . . .:. .:: . . . ... CCDS32 CPVV-FRQEILVQVIGTL---ELVGEIEASSMFSLCSSLSISFNSSKHFHLYGSNASLAQ 1030 1040 1050 1060 1070 1030 1040 1050 1060 1070 1080 pF1KSD VMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAV :.. .: :: : .. .:. ..:::.: :. ..:.:.::::: . . . . CCDS32 VVMKVD---VVYEKQMLYLYVLSGIGGLLLLLLIFIVLYKVGFFKRNLKEKMEAGRGVPN 1080 1090 1100 1110 1120 1130 1090 1100 1110 1120 1130 pF1KSD KIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA :: :: .:. CCDS32 GIPAEDSEQLASGQEAGDPGCLKPLHEKDSESGGGKD 1140 1150 1160 1170 >>CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188 aa) initn: 461 init1: 150 opt: 553 Z-score: 616.6 bits: 126.0 E(32554): 5e-28 Smith-Waterman score: 731; 24.8% identity (54.7% similar) in 937 aa overlap (164-1069:330-1173) 140 150 160 170 180 190 pF1KSD GGKIVTCAHRYEARQRVDQILETRDMIGRCFVLSQDLAIRDELDG-GEWKFC-EGRPQGH : .... :..: .:. :. : :: ... CCDS45 LGYYNRRGINPETFLNEIKYIASDPDDKHFFNVTDEAALKDIVDALGDRIFSLEGTNKNE 300 310 320 330 340 350 200 210 220 230 240 pF1KSD EQFGF--CQQGTAAAFSPDSHYLLFGAPGTYNWKG-LLFVTNIDSSDPDQLVYKTLDPAD .::. : : .. :. .:.:: :.:.:.: .: :. . : . : : . CCDS45 TSFGLEMSQTGFSSHVVEDG--VLLGAVGAYDWNGAVLKETSAGKVIPLRESYLKEFP-E 360 370 380 390 400 410 250 260 270 280 290 300 pF1KSD RLPGPAGDLALNSYLGFSIDSGKGLVRAEELS-FVAGAPRANHKGAVVILRKDSASRLVP .: . . .:::... : .: ... .:::::: :: : :... . :. CCDS45 ELKNHG------AYLGYTVTS---VVSSRQGRVYVAGAPRFNHTGKVILFTMHNNRSLTI 420 430 440 450 460 310 320 330 340 350 360 pF1KSD EVMLSGERLTSGFGYSLAVADLNSDGWPD-LIVGAPYFFERQEELGGAVYVYLNQGGHWA . . :... : :: .. .:...:: : :.::::..:.. .: : :::: . . .. CCDS45 HQAMRGQQIGSYFGSEITSVDIDGDGVTDVLLVGAPMYFNEGRERG-KVYVYELRQNLFV 470 480 490 500 510 520 370 380 390 400 410 420 pF1KSD GISPLRLCGS-PDSMFGISLAVLGDLNQDGFPDIAVGAPFDGD--GKVFIYHGSSLGVVA . :. : .. :: :.: . :::::.. :..::::.. . : ..:.:: ... CCDS45 YNGTLKDSHSYQNARFGSSIASVRDLNQDSYNDVVVGAPLEDNHAGAIYIFHGFRGSILK 530 540 550 560 570 580 430 440 450 460 470 480 pF1KSD KPSQ-VLEGE-AVGIKSFGYSLSGSLDMDGNQYPDLLVGSLADTAVLFRARPILHVSHEV :.: . .: :.:.. :: :. :.::.. . :: ::.:.. ::.. .::..... . CCDS45 TPKQRITASELATGLQYFGCSIHGQLDLNEDGLIDLAVGALGN-AVILWSRPVVQINASL 590 600 610 620 630 640 490 500 510 520 530 pF1KSD SIAPRSIDLEQPNC--AGGHSVCVDLRVCFSYIAV-PSSYSPTVALDYVLDADTDRRLRG . : .:.. . .: .: ..:. .::. : . : . ::.. : .: :.: CCDS45 HFEPSKINIFHRDCKRSGRDATCLAAFLCFTPIFLAPHFQTTTVGIRY--NATMDERRY- 650 660 670 680 690 700 540 550 560 570 580 590 pF1KSD QVPRVTFLSRNLEEPKHQASGTVWLKHQHDRVCGDAMFQLQENVKDKLRAIVVTLSYSLQ .::. .:.: . .. . : . ...: :.. ... : .. .. .. :::. CCDS45 -TPRA-----HLDEGGDRFTNRAVLLSSGQELCERINFHVLDTA-DYVKPVTFSVEYSLE 710 720 730 740 750 600 610 620 630 640 650 pF1KSD TPRLRRQAPGQGLPPVAPILNAHQPSTQRAEIHFLKQGCGEDKICQSNLQL-VRA----- : .: :.:. :.: :. . : . ::.::. : .: : .:. CCDS45 DP-------DHG-----PMLDDGWPTTLRVSVPFWN-GCNEDEHCVPDLVLDARSDLPTA 760 770 780 790 800 660 670 680 690 700 pF1KSD -RFCTRV-----SDTEFQPLPMDVDGTTALFALSGQPVIGLELMVTNLPSDPAQPQADGD ..: :: .: : .: ::... : . ...: . : :. CCDS45 MEYCQRVLRKPAQDCSAYTLSFD---TTVFIIESTRQRVAVEATLEN----------RGE 810 820 830 840 710 720 730 740 750 760 pF1KSD DAHEAQLLVMLPDSLHYSG-VRALDPAEKPLCLSNENASHVE-CELGNPMKRG-AQVTFY .:. . : . .:.... .. : . :...: . . :... :. :. :.:.: CCDS45 NAYSTVLNISQSANLQFASLIQKEDSDGSIECVNEERRLQKQVCNVSYPFFRAKAKVAFR 850 860 870 880 890 900 770 780 790 800 810 820 pF1KSD LILSTSGISIETTELEVELLLATIS-EQELHPVSARARVFIELPLSIAGMAIPQQLFFSG : . : :: .::.:: .. : :.. . : . ..: . .. . CCDS45 LDFEFSK-SIFLHHLEIELAAGSDSNERDSTKEDNVAPLRFHLKYEADVLFTRSSSLSHY 910 920 930 940 950 960 830 840 850 860 870 880 pF1KSD VVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMWPHEIANGKWLLYPMQVE :. . ... .: . ..: : : . . ...: : .:. :: . CCDS45 EVKPNSSLERYDGIGPPFSCIFRIQNLG--LFPIHGMMMKITIPIATRSGNRLL-----K 970 980 990 1000 1010 1020 890 900 910 920 930 940 pF1KSD LEGGQGPGQKGLCSPRPNILHLDVDSRDRRRRELEPPEQQEPGERQEPSMSWWPVSSAEK :. . :. : : . : : : :. :... .. CCDS45 LRDFLTDEANTSCNIWGN-------STEYR------PTPVEEDLRRAPQLN-------HS 1030 1040 1050 1060 950 960 970 980 990 1000 pF1KSD KKNITLDCARGTANCVVFSCPLYSFDRAAVLHVWGRLWNSTFLEEYSAVKSLEVIVRANI ..... . :: . : .. .:. : :: .. . ::....: : . CCDS45 NSDVV------SINCNIRLVP----NQEINFHLLGNLWLRSL--KALKYKSMKIMVNAAL 1070 1080 1090 1100 1010 1020 1030 1040 1050 1060 pF1KSD TVKSSIKNLMLRDASTVIPVMVYLDPMAVVAEGVPWWVILLAVLAGLLVLALLVLLLWKM .. . ...:. . .. .. . :: :.:. ..:.:::.:::::: :::. CCDS45 Q-RQFHSPFIFREEDPSRQIVFEISKQE--DWQVPIWIIVGSTLGGLLLLALLVLALWKL 1110 1120 1130 1140 1150 1160 1070 1080 1090 1100 1110 1120 pF1KSD GFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTGTILRNNWGSPRREGPDAHPILAADG :::. :. CCDS45 GFFRSARRRREPGLDPTPKVLE 1170 1180 1137 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 08:25:18 2016 done: Thu Nov 3 08:25:19 2016 Total Scan time: 4.520 Total Display time: 0.470 Function used was FASTA [36.3.4 Apr, 2011]