FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDB1489, 1518 aa
1>>>pF1KSDB1489 1518 - 1518 aa - 1518 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.7306+/-0.000858; mu= 14.9594+/- 0.052
mean_var=186.3844+/-37.544, 0's: 0 Z-trim(114.1): 119 B-trim: 136 in 1/54
Lambda= 0.093944
statistics sampled from 14598 (14723) to 14598 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.756), E-opt: 0.2 (0.452), width: 16
Scan time: 5.510
The best scores are: opt bits E(32554)
CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584) 8455 1159.4 0
CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551) 5255 725.6 2.8e-208
CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522) 2386 336.8 3.1e-91
CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584) 1425 206.6 5.2e-52
CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923) 612 96.6 1.2e-18
CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635) 579 92.4 4.3e-17
CCDS41352.1 ADGRL4 gene_id:64123|Hs108|chr1 ( 690) 526 84.4 1.3e-15
CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074) 524 84.3 2.2e-15
CCDS82926.1 ADGRL3 gene_id:23284|Hs108|chr4 (1240) 521 83.9 3.3e-15
CCDS54768.1 ADGRL3 gene_id:23284|Hs108|chr4 (1469) 521 84.0 3.7e-15
CCDS32931.1 ADGRE5 gene_id:976|Hs108|chr19 ( 742) 491 79.7 3.8e-14
CCDS32930.1 ADGRE5 gene_id:976|Hs108|chr19 ( 786) 491 79.7 4e-14
CCDS32929.1 ADGRE5 gene_id:976|Hs108|chr19 ( 835) 491 79.7 4.1e-14
CCDS35491.1 SEMA5B gene_id:54437|Hs108|chr3 (1151) 492 80.0 4.8e-14
CCDS58848.1 SEMA5B gene_id:54437|Hs108|chr3 (1205) 492 80.0 4.9e-14
CCDS2775.1 CELSR3 gene_id:1951|Hs108|chr3 (3312) 498 81.2 5.8e-14
CCDS58645.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 867) 468 76.6 3.7e-13
CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 471 77.5 6.9e-13
CCDS76174.1 ADGRL2 gene_id:23266|Hs108|chr1 (1123) 461 75.8 8.6e-13
CCDS72811.1 ADGRL2 gene_id:23266|Hs108|chr1 (1177) 461 75.8 8.9e-13
CCDS689.1 ADGRL2 gene_id:23266|Hs108|chr1 (1403) 461 75.9 1e-12
CCDS81345.1 ADGRL2 gene_id:23266|Hs108|chr1 (1416) 461 75.9 1e-12
CCDS9272.1 ADGRD1 gene_id:283383|Hs108|chr12 ( 874) 452 74.5 1.7e-12
CCDS81753.1 ADGRD1 gene_id:283383|Hs108|chr12 ( 906) 452 74.5 1.7e-12
CCDS12307.1 ADGRL1 gene_id:22859|Hs108|chr19 (1469) 454 74.9 2e-12
CCDS32928.1 ADGRL1 gene_id:22859|Hs108|chr19 (1474) 454 74.9 2e-12
CCDS58643.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 709) 422 70.3 2.4e-11
CCDS35409.1 ADGRG4 gene_id:139378|Hs108|chrX (3080) 433 72.4 2.5e-11
CCDS58646.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 745) 422 70.3 2.5e-11
CCDS12175.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 886) 422 70.4 2.8e-11
CCDS74296.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 526) 415 69.2 3.7e-11
CCDS74297.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 600) 415 69.3 4.1e-11
CCDS12315.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 652) 415 69.3 4.4e-11
CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170) 414 69.4 7.3e-11
>>CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584 aa)
initn: 7686 init1: 7686 opt: 8455 Z-score: 6196.6 bits: 1159.4 E(32554): 0
Smith-Waterman score: 10216; 96.4% identity (96.4% similar) in 1550 aa overlap (24-1518:36-1584)
10 20 30 40 50
pF1KSD MTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC
::::::::::::::::::::::::::::::
CCDS72 WMGKGHRMTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KSD LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH
190 200 210 220 230 240
240 250 260 270 280 290
pF1KSD TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA
250 260 270 280 290 300
pF1KSD QT-------------------------------------------------------VHG
:: :::
CCDS72 QTGDPAAEEWSPWSVCSLTCGQGLQVRTRSCVSSPYGTLCSGPLRETRPCNNSATCPVHG
310 320 330 340 350 360
300 310 320 330 340 350
pF1KSD VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW
370 380 390 400 410 420
360 370 380 390 400 410
pF1KSD GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS
430 440 450 460 470 480
420 430 440 450 460 470
pF1KSD LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK
490 500 510 520 530 540
480 490 500 510 520 530
pF1KSD KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK
550 560 570 580 590 600
540 550 560 570 580 590
pF1KSD GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF
610 620 630 640 650 660
600 610 620 630 640 650
pF1KSD FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS
670 680 690 700 710 720
660 670 680 690 700 710
pF1KSD IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR
730 740 750 760 770 780
720 730 740 750 760 770
pF1KSD GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT
790 800 810 820 830 840
780 790 800 810 820 830
pF1KSD VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR
850 860 870 880 890 900
840 850 860 870 880 890
pF1KSD CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER
910 920 930 940 950 960
900 910 920 930 940 950
pF1KSD SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV
970 980 990 1000 1010 1020
960 970 980 990 1000 1010
pF1KSD IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA
1030 1040 1050 1060 1070 1080
1020 1030 1040 1050 1060 1070
pF1KSD VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSA
1090 1100 1110 1120 1130 1140
1080 1090 1100 1110 1120 1130
pF1KSD SARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL
1150 1160 1170 1180 1190 1200
1140 1150 1160 1170 1180 1190
pF1KSD RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS
1210 1220 1230 1240 1250 1260
1200 1210 1220 1230 1240 1250
pF1KSD TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY
1270 1280 1290 1300 1310 1320
1260 1270 1280 1290 1300 1310
pF1KSD MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA
1330 1340 1350 1360 1370 1380
1320 1330 1340 1350 1360 1370
pF1KSD AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM
1390 1400 1410 1420 1430 1440
1380 1390 1400 1410 1420 1430
pF1KSD PRTVPGSTMKMGSLERKKLRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAK
::::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::
CCDS72 PRTVPGSTMKMGSLERKKLRYSDLDFE-VMHTRKRHSELYHELNQKFHTFDRYRSQSTAK
1450 1460 1470 1480 1490 1500
1440 1450 1460 1470 1480 1490
pF1KSD REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL
1510 1520 1530 1540 1550 1560
1500 1510
pF1KSD HRAAAWEPTEPPDGDFQTEV
::::::::::::::::::::
CCDS72 HRAAAWEPTEPPDGDFQTEV
1570 1580
>>CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551 aa)
initn: 6049 init1: 5247 opt: 5255 Z-score: 3852.8 bits: 725.6 E(32554): 2.8e-208
Smith-Waterman score: 9909; 94.3% identity (94.3% similar) in 1550 aa overlap (24-1518:36-1551)
10 20 30 40 50
pF1KSD MTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC
::::::::::::::::::::::::::::::
CCDS72 WMGKGHRMTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KSD LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH
190 200 210 220 230 240
240 250 260 270 280 290
pF1KSD TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA
250 260 270 280 290 300
pF1KSD QT-------------------------------------------------------VHG
:: :::
CCDS72 QTGDPAAEEWSPWSVCSLTCGQGLQVRTRSCVSSPYGTLCSGPLRETRPCNNSATCPVHG
310 320 330 340 350 360
300 310 320 330 340 350
pF1KSD VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW
370 380 390 400 410 420
360 370 380 390 400 410
pF1KSD GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS
430 440 450 460 470 480
420 430 440 450 460 470
pF1KSD LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK
490 500 510 520 530 540
480 490 500 510 520 530
pF1KSD KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK
550 560 570 580 590 600
540 550 560 570 580 590
pF1KSD GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF
610 620 630 640 650 660
600 610 620 630 640 650
pF1KSD FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS
670 680 690 700 710 720
660 670 680 690 700 710
pF1KSD IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR
730 740 750 760 770 780
720 730 740 750 760 770
pF1KSD GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT
790 800 810 820 830 840
780 790 800 810 820 830
pF1KSD VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR
850 860 870 880 890 900
840 850 860 870 880 890
pF1KSD CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER
910 920 930 940 950 960
900 910 920 930 940 950
pF1KSD SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV
970 980 990 1000 1010 1020
960 970 980 990 1000 1010
pF1KSD IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA
1030 1040 1050 1060 1070 1080
1020 1030 1040 1050 1060 1070
pF1KSD VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSA
:::::::::::::::::::::::::::::::::
CCDS72 VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAG---------------------------
1090 1100 1110
1080 1090 1100 1110 1120 1130
pF1KSD SARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 ------ASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL
1120 1130 1140 1150 1160 1170
1140 1150 1160 1170 1180 1190
pF1KSD RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS
1180 1190 1200 1210 1220 1230
1200 1210 1220 1230 1240 1250
pF1KSD TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY
1240 1250 1260 1270 1280 1290
1260 1270 1280 1290 1300 1310
pF1KSD MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA
1300 1310 1320 1330 1340 1350
1320 1330 1340 1350 1360 1370
pF1KSD AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM
1360 1370 1380 1390 1400 1410
1380 1390 1400 1410 1420 1430
pF1KSD PRTVPGSTMKMGSLERKKLRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAK
::::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::
CCDS72 PRTVPGSTMKMGSLERKKLRYSDLDFE-VMHTRKRHSELYHELNQKFHTFDRYRSQSTAK
1420 1430 1440 1450 1460 1470
1440 1450 1460 1470 1480 1490
pF1KSD REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL
1480 1490 1500 1510 1520 1530
1500 1510
pF1KSD HRAAAWEPTEPPDGDFQTEV
::::::::::::::::::::
CCDS72 HRAAAWEPTEPPDGDFQTEV
1540 1550
>>CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522 aa)
initn: 4306 init1: 1978 opt: 2386 Z-score: 1751.4 bits: 336.8 E(32554): 3.1e-91
Smith-Waterman score: 4604; 45.5% identity (68.5% similar) in 1620 aa overlap (8-1518:7-1522)
10 20 30 40 50
pF1KSD MTPACPLLLSVILSLRLATAFDPAPSA---CSALASGVLYGAFSLQDLFPTIASGCSWTL
:: :.: : . : . ::.:..::.::..:....:: ..:.:::
CCDS49 MKAVRNLLIYIFSTYLLVMFGFNAAQDFWCSTLVKGVIYGSYSVSEMFPKNFTNCTWTL
10 20 30 40 50
60 70 80 90 100 110
pF1KSD ENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEVGRPE
:::::::::.::.:.... :..:. .::. : :. ... : .
CCDS49 ENPDPTKYSIYLKFSKKDLSCSNFSLLAYQFDHF---------SHEKI-----KDLLRKN
60 70 80 90 100
120 130 140 150 160 170
pF1KSD EEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFR-FVEVLLI
. . ..::.... :.::..::::.:. . :.. : : . . : : :..
CCDS49 H------SIMQLCNSKNAFVFLQYDKNFIQI-RRVFPTNFPGLQKKGEEDQKSFFEFLVL
110 120 130 140 150
180 190 200 210 220 230
pF1KSD NNNNSSQFTCGVLCRWSEECGRAA-GR--ACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH
:. . ::: : ::: : : : .. :: .::. :.:: . : . :
CCDS49 NKVSPSQFGCHVLCTWLESCLKSENGRTESCGIMYTKCTCPQHLGEWGIDDQS-----LI
160 170 180 190 200 210
240 250 260 270 280
pF1KSD TLSNALVPGGPAPPA--EADLHSGSSNDLFTTEMRYGEEPEEE------PKVKTQWPRSA
:.:...: . . .:.. . .: : : . . :.:: .:.: :::.
CCDS49 LLNNVVLPLNEQTEGCLTQELQTTQVCNL-TREAK--RPPKEEFGMMGDHTIKSQRPRSV
220 230 240 250 260 270
290
pF1KSD DEPGL---------YMAQT-----------------------------------------
: . .::::
CCDS49 HEKRVPQEQADAAKFMAQTGESGVEEWSQWSTCSVTCGQGSQVRTRTCVSPYGTHCSGPL
280 290 300 310 320 330
300 310 320 330 340
pF1KSD -------------VHGVWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTK
::::::::. ::::: .::::.:.: :.:.:::.::. ::::: . :
CCDS49 RESRVCNNTALCPVHGVWEEWSPWSLCSFTCGRGQRTRTRSCTPPQYGGRPCEGPETHHK
340 350 360 370 380 390
350 360 370 380 390 400
pF1KSD LCSMAACPVEGQWLEWGPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNL
:..: :::.::: ::. :. ::..:.::::::::.:..:. . . : : ...::: :
CCDS49 PCNIALCPVDGQWQEWSSWSQCSVTCSNGTQQRSRQCTAAAHGGSECRGPWAESRECYNP
400 410 420 430 440 450
410 420 430 440 450 460
pF1KSD ECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPA
:: : ...:. :. :: :::.:: ::.::.: ::.. : ::::::::. :.:.::::
CCDS49 ECTA-NGQWNQWGHWSGCSKSCDGGWERRIRTCQGAVITGQQCEGTGEEVRRCNEQRCPA
460 470 480 490 500
470 480 490 500 510 520
pF1KSD FHEMCRDEYVMLMTWKKAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCIS
.:.: ..:.: :.::.. ::.. .:.:: ::.:..:::: :: .:::.: ::::::::
CCDS49 PYEICPEDYLMSMVWKRTPAGDLAFNQCPLNATGTTSRRCSLSLHGVAFWEQPSFARCIS
510 520 530 540 550 560
530 540 550 560 570 580
pF1KSD HEYRYLYLSLREHLAKGQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDT
.:::.: :..::::::::::::.:::::...: .: :...:.::::.::.::::::::
CCDS49 NEYRHLQHSIKEHLAKGQRMLAGDGMSQVTKTLLDLTQRKNFYAGDLLMSVEILRNVTDT
570 580 590 600 610 620
590 600 610 620 630 640
pF1KSD FKRATYVPSADDVQRFFQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDAL
::::.:.:..: :: :::.:: ..: ::::::.::::. :::..:..:.:::::.:: ..
CCDS49 FKRASYIPASDGVQNFFQIVSNLLDEENKEKWEDAQQIYPGSIELMQVIEDFIHIVGMGM
630 640 650 660 670 680
650 660 670 680 690 700
pF1KSD KAFQSSLIVTDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLS
::.: ..: :.: :::. :...: .::.:::.::.:: ::.:.::::. .:: ...
CCDS49 MDFQNSYLMTGNVVASIQKLPAASVLTDINFPMKGRKGMVDWARNSEDRVVIPKSIFT--
690 700 710 720 730 740
710 720 730 740 750 760
pF1KSD SPGKPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILP
:..: . :::: ::.:::::..: ::::
CCDS49 ----PVSS----------------------------KELDESSVFVLGAVLYKNLDLILP
750 760 770
770 780 790 800 810 820
pF1KSD PPRPPLAVTSRVMTVTVRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDW
: ...:....::.:: . .. .. .::... ::: .:.:. :: :... : : :
CCDS49 TLRNYTVINSKIIVVTIRPEPKT-TDSFLEIELAHLANGTLNPYCVLWDDSKTNESLGTW
780 790 800 810 820 830
830 840 850 860 870 880
pF1KSD DTENCQTLETQAAHTRCQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLT
.:..:.:. :.:.::.: :..:::::.::: :... .: .:.::: :..: ..::.::.:
CCDS49 STQGCKTVLTDASHTKCLCDRLSTFAILAQQPREIIMESSGTPSVTLIVGSGLSCLALIT
840 850 860 870 880 890
890 900 910 920 930 940
pF1KSD LLAIYAAFWRFIKSERSIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLS
: ..:::.::.:.:::::::.::::::..:::::::::... .:..:: :.::::::::.
CCDS49 LAVVYAALWRYIRSERSIILINFCLSIISSNILILVGQTQTHNKSICTTTTAFLHFFFLA
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KSD SFCWVLTEAWQSYLAVIGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCW
:::::::::::::.:: :..::::.:::::::::::::::::.::::::::::::. :::
CCDS49 SFCWVLTEAWQSYMAVTGKIRTRLIRKRFLCLGWGLPALVVATSVGFTRTKGYGTDHYCW
960 970 980 990 1000 1010
1010 1020 1030 1040 1050 1060
pF1KSD LSLEGGLLYAFVGPAAVIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLL
::::::::::::::::..:::::.:::.:::::..:::: ::. :.:::. : ..: :
CCDS49 LSLEGGLLYAFVGPAAAVVLVNMVIGILVFNKLVSRDGILDKKLKHRAGQMSEPHSGLTL
1020 1030 1040 1050 1060 1070
1070 1080 1090 1100 1110 1120
pF1KSD PCSACGAVPSPLLSSASARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAV
:. ::.: . ::...: :::::::::::::::::::::::::::::.::.::: ::::
CCDS49 KCAKCGVVSTTALSATTASNAMASLWSSCVVLPLLALTWMSAVLAMTDKRSILFQILFAV
1080 1090 1100 1110 1120 1130
1130 1140 1150 1160 1170 1180
pF1KSD FNSAQGFVITAVHCFLRREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDL
:.: :::::. :::.:::::::. .:.. :. . :: .: ::. ::..:::::::.
CCDS49 FDSLQGFVIVMVHCILRREVQDAFRCRLRNCQDPINADSSSSFPNGHAQIMTDFEKDVDI
1140 1150 1160 1170 1180 1190
1190 1200 1210 1220 1230 1240
pF1KSD ACQTVLFKEVNTCNPSTITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNIL--VPMA
::..:: :... : .::::::::.::..::: :. ..::: ::.: ::::.. : .
CCDS49 ACRSVLHKDIGPCRAATITGTLSRISLNDDEEEKG--TNPEG-LSYSTLPGNVISKVIIQ
1200 1210 1220 1230 1240 1250
1250 1260 1270 1280
pF1KSD ASPGLGEPPPPQE-ANP------------VYMCGEGGLRQLDLTWLRPTEPGSEGDYMVL
:: : .: .:: ::.: . .:: :. ..: : :.::.:.
CCDS49 QPTGLHMPMSMNELSNPCLKKENSELRRTVYLCTDDNLRGADMDIVHPQERMMESDYIVM
1260 1270 1280 1290 1300 1310
1290 1300 1310 1320 1330 1340
pF1KSD PRRTLSLQPGGGGGGGEDAPRARPEGTPRRAAKTVAHTEGYPSFLS----VDHSGLGLGP
:: ... ::. :. : :. . . : . : : .:. ...:
CCDS49 PRSSVNNQPSMK---EESKMNIGMETLPH---ERLLHYKVNPEFNMNPPVMDQFNMNLEQ
1320 1330 1340 1350 1360
1350 1360 1370 1380 1390 1400
pF1KSD AYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTMPRTVPGSTMKMGSLERKKLRYSDLD
. .. .. :.: : . . . . :. :::..:.::::.: ::::::
CCDS49 HLAPQEHMQNLPFEPR--TAVKNFMASELDDNAGLSRSETGSTISMSSLERRKSRYSDLD
1370 1380 1390 1400 1410 1420
1410 1420 1430 1440 1450 1460
pF1KSD FEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAKREKRWSVSSGGAAERSVCTDKPSPG
::::::::::: ::..::::::.:.::.:. . . .. : .:.:.
CCDS49 FEKVMHTRKRHMELFQELNQKFQTLDRFRD-----------IPNTSSME------NPAPN
1430 1440 1450 1460
1470 1480 1490 1500 1510
pF1KSD ERPSLSQHRRHQSWSTFKS-------MTLGSLPPKPRERLTLHRAAAWE-----PTEPPD
. : :.:::. :.. : . .. : : : : :: : . .
CCDS49 KNP----------WDTFKNPSEYPHYTTINVLDTEAKDALEL-RPAEWEKCLNLPLDVQE
1470 1480 1490 1500 1510
pF1KSD GDFQTEV
:::::::
CCDS49 GDFQTEV
1520
>>CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584 aa)
initn: 2609 init1: 1107 opt: 1425 Z-score: 1047.3 bits: 206.6 E(32554): 5.2e-52
Smith-Waterman score: 3576; 39.2% identity (60.9% similar) in 1655 aa overlap (36-1518:51-1584)
10 20 30 40 50 60
pF1KSD PLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGCSWTLENPDPTKY
..: :: .::. :: :::::.:::: .:
CCDS64 LLLLGRRARAAAGADAGPGPEPCATLVQGKFFGYFSAAAVFPANASRCSWTLRNPDPRRY
30 40 50 60 70 80
70 80 90 100 110 120
pF1KSD SLYLRFNRQEQVCAHFAP---RLLPLDHYLVNFTCLRPSPEEAVAQAESEVGRPEEEEAE
.::.. . :. .: : .: .: .... .: .:.
CCDS64 TLYMKVAKAPVPCS--GPGRVRTYQFDSFL--------------ESTRTYLGVESFDEV-
90 100 110 120
130 140 150 160 170
pF1KSD AAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEA---PRLLAPAALAFRFVEVLLINNN
:.::. :.:..::. .:.:.:. . :.. :: :. :: :...:
CCDS64 ----LRLCDPSAPLAFLQASKQFLQMRRQQPPQHDGLRPRAGPPGPTDDFSVEYLVVGNR
130 140 150 160 170
180 190 200 210 220
pF1KSD NSSQFTCGVLCRWSEEC--GRAAGRACGFAQPGCSC-PGEAGAGSTTTTSP---------
: :. .: .:::: . : : ... ::. : :.: ::::. .. .:
CCDS64 NPSRAACQMLCRWLDACLAGSRSSHPCGIMQTPCACLGGEAGGPAAGPLAPRGDVCLRDA
180 190 200 210 220 230
230 240
pF1KSD --GPPAAHTLSNALVPGG--------------------------------PAPPAE----
: : : . :: ::: .:
CCDS64 VAGGPENCLTSLTQDRGGHGATGGWKLWSLWGECTRDCGGGLQTRTRTCLPAPGVEGGGC
240 250 260 270 280 290
250 260 270
pF1KSD -----------------ADLHSGSSNDLFTTEMRYGEE------------PEE-EPKVK-
: :. :..: .:. : :: :. .: ..
CCDS64 EGVLEEGRQCNREACGPAGRTSSRSQSLRSTDARRREELGDELQQFGFPAPQTGDPAAEE
300 310 320 330 340 350
280 290 300
pF1KSD -TQWPRSADEPGL-------------YMAQT-----------------VHGVWEEWGSWS
. : .. : : .: :::.:.::. ::
CCDS64 WSPWSVCSSTCGEGWQTRTRFCVSSSYSTQCSGPLREQRLCNNSAVCPVHGAWDEWSPWS
360 370 380 390 400 410
310 320 330 340 350 360
pF1KSD LCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACP---VEGQWLEWGPWGPC
::: .:::: :.: ::: ::: ::. ::::: :::.:..: :: :.:.: ::. :. :
CCDS64 LCSSTCGRGFRDRTRTCRPPQFGGNPCEGPEKQTKFCNIALCPGRAVDGNWNEWSSWSAC
420 430 440 450 460 470
370 380 390 400 410 420
pF1KSD STSCANGTQQRSRKCSVAGPAW--ATCTGALTDTRECSNLECPATDSKWGPWNAWSLCSK
:.::..: :::.:.:. ::.. : : : ..::.: .::. :.:: : .:. ::
CCDS64 SASCSQGRQQRTRECN--GPSYGGAECQGHWVETRDCFLQQCPV-DGKWQAWASWGSCSV
480 490 500 510 520 530
430 440 450 460 470 480
pF1KSD TCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAA
:: .: ::: :.:.. : :.: .: . :. .::: ::.: .. . ::.. :
CCDS64 TCGAGSQRRERVCSGPFFGGAACQGPQDEYRQCGTQRCPEPHEICDEDNFGAVIWKETPA
540 550 560 570 580 590
490 500 510 520 530 540
pF1KSD GEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAKGQRM
::. .:: ::.: ::: :. .:.::: :.. ::.: .:: . . ::::::.::
CCDS64 GEVAAVRCPRNATGLILRRCELDEEGIAYWEPPTYIRCVSIDYRNIQMMTREHLAKAQRG
600 610 620 630 640 650
550 560 570 580 590 600
pF1KSD LAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRFFQVV
: :::.:.:...: :. : :::::: ..:.:::.:. :.:: : :. ::: : :..
CCDS64 LPGEGVSEVIQTLVEISQDGTSYSGDLLSTIDVLRNMTEIFRRAYYSPTPGDVQNFVQIL
660 670 680 690 700 710
610 620 630 640 650 660
pF1KSD SFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVISIQRE
: .. ::..::..:: ..:.. .:.:.::::. ..: .: .... ::::::.::..
CCDS64 SNLLAEENRDKWEEAQLAGPNAKELFRLVEDFVDVIGFRMKDLRDAYQVTDNLVLSIHKL
720 730 740 750 760 770
670 680 690 700 710 720
pF1KSD PVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGRGRGP
:.:. ..::.:::.: :. ::.. :::. . : :.: .: .
CCDS64 PASG-ATDISFPMKGWRATGDWAKVPEDRVTVSKSVFS---------TGLT---------
780 790 800 810
730 740 750 760 770 780
pF1KSD GTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVTVRPP
. ::.: ::.:.::::.:: .: : ...:.:..:::.::
CCDS64 -----------------EADEASVFVVGTVLYRNLGSFLALQRNTTVLNSKVISVTVKPP
820 830 840 850 860
790 800 810 820 830
pF1KSD TQPPAEPLITVELSYIINGTTDPHCASWDYSRADASS-----GDWDTENCQTLETQAAHT
. :: .:.... ::::. : :: . . .:: : :. ..:.:. .: .:
CCDS64 PRSLRTPL-EIEFAHMYNGTTNQTCILWDETDVPSSSAPPQLGPWSWRGCRTVPLDALRT
870 880 890 900 910
840 850 860 870 880 890
pF1KSD RCQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSE
:: :..:::::.::: : ..: : ::: :..::.:: ..:: :. ::.. ::.:.::
CCDS64 RCLCDRLSTFAILAQLSADANMEKATLPSVTLIVGCGVSSLTLLMLVIIYVSVWRYIRSE
920 930 940 950 960 970
900 910 920 930 940 950
pF1KSD RSIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLA
::.::.::::::..:: :::.::... .: :::..:::::::::::::::::::::::.:
CCDS64 RSVILINFCLSIISSNALILIGQTQTRNKVVCTLVAAFLHFFFLSSFCWVLTEAWQSYMA
980 990 1000 1010 1020 1030
960 970 980 990 1000 1010
pF1KSD VIGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPA
: :..:.::.:::::::::::::::::.:::::..:::.: .::::::::::::::::::
CCDS64 VTGHLRNRLIRKRFLCLGWGLPALVVAISVGFTKAKGYSTMNYCWLSLEGGLLYAFVGPA
1040 1050 1060 1070 1080 1090
1020 1030 1040 1050 1060 1070
pF1KSD AVIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSS
:..:::::.:::.:::::...:::.::. :.:::
CCDS64 AAVVLVNMVIGILVFNKLVSKDGITDKKLKERAG--------------------------
1100 1110 1120 1130
1080 1090 1100 1110 1120 1130
pF1KSD ASARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCF
:::::::::::::::::::::::.:::::.::: :::::.: .::::. :::.
CCDS64 -------ASLWSSCVVLPLLALTWMSAVLAVTDRRSALFQILFAVFDSLEGFVIVMVHCI
1140 1150 1160 1170 1180
1140 1150 1160 1170 1180 1190
pF1KSD LRREVQDVVKCQMGVCRADESE-DSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCN
:::::::.:::.. : : .:.. :: : .::. :...::::::::::..:: :.. .:
CCDS64 LRREVQDAVKCRV-VDRQEEGNGDSGGSFQNGHAQLMTDFEKDVDLACRSVLNKDIAACR
1190 1200 1210 1220 1230 1240
1200 1210 1220 1230 1240 1250
pF1KSD PSTITGTLSRLSLDEDEEPKSCLVGPEGS-LSFSPLPGNIL-VPMAASPGL-GEPPP--P
.::::::.: :: :.:. : :. .: .:. ::.:. . . .:: : : : :
CCDS64 TATITGTLKRPSLPEEEKLK--LAHAKGPPTNFNSLPANVSKLHLHGSPRYPGGPLPDFP
1250 1260 1270 1280 1290 1300
1260 1270 1280 1290 1300
pF1KSD Q--------EANPVYMCGEGGL-RQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGG
. .: . :.: . ..:: : : . . .:..:: : .:.:
CCDS64 NHSLTLKRDKAPKSSFVGDGDIFKKLDSELSRAQEKALDTSYVILPTATATLRP------
1310 1320 1330 1340 1350
1310 1320 1330 1340 1350
pF1KSD GEDAPRARPEGT---PRRAAKTVAHTEGYP-SFLSVDHSGLGLGPAYGSLQNPYGMTFQP
:. .:. . . . : : . : . :. : . : .. :
CCDS64 ---KPKEEPKYSIHIDQMPQTRLIHLSTAPEASLPARSPPSRQPPSGGPPEAPPAQPPPP
1360 1370 1380 1390 1400 1410
1360 1370 1380 1390
pF1KSD PPPTPSARQVP---------------EPGE-RSRTMPRTVPGS------TMKMGSLERKK
::: : : : .::: .. : : :.. :....::::.:
CCDS64 PPPPPPPPQQPLPPPPNLEPAPPSLGDPGEPAAHPGPSTGPSTKNENVATLSVSSLERRK
1420 1430 1440 1450 1460 1470
1400 1410 1420 1430 1440 1450
pF1KSD LRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAKREKRWSVSSGGAAERSVC
::..:::::.:::::::......::.:. : .:...:. .. . :.
CCDS64 SRYAELDFEKIMHTRKRHQDMFQDLNRKL--------QHAAEKDKE-VLGPDSKPEK---
1480 1490 1500 1510 1520
1460 1470 1480 1490 1500 1510
pF1KSD TDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTLH--RAAAWEPTEPPDG-D
. .:..:: : .. : . . :. : : :.: : ... :..: : : :
CCDS64 --QQTPNKRPWESLRKAHGTPTWVKK-ELEPLQPSPLELRSVEWERSGATIPLVGQDIID
1530 1540 1550 1560 1570
pF1KSD FQTEV
.::::
CCDS64 LQTEV
1580
>>CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923 aa)
initn: 283 init1: 171 opt: 612 Z-score: 448.3 bits: 96.6 E(32554): 1.2e-18
Smith-Waterman score: 737; 23.8% identity (50.1% similar) in 1200 aa overlap (307-1471:1841-2891)
280 290 300 310 320 330
pF1KSD VKTQWPRSADEPGLYMAQTVHGVWEEWGSWSLCSRSCGRGSRSRMRTC-VPPQHGGKACE
:.:.: . : . :: ::.. : ::
CCDS79 DWDSYSCSCDPGYYGDNCTNVCDLNPCEHQSVCTR---KPSAPHGYTCECPPNYLGPYCE
1820 1830 1840 1850 1860
340 350 360 370 380 390
pF1KSD GPELQTKLCSMAACPVEGQWLEWG-PW-GPCSTSCANGTQQRSRKCSVAGPAWATCTGAL
:.. . :: .: : :: : :::. . ..: . : : . :
CCDS79 -----TRIDQ--PCP-RG-W--WGHPTCGPCNCDVSKGFDPDCNKTS------GECHCKE
1870 1880 1890 1900 1910
400 410 420 430 440 450
pF1KSD TDTRECSNLECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVK
. : .. : : . . :: :..:: . :. :. : :. .
CCDS79 NHYRPPGSPTCLLCDC----YPTGSL-SRVCDP--EDGQCPCKP-GVIGRQCDRCDNPFA
1920 1930 1940 1950 1960
460 470 480 490 500 510
pF1KSD PCSEKRCPAFHEMCRDEYVMLMTWKKAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWG
. . : . .. : . : .. : :: .. :.: :.: .: :
CCDS79 EVTTNGCEVNYDSCPRAIEAGIWWPRTRFGLPAAAPCPKGSFGTAVRHCD-EHRG---WL
1970 1980 1990 2000 2010
520 530 540 550 560 570
pF1KSD LPSFARCISHEYRYLYLSLREHLAKGQRMLAGEGMSQVVRSLQELLARRT--YYSGDLLF
:.. : : . : .. :.: ... : : :: . : . ...: :...:.
CCDS79 PPNLFNCTSITFSELK-GFAERLQRNESGL-DSGRSQQLALLLRNATQHTAGYFGSDVKV
2020 2030 2040 2050 2060 2070
580 590 600 610 620
pF1KSD SVDILRNVT--DTFKRATYVPSADDV---QRFFQVVSFMVDAENKEKWDDAQQVSPGSVH
. .. . .. .:. . ...:: . ...: : ..:. ::..:. ::. :..
CCDS79 AYQLATRLLAHESTQRGFGLSATQDVHFTENLLRVGSALLDTANKRHWELIQQTEGGTAW
2080 2090 2100 2110 2120 2130
630 640 650 660 670 680
pF1KSD LLRVVEDFIHLVGDALK-AFQSSL-IVTDNLVISIQREPVSAVSSDITFPMRGRRGMKDW
::. : . ... .. .. : . ::: :.:::. : . .. ... :: .
CCDS79 LLQHYEAYASALAQNMRHTYLSPFTIVTPNIVISVVRLDKGNFAGAKLPRYEALRGEQP-
2140 2150 2160 2170 2180 2190
690 700 710 720 730 740
pF1KSD VRHSEDRLFLPKEVLSLSSPG-KPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDE
: ..::. :. . : .:: .::... : . .:: : .
CCDS79 -PDLETTVILPESVFRETPPVVRPA------GPGEAQEPEELA-----RRQRRHPELSQG
2200 2210 2220 2230 2240
750 760 770 780
pF1KSD SSYFVIGAVLYRTLGLILP----PPRPPLAVTSR------VMTVTVRPPTQ--PPA--EP
. : ....::::. .:: : . : : .: :....:. . : : .:
CCDS79 EA--VASVIIYRTLAGLLPHNYDPDKRSLRVPKRPIINTPVVSISVHDDEELLPRALDKP
2250 2260 2270 2280 2290 2300
790 800 810 820 830 840
pF1KSD LITVELSYI-INGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTRCQCQHLSTFA
.::.. . . : : :. :..: ...: :....:... . .:. :::.:...::
CCDS79 -VTVQFRLLETEERTKPICVFWNHSILVSGTGGWSARGCEVVFRNESHVSCQCNHMTSFA
2310 2320 2330 2340 2350 2360
850 860 870 880 890 900
pF1KSD VLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSERSIILLNFCLS
:: . . . :. .. : . .:. ::: : .. .. :...:.. : :. .
CCDS79 VLMDVSRRENGEILPLKTLTYV-ALGVTLAALL-LTFFFLTLLRILRSNQHGIRRNLTAA
2370 2380 2390 2400 2410
910 920 930 940 950 960
pF1KSD ILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV--IGRMRTRL
. .....:.: ... .::. : .:::..: .: :.: :: . : :. . . :
CCDS79 LGLAQLVFLLGINQADLPFACTVIAILLHFLYLCTFSWALLEALHLYRALTEVRDVNTGP
2420 2430 2440 2450 2460 2470
970 980 990 1000 1010 1020
pF1KSD VRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAAVIVLVNML
.: .. ::::.::......::. .:::. ..::::. :...:.::.: : ....
CCDS79 MRFYYM-LGWGVPAFITGLAVGLD-PEGYGNPDFCWLSIYDTLIWSFAGPVAFAVSMSVF
2480 2490 2500 2510 2520 2530
1030 1040 1050 1060 1070 1080
pF1KSD IGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSASARNAMAS
. : : :: . . :: : :. .. ...
CCDS79 LYI-----LAARASCA----AQRQGFEK--------------------------KGPVSG
2540 2550 2560
1090 1100 1110 1120 1130 1140
pF1KSD LWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFLRREVQDVV
: : .:: ::. ::. :.:.. . ..::. :::. : :: : . : .::. ..
CCDS79 LQPSFAVLLLLSATWLLALLSV-NSDTLLFHYLFATCNCIQGPFIFLSYVVLSKEVRKAL
2570 2580 2590 2600 2610 2620
1150 1160 1170 1180 1190 1200
pF1KSD KCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPSTITGTLSR
: .: . ::: . . . :... : . :.. . .:.:
CCDS79 KL---ACS---RKPSPDPALTTKSTLTSSYNCPSPYA-DGRLYQPYGDS-----AGSLHS
2630 2640 2650 2660
1210 1220 1230 1240 1250 1260
pF1KSD LSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVYMCGEGGLR
: . .: : .: . : .:: : :: ..: . :: .
CCDS79 TSRSGKSQP-------------SYIPFLLREESALNPGQG---PPGLGDPGSLFLEGQDQ
2670 2680 2690 2700 2710
1270 1280 1290 1300 1310 1320
pF1KSD QLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGG-GGEDAPRARPEGTPRRAAKTVAHT
: : : ...: :::. .:. .. . .. : .. .
CCDS79 QHD--------PDTDSD------SDLSLEDDQSGSYASTHSSDSEEEEEEEEEEAAFPGE
2720 2730 2740 2750
1330 1340 1350 1360 1370 1380
pF1KSD EGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTMPRTVPGS
.:. :.: :: :. . : : . : :. ..: ::. . : . :
CCDS79 QGWDSLL---------GP--GAERLPLHSTPKDGGPGPG--KAPWPGDFGTTAKE----S
2760 2770 2780 2790 2800
1390 1400 1410 1420 1430 1440
pF1KSD TMKMGSLERKKLRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAKR---EKR
. . . :: . . :. : . : :. : . . .:. : :.
CCDS79 SGNGAPEERLRENGDALSREGSLGPLPGSSAQPHKGILKKKCLPTISEKSSLLRLPLEQC
2810 2820 2830 2840 2850 2860
1450 1460 1470 1480 1490 1500
pF1KSD WSVSSGGAA-ERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTLHRA
. : :..: : : : : : ::...
CCDS79 TGSSRGSSASEGSRGGPPPRPPPRQSLQEQLNGVMPIAMSIKAGTVDEDSSGSEFLFFNF
2870 2880 2890 2900 2910 2920
>>CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635 aa)
initn: 791 init1: 255 opt: 579 Z-score: 420.4 bits: 92.4 E(32554): 4.3e-17
Smith-Waterman score: 584; 31.6% identity (53.5% similar) in 361 aa overlap (296-620:4585-4941)
270 280 290 300 310 320
pF1KSD RYGEEPEEEPKVKTQWPRSADEPGLYMAQTVHGVWEEWGSWSLCSRSCGRGSRSRMRTCV
: : : ::. : :.::::::...: :::
CCDS30 LCNQPLPANGGKPCQGSDLEMRNCQNKPCPVDGSWSEWSLWEECTRSCGRGNQTRTRTCN
4560 4570 4580 4590 4600 4610
330 340 350 360 370 380
pF1KSD PP--QHGGKACEGPELQTKLCSMAACPVEGQWLEWGPWGPCSTSCANGTQQRSRKCSVAG
: ::::. ::: .. .:.. :::.: : : ::: :: ::..::: :.: :.
CCDS30 NPSVQHGGRPCEGNAVEIIMCNIRPCPVHGAWSAWQPWGTCSESCGKGTQTRARLCNNPP
4620 4630 4640 4650 4660 4670
390 400 410 420 430 440
pF1KSD PAW--ATCTGALTDTRECSNLECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQ
::. . : :: :. . :.. .:: .::. : .:: :: .: : ..: : :. :
CCDS30 PAFGGSYCDGAETQMQVCNERNCPI-HGKWATWASWSACSVSCGGGARQRTRGCSDPVPQ
4680 4690 4700 4710 4720 4730
450 460 470 480 490
pF1KSD --GYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAAGEII--YNKC---PPNA
: :::. . :. ::. . . . : ... : . : : ::.
CCDS30 YGGRKCEGSDVQSDFCNSDPCPTHGNW--SPWSGWGTCSRTCNGGQMRRYRTCDNPPPSN
4740 4750 4760 4770 4780 4790
500 510 520 530 540
pF1KSD SGSAS-------RRCLLSAQGV-AYWG-LPSFARCISH----EYRYLYLSLREHLAKGQR
.: : .:: . : . :: :...: . : : . .:: :
CCDS30 GGRACGGPDSQIQRCNTDMCPVDGSWGSWHSWSQCSASCGGGEKTRKRLCDHPVPVKGGR
4800 4810 4820 4830 4840 4850
550 560 570 580 590
pF1KSD MLAGEGMSQVVR-SLQEL-----LARRTYYSG--DLLFSVDILR-NVTDTFKRATYVPSA
:. .::.: ..: :: . .. :. :.. .: ..::. . : . :
CCDS30 PCPGD-TTQVTRCNVQACPGGPQRARGSVIGNINDVEFGIAFLNATITDSPNSDTRIIRA
4860 4870 4880 4890 4900 4910
600 610 620 630 640
pF1KSD D--DVQRFF-QVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSL
.: : . ... .:. : : :...
CCDS30 KITNVPRSLGSAMRKIVSILNPIYWTTAKEIGEAVNGFTLTNAVFKRETQVEFATGEILQ
4920 4930 4940 4950 4960 4970
650 660 670 680 690 700
pF1KSD IVTDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPAT
CCDS30 MSHIARGLDSDGSLLLDIVVSGYVLQLQSPAEVTVKDYTEDYIQTGPGQLYAYSTRLFTI
4980 4990 5000 5010 5020 5030
>>CCDS41352.1 ADGRL4 gene_id:64123|Hs108|chr1 (690 aa)
initn: 377 init1: 275 opt: 526 Z-score: 393.5 bits: 84.4 E(32554): 1.3e-15
Smith-Waterman score: 577; 30.8% identity (58.8% similar) in 415 aa overlap (746-1144:302-673)
720 730 740 750 760 770
pF1KSD PGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPP-----RPPLAV
: :: .: . ...: : . :
CCDS41 MNMDGDYINIFPKRKAAYDSNGNVAVAFVYYKSIGPLLSSSDNFLLKPQNYDNSEEEERV
280 290 300 310 320 330
780 790 800 810 820
pF1KSD TSRVMTVTVR--PPTQPPAEPLITVELSYIINGTTDPH---CASWDYSRADASSGDWDTE
: :..:.. ::: : :: ::. .:: . :: :.:: :. .:.:..:
CCDS41 ISSVISVSMSSNPPTLYELEK-ITFTLSH--RKVTDRYRSLCAFWNYS-PDTMNGSWSSE
340 350 360 370 380
830 840 850 860 870 880
pF1KSD NCQTLETQAAHTRCQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVS--CMALLTL
.:. .. .:: :.:.::. ::.: . .. .. . . .: .: :.:. .
CCDS41 GCELTYSNETHTSCRCNHLTHFAILMSSGPSIGIKDYNILTRITQLGIIISLICLAICIF
390 400 410 420 430 440
890 900 910 920 930 940
pF1KSD LAIYAAFWRF--IKSERSIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFL
.:: : :.: :. : :.: :.. .....::: . .: :.. :..::.:::
CCDS41 -----TFWFFSEIQSTRTTIHKNLCCSLFLAELVFLVGINTNTNKLFCSIIAGLLHYFFL
450 460 470 480 490 500
950 960 970 980 990 1000
pF1KSD SSFCWVLTEAWQSYLAVIGRMRTR-LVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSY
..: :. :. . :: :.: . .. ...: : .:. ::.::. :... . :::..
CCDS41 AAFAWMCIEGIHLYLIVVGVIYNKGFLHKNFYIFGYLSPAVVVGFSAALGY-RYYGTTKV
510 520 530 540 550 560
1010 1020 1030 1040 1050
pF1KSD CWLSLEGGLLYAFVGPAAVIVLVNML-IGIIVFNKLMARDGISDKSKKQRAGSERCPWAS
:::: :......:.::: .:.:::.: .:.:.. : .. :: . : .:
CCDS41 CWLSTENNFIWSFIGPACLIILVNLLAFGVIIY-----------KVFRHTAGLK--PEVS
570 580 590 600
1060 1070 1080 1090 1100 1110
pF1KSD LLLPCSACGAVPSPLLSSASARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQAL
. .: ::.:.: :. ::. ::. .:: .. . ::. :
CCDS41 CFENIRSC------------ARGALALLF-------LLGTTWIFGVLHVV-HASVVTAYL
610 620 630 640
1120 1130 1140 1150 1160 1170
pF1KSD FAVFNSAQGFVITAVHCFLRREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKD
:.: :. ::. : : : :..:.
CCDS41 FTVSNAFQGMFIFLFLCVLSRKIQEEYYRLFKNVPCCFGCLR
650 660 670 680 690
>>CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074 aa)
initn: 394 init1: 223 opt: 524 Z-score: 389.5 bits: 84.3 E(32554): 2.2e-15
Smith-Waterman score: 531; 29.7% identity (51.7% similar) in 333 aa overlap (149-455:622-940)
120 130 140 150 160 170
pF1KSD EEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEVLLINN
: . : .. :. . :. . :.
CCDS38 CSRNGGWTPWTSWSPCSTTCGIGFQVRQRSCSNPTPRHGGRVCVGQNREERYCNEHLLCP
600 610 620 630 640 650
180 190 200 210 220 230
pF1KSD NNSSQFTCGVLCRWSEECG---RAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAHTL
. : : . .:: .: : : . : .: : .. .:.: : .:
CCDS38 PHMFWTGWGPWERCTAQCGGGIQARRRIC---ENGPDCAGCNVEYQSCNTNPCPELKKT-
660 670 680 690 700
240 250 260 270 280
pF1KSD SNALVPGGPAPPAEADLHSGSSNDLF--TTEMRYGEEPEEE---PKVKTQWPRS------
.: : :.. . ..: .. : : . : .. : ... .. :
CCDS38 ----TPWTPWTPVNISDNGGHYEQRFRYTCKARLADPNLLEVGRQRIEMRYCSSDGTSGC
710 720 730 740 750 760
290 300 310 320 330
pF1KSD -AD-------EPGLYMAQTVHGVWEEWGSWSLCSRSCGRGSRSRMRTCV-P-PQHGGKAC
.: . : : :.::.:.: : ::: :::.:.:: :.: :.: : :..:: :
CCDS38 STDGLSGDFLRAGRYSAHTVNGAWSAWTSWSQCSRDCSRGIRNRKRVCNNPEPKYGGMPC
770 780 790 800 810 820
340 350 360 370 380 390
pF1KSD EGPELQTKLCSMAACPVEGQWLEWGPWGPCSTSCANGTQQRSRKCSVAGPAWA--TCTGA
:: :. . :.. :::.: : :.:: ::..:..: .:.:.:: .::.. : :
CCDS38 LGPSLEYQECNILPCPVDGVWSCWSPWTKCSATCGGGHYMRTRSCSNPAPAYGGDICLGL
830 840 850 860 870 880
400 410 420 430 440 450
pF1KSD LTDTRECSNLECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEV
:. :.. :: . :. :. :: : .: : : :.: .: : :. :
CCDS38 HTEEALCNTQPCPES---WSEWSDWSECEA---SGVQVRARQCILLFPMGSQCSGNTTES
890 900 910 920 930
460 470 480 490 500 510
pF1KSD KPCSEKRCPAFHEMCRDEYVMLMTWKKAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYW
.::
CCDS38 RPCVFDSNFIPEVSVARSSSVEEKRCGEFNMFHMIAVGLSSSILGCLLTLLVYTYCQRYQ
940 950 960 970 980 990
>>CCDS82926.1 ADGRL3 gene_id:23284|Hs108|chr4 (1240 aa)
initn: 542 init1: 227 opt: 521 Z-score: 386.5 bits: 83.9 E(32554): 3.3e-15
Smith-Waterman score: 690; 24.9% identity (55.6% similar) in 754 aa overlap (454-1166:485-1156)
430 440 450 460 470 480
pF1KSD CDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAAG
: . .. ::..: :. . . : :. :
CCDS82 TTPSVSGRRNRSTSTPSPAVEVLDDMTTHLPSASSQIPALEESCEAVEAREIMWFKTRQG
460 470 480 490 500 510
490 500 510 520 530 540
pF1KSD EIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAKGQRML
.: . :: .. : .. :: . .:. :... : : .:.. :..
CCDS82 QIAKQPCPAGTIGVSTYLCL-APDGIWDPQGPDLSNCSS--------PWVNHIT--QKLK
520 530 540 550 560
550 560 570 580
pF1KSD AGEGMSQVVRSLQELLARRTYYSGDLLFSV----------DI-LRNVT----DTFKRATY
.:: ....: : : .: .::. .:: :. :::.: :. :.
CCDS82 SGETAANIARELAEQ-TRNHLNAGDITYSVRAMDQLVGLLDVQLRNLTPGGKDSAARSLN
570 580 590 600 610 620
590 600 610 620 630
pF1KSD VPSADD------VQRFFQVVSFMVDAENKEKWDD---AQQVSPGSVHLLRVVEDFIHLVG
. . :: . ..:. ... . . : : ..:. ... ::..::. ...
CCDS82 KLQKRERSCRAYVQAMVETVNNLLQPQALNAWRDLTTSDQLRAATM-LLHTVEESAFVLA
630 640 650 660 670 680
640 650 660 670 680 690
pF1KSD DALKAFQSSLIV--TDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKE
: : ...... :::. . . : . . :. :: .:
CCDS82 DNL--LKTDIVRENTDNIKLEVARLSTEGNLEDLKFPENMGHG----------------S
690 700 710 720
700 710 720 730 740 750
pF1KSD VLSLSSPGKPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGA-VLYRT
...::. : : :. : .. .. : : :.. . .:. .: .
CCDS82 TIQLSA----NTLKQNGRNGEIRVAFVL-------YNNLGPYLSTENASMKLGTEALSTN
730 740 750 760 770
760 770 780 790 800 810
pF1KSD LGLILPPPRPPLAVTSRVMTVTVRPPTQPPAEPLI-TVELSYIINGTTDPHCASWDYSRA
..:. : :.... . . :.:.. ::. . . .:.:. :.::.
CCDS82 HSVIVNSPVITAAINKEFSNKVYL------ADPVVFTVKHIKQSEENFNPNCSFWSYSKR
780 790 800 810 820
820 830 840 850 860
pF1KSD DASSGDWDTENCQTLETQAAHTRCQCQHLSTFAVL--------AQPPKDLTLELAGSPSV
. : :.:..:. : :. .:: :.:.::..:::: .. .:: :.. ..
CCDS82 TMT-GYWSTQGCRLLTTNKTHTTCSCNHLTNFAVLMAHVEVKHSDAVHDLLLDVITWVGI
830 840 850 860 870 880
870 880 890 900 910 920
pF1KSD PLVIGCAVSCMALLTLLAIYAAFWRFIKSERSIILLNFCLSILASNILILVGQSRVLSKG
: . : . :. . :.: ..:.:. : :.:.:......:.:.: .:. .
CCDS82 LLSLVCLLICIFTFC-------FFRGLQSDRNTIHKNLCISLFVAELLFLIGINRTDQPI
890 900 910 920 930
930 940 950 960 970 980
pF1KSD VCTMTAAFLHFFFLSSFCWVLTEAWQSYLAVIGRMRTRLVRKRFLCL-GWGLPALVVAVS
.:.. ::.::::::..: :.. :. : :. .. .... :.... : :.:.:::.::::
CCDS82 ACAVFAALLHFFFLAAFTWMFLEGVQLYIMLVEVFESEHSRRKYFYLVGYGMPALIVAVS
940 950 960 970 980 990
990 1000 1010 1020 1030 1040
pF1KSD VGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAAVIVLVNMLIGIIVFNKLMARDGISDKSK
.. ..:::.. ::: :. ....:.:::..:...:... :.. :.. . .:
CCDS82 AAVDY-RSYGTDKVCWLRLDTYFIWSFIGPATLIIMLNVIFLGIALYKMFHHTAI-----
1000 1010 1020 1030 1040 1050
1050 1060 1070 1080 1090 1100
pF1KSD KQRAGSERCPWASLLLPCSACGAVPSPLLSSASARNAMASLW--SSCVVLPLLALTWMSA
: : :.: .. . : . : : .. ..: ::.::: .
CCDS82 --------------LKPESGC----LDNINYEDNRPFIKS-WVIGAIALLCLLGLTWAFG
1060 1070 1080 1090
1110 1120 1130 1140 1150 1160
pF1KSD VLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFLRREV-QDVVKC-QMGVCRADESEDSP
.. . .. .:.. ::..::: ::. : :: :...: .. :: . : . .:.:
CCDS82 LMYI-NESTVIMAYLFTIFNSLQGMFIFIFHCVLQKKVRKEYGKCLRTHCCSGKSTESSI
1100 1110 1120 1130 1140 1150
1170 1180 1190 1200 1210 1220
pF1KSD DSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPSTITGTLSRLSLDEDEEPKSCLVGP
: :
CCDS82 GSGKTSGSRTPGRYSTGSQSRIRRMWNDTVRKQSESSFITGDINSSASLNREPYRETSMG
1160 1170 1180 1190 1200 1210
>>CCDS54768.1 ADGRL3 gene_id:23284|Hs108|chr4 (1469 aa)
initn: 552 init1: 227 opt: 521 Z-score: 385.6 bits: 84.0 E(32554): 3.7e-15
Smith-Waterman score: 690; 24.9% identity (55.6% similar) in 754 aa overlap (454-1166:485-1156)
430 440 450 460 470 480
pF1KSD CDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAAG
: . .. ::..: :. . . : :. :
CCDS54 TTPSVSGRRNRSTSTPSPAVEVLDDMTTHLPSASSQIPALEESCEAVEAREIMWFKTRQG
460 470 480 490 500 510
490 500 510 520 530 540
pF1KSD EIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAKGQRML
.: . :: .. : .. :: . .:. :... : : .:.. :..
CCDS54 QIAKQPCPAGTIGVSTYLCL-APDGIWDPQGPDLSNCSS--------PWVNHIT--QKLK
520 530 540 550 560
550 560 570 580
pF1KSD AGEGMSQVVRSLQELLARRTYYSGDLLFSV----------DI-LRNVT----DTFKRATY
.:: ....: : : .: .::. .:: :. :::.: :. :.
CCDS54 SGETAANIARELAEQ-TRNHLNAGDITYSVRAMDQLVGLLDVQLRNLTPGGKDSAARSLN
570 580 590 600 610 620
590 600 610 620 630
pF1KSD VPSADD------VQRFFQVVSFMVDAENKEKWDD---AQQVSPGSVHLLRVVEDFIHLVG
. . :: . ..:. ... . . : : ..:. ... ::..::. ...
CCDS54 KLQKRERSCRAYVQAMVETVNNLLQPQALNAWRDLTTSDQLRAATM-LLHTVEESAFVLA
630 640 650 660 670 680
640 650 660 670 680 690
pF1KSD DALKAFQSSLIV--TDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKE
: : ...... :::. . . : . . :. :: .:
CCDS54 DNL--LKTDIVRENTDNIKLEVARLSTEGNLEDLKFPENMGHG----------------S
690 700 710 720
700 710 720 730 740 750
pF1KSD VLSLSSPGKPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGA-VLYRT
...::. : : :. : .. .. : : :.. . .:. .: .
CCDS54 TIQLSA----NTLKQNGRNGEIRVAFVL-------YNNLGPYLSTENASMKLGTEALSTN
730 740 750 760 770
760 770 780 790 800 810
pF1KSD LGLILPPPRPPLAVTSRVMTVTVRPPTQPPAEPLI-TVELSYIINGTTDPHCASWDYSRA
..:. : :.... . . :.:.. ::. . . .:.:. :.::.
CCDS54 HSVIVNSPVITAAINKEFSNKVYL------ADPVVFTVKHIKQSEENFNPNCSFWSYSKR
780 790 800 810 820
820 830 840 850 860
pF1KSD DASSGDWDTENCQTLETQAAHTRCQCQHLSTFAVL--------AQPPKDLTLELAGSPSV
. : :.:..:. : :. .:: :.:.::..:::: .. .:: :.. ..
CCDS54 TMT-GYWSTQGCRLLTTNKTHTTCSCNHLTNFAVLMAHVEVKHSDAVHDLLLDVITWVGI
830 840 850 860 870 880
870 880 890 900 910 920
pF1KSD PLVIGCAVSCMALLTLLAIYAAFWRFIKSERSIILLNFCLSILASNILILVGQSRVLSKG
: . : . :. . :.: ..:.:. : :.:.:......:.:.: .:. .
CCDS54 LLSLVCLLICIFTFC-------FFRGLQSDRNTIHKNLCISLFVAELLFLIGINRTDQPI
890 900 910 920 930
930 940 950 960 970 980
pF1KSD VCTMTAAFLHFFFLSSFCWVLTEAWQSYLAVIGRMRTRLVRKRFLCL-GWGLPALVVAVS
.:.. ::.::::::..: :.. :. : :. .. .... :.... : :.:.:::.::::
CCDS54 ACAVFAALLHFFFLAAFTWMFLEGVQLYIMLVEVFESEHSRRKYFYLVGYGMPALIVAVS
940 950 960 970 980 990
990 1000 1010 1020 1030 1040
pF1KSD VGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAAVIVLVNMLIGIIVFNKLMARDGISDKSK
.. ..:::.. ::: :. ....:.:::..:...:... :.. :.. . .:
CCDS54 AAVDY-RSYGTDKVCWLRLDTYFIWSFIGPATLIIMLNVIFLGIALYKMFHHTAI-----
1000 1010 1020 1030 1040 1050
1050 1060 1070 1080 1090 1100
pF1KSD KQRAGSERCPWASLLLPCSACGAVPSPLLSSASARNAMASLW--SSCVVLPLLALTWMSA
: : :.: .. . : . : : .. ..: ::.::: .
CCDS54 --------------LKPESGC----LDNINYEDNRPFIKS-WVIGAIALLCLLGLTWAFG
1060 1070 1080 1090
1110 1120 1130 1140 1150 1160
pF1KSD VLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFLRREV-QDVVKC-QMGVCRADESEDSP
.. . .. .:.. ::..::: ::. : :: :...: .. :: . : . .:.:
CCDS54 LMYI-NESTVIMAYLFTIFNSLQGMFIFIFHCVLQKKVRKEYGKCLRTHCCSGKSTESSI
1100 1110 1120 1130 1140 1150
1170 1180 1190 1200 1210 1220
pF1KSD DSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPSTITGTLSRLSLDEDEEPKSCLVGP
: :
CCDS54 GSGKTSGSRTPGRYSTGSQSRIRRMWNDTVRKQSESSFITGDINSSASLNREGLLNNARD
1160 1170 1180 1190 1200 1210
1518 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 00:16:59 2016 done: Fri Nov 4 00:17:00 2016
Total Scan time: 5.510 Total Display time: 0.620
Function used was FASTA [36.3.4 Apr, 2011]