FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDB1489, 1518 aa 1>>>pF1KSDB1489 1518 - 1518 aa - 1518 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.7306+/-0.000858; mu= 14.9594+/- 0.052 mean_var=186.3844+/-37.544, 0's: 0 Z-trim(114.1): 119 B-trim: 136 in 1/54 Lambda= 0.093944 statistics sampled from 14598 (14723) to 14598 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.756), E-opt: 0.2 (0.452), width: 16 Scan time: 5.510 The best scores are: opt bits E(32554) CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584) 8455 1159.4 0 CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551) 5255 725.6 2.8e-208 CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522) 2386 336.8 3.1e-91 CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584) 1425 206.6 5.2e-52 CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923) 612 96.6 1.2e-18 CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635) 579 92.4 4.3e-17 CCDS41352.1 ADGRL4 gene_id:64123|Hs108|chr1 ( 690) 526 84.4 1.3e-15 CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074) 524 84.3 2.2e-15 CCDS82926.1 ADGRL3 gene_id:23284|Hs108|chr4 (1240) 521 83.9 3.3e-15 CCDS54768.1 ADGRL3 gene_id:23284|Hs108|chr4 (1469) 521 84.0 3.7e-15 CCDS32931.1 ADGRE5 gene_id:976|Hs108|chr19 ( 742) 491 79.7 3.8e-14 CCDS32930.1 ADGRE5 gene_id:976|Hs108|chr19 ( 786) 491 79.7 4e-14 CCDS32929.1 ADGRE5 gene_id:976|Hs108|chr19 ( 835) 491 79.7 4.1e-14 CCDS35491.1 SEMA5B gene_id:54437|Hs108|chr3 (1151) 492 80.0 4.8e-14 CCDS58848.1 SEMA5B gene_id:54437|Hs108|chr3 (1205) 492 80.0 4.9e-14 CCDS2775.1 CELSR3 gene_id:1951|Hs108|chr3 (3312) 498 81.2 5.8e-14 CCDS58645.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 867) 468 76.6 3.7e-13 CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 471 77.5 6.9e-13 CCDS76174.1 ADGRL2 gene_id:23266|Hs108|chr1 (1123) 461 75.8 8.6e-13 CCDS72811.1 ADGRL2 gene_id:23266|Hs108|chr1 (1177) 461 75.8 8.9e-13 CCDS689.1 ADGRL2 gene_id:23266|Hs108|chr1 (1403) 461 75.9 1e-12 CCDS81345.1 ADGRL2 gene_id:23266|Hs108|chr1 (1416) 461 75.9 1e-12 CCDS9272.1 ADGRD1 gene_id:283383|Hs108|chr12 ( 874) 452 74.5 1.7e-12 CCDS81753.1 ADGRD1 gene_id:283383|Hs108|chr12 ( 906) 452 74.5 1.7e-12 CCDS12307.1 ADGRL1 gene_id:22859|Hs108|chr19 (1469) 454 74.9 2e-12 CCDS32928.1 ADGRL1 gene_id:22859|Hs108|chr19 (1474) 454 74.9 2e-12 CCDS58643.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 709) 422 70.3 2.4e-11 CCDS35409.1 ADGRG4 gene_id:139378|Hs108|chrX (3080) 433 72.4 2.5e-11 CCDS58646.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 745) 422 70.3 2.5e-11 CCDS12175.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 886) 422 70.4 2.8e-11 CCDS74296.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 526) 415 69.2 3.7e-11 CCDS74297.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 600) 415 69.3 4.1e-11 CCDS12315.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 652) 415 69.3 4.4e-11 CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170) 414 69.4 7.3e-11 >>CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584 aa) initn: 7686 init1: 7686 opt: 8455 Z-score: 6196.6 bits: 1159.4 E(32554): 0 Smith-Waterman score: 10216; 96.4% identity (96.4% similar) in 1550 aa overlap (24-1518:36-1584) 10 20 30 40 50 pF1KSD MTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC :::::::::::::::::::::::::::::: CCDS72 WMGKGHRMTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KSD LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH 190 200 210 220 230 240 240 250 260 270 280 290 pF1KSD TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA 250 260 270 280 290 300 pF1KSD QT-------------------------------------------------------VHG :: ::: CCDS72 QTGDPAAEEWSPWSVCSLTCGQGLQVRTRSCVSSPYGTLCSGPLRETRPCNNSATCPVHG 310 320 330 340 350 360 300 310 320 330 340 350 pF1KSD VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW 370 380 390 400 410 420 360 370 380 390 400 410 pF1KSD GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS 430 440 450 460 470 480 420 430 440 450 460 470 pF1KSD LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK 490 500 510 520 530 540 480 490 500 510 520 530 pF1KSD KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK 550 560 570 580 590 600 540 550 560 570 580 590 pF1KSD GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF 610 620 630 640 650 660 600 610 620 630 640 650 pF1KSD FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS 670 680 690 700 710 720 660 670 680 690 700 710 pF1KSD IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR 730 740 750 760 770 780 720 730 740 750 760 770 pF1KSD GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT 790 800 810 820 830 840 780 790 800 810 820 830 pF1KSD VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR 850 860 870 880 890 900 840 850 860 870 880 890 pF1KSD CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER 910 920 930 940 950 960 900 910 920 930 940 950 pF1KSD SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV 970 980 990 1000 1010 1020 960 970 980 990 1000 1010 pF1KSD IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA 1030 1040 1050 1060 1070 1080 1020 1030 1040 1050 1060 1070 pF1KSD VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSA 1090 1100 1110 1120 1130 1140 1080 1090 1100 1110 1120 1130 pF1KSD SARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL 1150 1160 1170 1180 1190 1200 1140 1150 1160 1170 1180 1190 pF1KSD RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS 1210 1220 1230 1240 1250 1260 1200 1210 1220 1230 1240 1250 pF1KSD TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY 1270 1280 1290 1300 1310 1320 1260 1270 1280 1290 1300 1310 pF1KSD MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA 1330 1340 1350 1360 1370 1380 1320 1330 1340 1350 1360 1370 pF1KSD AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM 1390 1400 1410 1420 1430 1440 1380 1390 1400 1410 1420 1430 pF1KSD PRTVPGSTMKMGSLERKKLRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAK ::::::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS72 PRTVPGSTMKMGSLERKKLRYSDLDFE-VMHTRKRHSELYHELNQKFHTFDRYRSQSTAK 1450 1460 1470 1480 1490 1500 1440 1450 1460 1470 1480 1490 pF1KSD REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL 1510 1520 1530 1540 1550 1560 1500 1510 pF1KSD HRAAAWEPTEPPDGDFQTEV :::::::::::::::::::: CCDS72 HRAAAWEPTEPPDGDFQTEV 1570 1580 >>CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551 aa) initn: 6049 init1: 5247 opt: 5255 Z-score: 3852.8 bits: 725.6 E(32554): 2.8e-208 Smith-Waterman score: 9909; 94.3% identity (94.3% similar) in 1550 aa overlap (24-1518:36-1551) 10 20 30 40 50 pF1KSD MTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC :::::::::::::::::::::::::::::: CCDS72 WMGKGHRMTPACPLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGC 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SWTLENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GRPEEEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KSD LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LLINNNNSSQFTCGVLCRWSEECGRAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH 190 200 210 220 230 240 240 250 260 270 280 290 pF1KSD TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TLSNALVPGGPAPPAEADLHSGSSNDLFTTEMRYGEEPEEEPKVKTQWPRSADEPGLYMA 250 260 270 280 290 300 pF1KSD QT-------------------------------------------------------VHG :: ::: CCDS72 QTGDPAAEEWSPWSVCSLTCGQGLQVRTRSCVSSPYGTLCSGPLRETRPCNNSATCPVHG 310 320 330 340 350 360 300 310 320 330 340 350 pF1KSD VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACPVEGQWLEW 370 380 390 400 410 420 360 370 380 390 400 410 pF1KSD GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNLECPATDSKWGPWNAWS 430 440 450 460 470 480 420 430 440 450 460 470 pF1KSD LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWK 490 500 510 520 530 540 480 490 500 510 520 530 pF1KSD KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAK 550 560 570 580 590 600 540 550 560 570 580 590 pF1KSD GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRF 610 620 630 640 650 660 600 610 620 630 640 650 pF1KSD FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 FQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVIS 670 680 690 700 710 720 660 670 680 690 700 710 pF1KSD IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 IQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGR 730 740 750 760 770 780 720 730 740 750 760 770 pF1KSD GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 GRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVT 790 800 810 820 830 840 780 790 800 810 820 830 pF1KSD VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTR 850 860 870 880 890 900 840 850 860 870 880 890 pF1KSD CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 CQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSER 910 920 930 940 950 960 900 910 920 930 940 950 pF1KSD SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 SIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV 970 980 990 1000 1010 1020 960 970 980 990 1000 1010 pF1KSD IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 IGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAA 1030 1040 1050 1060 1070 1080 1020 1030 1040 1050 1060 1070 pF1KSD VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSA ::::::::::::::::::::::::::::::::: CCDS72 VIVLVNMLIGIIVFNKLMARDGISDKSKKQRAG--------------------------- 1090 1100 1110 1080 1090 1100 1110 1120 1130 pF1KSD SARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 ------ASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFL 1120 1130 1140 1150 1160 1170 1140 1150 1160 1170 1180 1190 pF1KSD RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 RREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPS 1180 1190 1200 1210 1220 1230 1200 1210 1220 1230 1240 1250 pF1KSD TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVY 1240 1250 1260 1270 1280 1290 1260 1270 1280 1290 1300 1310 pF1KSD MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MCGEGGLRQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGGGEDAPRARPEGTPRRA 1300 1310 1320 1330 1340 1350 1320 1330 1340 1350 1360 1370 pF1KSD AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 AKTVAHTEGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTM 1360 1370 1380 1390 1400 1410 1380 1390 1400 1410 1420 1430 pF1KSD PRTVPGSTMKMGSLERKKLRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAK ::::::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS72 PRTVPGSTMKMGSLERKKLRYSDLDFE-VMHTRKRHSELYHELNQKFHTFDRYRSQSTAK 1420 1430 1440 1450 1460 1470 1440 1450 1460 1470 1480 1490 pF1KSD REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 REKRWSVSSGGAAERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTL 1480 1490 1500 1510 1520 1530 1500 1510 pF1KSD HRAAAWEPTEPPDGDFQTEV :::::::::::::::::::: CCDS72 HRAAAWEPTEPPDGDFQTEV 1540 1550 >>CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522 aa) initn: 4306 init1: 1978 opt: 2386 Z-score: 1751.4 bits: 336.8 E(32554): 3.1e-91 Smith-Waterman score: 4604; 45.5% identity (68.5% similar) in 1620 aa overlap (8-1518:7-1522) 10 20 30 40 50 pF1KSD MTPACPLLLSVILSLRLATAFDPAPSA---CSALASGVLYGAFSLQDLFPTIASGCSWTL :: :.: : . : . ::.:..::.::..:....:: ..:.::: CCDS49 MKAVRNLLIYIFSTYLLVMFGFNAAQDFWCSTLVKGVIYGSYSVSEMFPKNFTNCTWTL 10 20 30 40 50 60 70 80 90 100 110 pF1KSD ENPDPTKYSLYLRFNRQEQVCAHFAPRLLPLDHYLVNFTCLRPSPEEAVAQAESEVGRPE :::::::::.::.:.... :..:. .::. : :. ... : . CCDS49 ENPDPTKYSIYLKFSKKDLSCSNFSLLAYQFDHF---------SHEKI-----KDLLRKN 60 70 80 90 100 120 130 140 150 160 170 pF1KSD EEEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFR-FVEVLLI . . ..::.... :.::..::::.:. . :.. : : . . : : :.. CCDS49 H------SIMQLCNSKNAFVFLQYDKNFIQI-RRVFPTNFPGLQKKGEEDQKSFFEFLVL 110 120 130 140 150 180 190 200 210 220 230 pF1KSD NNNNSSQFTCGVLCRWSEECGRAA-GR--ACGFAQPGCSCPGEAGAGSTTTTSPGPPAAH :. . ::: : ::: : : : .. :: .::. :.:: . : . : CCDS49 NKVSPSQFGCHVLCTWLESCLKSENGRTESCGIMYTKCTCPQHLGEWGIDDQS-----LI 160 170 180 190 200 210 240 250 260 270 280 pF1KSD TLSNALVPGGPAPPA--EADLHSGSSNDLFTTEMRYGEEPEEE------PKVKTQWPRSA :.:...: . . .:.. . .: : : . . :.:: .:.: :::. CCDS49 LLNNVVLPLNEQTEGCLTQELQTTQVCNL-TREAK--RPPKEEFGMMGDHTIKSQRPRSV 220 230 240 250 260 270 290 pF1KSD DEPGL---------YMAQT----------------------------------------- : . .:::: CCDS49 HEKRVPQEQADAAKFMAQTGESGVEEWSQWSTCSVTCGQGSQVRTRTCVSPYGTHCSGPL 280 290 300 310 320 330 300 310 320 330 340 pF1KSD -------------VHGVWEEWGSWSLCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTK ::::::::. ::::: .::::.:.: :.:.:::.::. ::::: . : CCDS49 RESRVCNNTALCPVHGVWEEWSPWSLCSFTCGRGQRTRTRSCTPPQYGGRPCEGPETHHK 340 350 360 370 380 390 350 360 370 380 390 400 pF1KSD LCSMAACPVEGQWLEWGPWGPCSTSCANGTQQRSRKCSVAGPAWATCTGALTDTRECSNL :..: :::.::: ::. :. ::..:.::::::::.:..:. . . : : ...::: : CCDS49 PCNIALCPVDGQWQEWSSWSQCSVTCSNGTQQRSRQCTAAAHGGSECRGPWAESRECYNP 400 410 420 430 440 450 410 420 430 440 450 460 pF1KSD ECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPA :: : ...:. :. :: :::.:: ::.::.: ::.. : ::::::::. :.:.:::: CCDS49 ECTA-NGQWNQWGHWSGCSKSCDGGWERRIRTCQGAVITGQQCEGTGEEVRRCNEQRCPA 460 470 480 490 500 470 480 490 500 510 520 pF1KSD FHEMCRDEYVMLMTWKKAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCIS .:.: ..:.: :.::.. ::.. .:.:: ::.:..:::: :: .:::.: :::::::: CCDS49 PYEICPEDYLMSMVWKRTPAGDLAFNQCPLNATGTTSRRCSLSLHGVAFWEQPSFARCIS 510 520 530 540 550 560 530 540 550 560 570 580 pF1KSD HEYRYLYLSLREHLAKGQRMLAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDT .:::.: :..::::::::::::.:::::...: .: :...:.::::.::.:::::::: CCDS49 NEYRHLQHSIKEHLAKGQRMLAGDGMSQVTKTLLDLTQRKNFYAGDLLMSVEILRNVTDT 570 580 590 600 610 620 590 600 610 620 630 640 pF1KSD FKRATYVPSADDVQRFFQVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDAL ::::.:.:..: :: :::.:: ..: ::::::.::::. :::..:..:.:::::.:: .. CCDS49 FKRASYIPASDGVQNFFQIVSNLLDEENKEKWEDAQQIYPGSIELMQVIEDFIHIVGMGM 630 640 650 660 670 680 650 660 670 680 690 700 pF1KSD KAFQSSLIVTDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLS ::.: ..: :.: :::. :...: .::.:::.::.:: ::.:.::::. .:: ... CCDS49 MDFQNSYLMTGNVVASIQKLPAASVLTDINFPMKGRKGMVDWARNSEDRVVIPKSIFT-- 690 700 710 720 730 740 710 720 730 740 750 760 pF1KSD SPGKPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILP :..: . :::: ::.:::::..: :::: CCDS49 ----PVSS----------------------------KELDESSVFVLGAVLYKNLDLILP 750 760 770 770 780 790 800 810 820 pF1KSD PPRPPLAVTSRVMTVTVRPPTQPPAEPLITVELSYIINGTTDPHCASWDYSRADASSGDW : ...:....::.:: . .. .. .::... ::: .:.:. :: :... : : : CCDS49 TLRNYTVINSKIIVVTIRPEPKT-TDSFLEIELAHLANGTLNPYCVLWDDSKTNESLGTW 780 790 800 810 820 830 830 840 850 860 870 880 pF1KSD DTENCQTLETQAAHTRCQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLT .:..:.:. :.:.::.: :..:::::.::: :... .: .:.::: :..: ..::.::.: CCDS49 STQGCKTVLTDASHTKCLCDRLSTFAILAQQPREIIMESSGTPSVTLIVGSGLSCLALIT 840 850 860 870 880 890 890 900 910 920 930 940 pF1KSD LLAIYAAFWRFIKSERSIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLS : ..:::.::.:.:::::::.::::::..:::::::::... .:..:: :.::::::::. CCDS49 LAVVYAALWRYIRSERSIILINFCLSIISSNILILVGQTQTHNKSICTTTTAFLHFFFLA 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KSD SFCWVLTEAWQSYLAVIGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCW :::::::::::::.:: :..::::.:::::::::::::::::.::::::::::::. ::: CCDS49 SFCWVLTEAWQSYMAVTGKIRTRLIRKRFLCLGWGLPALVVATSVGFTRTKGYGTDHYCW 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 1060 pF1KSD LSLEGGLLYAFVGPAAVIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLL ::::::::::::::::..:::::.:::.:::::..:::: ::. :.:::. : ..: : CCDS49 LSLEGGLLYAFVGPAAAVVLVNMVIGILVFNKLVSRDGILDKKLKHRAGQMSEPHSGLTL 1020 1030 1040 1050 1060 1070 1070 1080 1090 1100 1110 1120 pF1KSD PCSACGAVPSPLLSSASARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAV :. ::.: . ::...: :::::::::::::::::::::::::::::.::.::: :::: CCDS49 KCAKCGVVSTTALSATTASNAMASLWSSCVVLPLLALTWMSAVLAMTDKRSILFQILFAV 1080 1090 1100 1110 1120 1130 1130 1140 1150 1160 1170 1180 pF1KSD FNSAQGFVITAVHCFLRREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDL :.: :::::. :::.:::::::. .:.. :. . :: .: ::. ::..:::::::. CCDS49 FDSLQGFVIVMVHCILRREVQDAFRCRLRNCQDPINADSSSSFPNGHAQIMTDFEKDVDI 1140 1150 1160 1170 1180 1190 1190 1200 1210 1220 1230 1240 pF1KSD ACQTVLFKEVNTCNPSTITGTLSRLSLDEDEEPKSCLVGPEGSLSFSPLPGNIL--VPMA ::..:: :... : .::::::::.::..::: :. ..::: ::.: ::::.. : . CCDS49 ACRSVLHKDIGPCRAATITGTLSRISLNDDEEEKG--TNPEG-LSYSTLPGNVISKVIIQ 1200 1210 1220 1230 1240 1250 1250 1260 1270 1280 pF1KSD ASPGLGEPPPPQE-ANP------------VYMCGEGGLRQLDLTWLRPTEPGSEGDYMVL :: : .: .:: ::.: . .:: :. ..: : :.::.:. CCDS49 QPTGLHMPMSMNELSNPCLKKENSELRRTVYLCTDDNLRGADMDIVHPQERMMESDYIVM 1260 1270 1280 1290 1300 1310 1290 1300 1310 1320 1330 1340 pF1KSD PRRTLSLQPGGGGGGGEDAPRARPEGTPRRAAKTVAHTEGYPSFLS----VDHSGLGLGP :: ... ::. :. : :. . . : . : : .:. ...: CCDS49 PRSSVNNQPSMK---EESKMNIGMETLPH---ERLLHYKVNPEFNMNPPVMDQFNMNLEQ 1320 1330 1340 1350 1360 1350 1360 1370 1380 1390 1400 pF1KSD AYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTMPRTVPGSTMKMGSLERKKLRYSDLD . .. .. :.: : . . . . :. :::..:.::::.: :::::: CCDS49 HLAPQEHMQNLPFEPR--TAVKNFMASELDDNAGLSRSETGSTISMSSLERRKSRYSDLD 1370 1380 1390 1400 1410 1420 1410 1420 1430 1440 1450 1460 pF1KSD FEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAKREKRWSVSSGGAAERSVCTDKPSPG ::::::::::: ::..::::::.:.::.:. . . .. : .:.:. CCDS49 FEKVMHTRKRHMELFQELNQKFQTLDRFRD-----------IPNTSSME------NPAPN 1430 1440 1450 1460 1470 1480 1490 1500 1510 pF1KSD ERPSLSQHRRHQSWSTFKS-------MTLGSLPPKPRERLTLHRAAAWE-----PTEPPD . : :.:::. :.. : . .. : : : : :: : . . CCDS49 KNP----------WDTFKNPSEYPHYTTINVLDTEAKDALEL-RPAEWEKCLNLPLDVQE 1470 1480 1490 1500 1510 pF1KSD GDFQTEV ::::::: CCDS49 GDFQTEV 1520 >>CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584 aa) initn: 2609 init1: 1107 opt: 1425 Z-score: 1047.3 bits: 206.6 E(32554): 5.2e-52 Smith-Waterman score: 3576; 39.2% identity (60.9% similar) in 1655 aa overlap (36-1518:51-1584) 10 20 30 40 50 60 pF1KSD PLLLSVILSLRLATAFDPAPSACSALASGVLYGAFSLQDLFPTIASGCSWTLENPDPTKY ..: :: .::. :: :::::.:::: .: CCDS64 LLLLGRRARAAAGADAGPGPEPCATLVQGKFFGYFSAAAVFPANASRCSWTLRNPDPRRY 30 40 50 60 70 80 70 80 90 100 110 120 pF1KSD SLYLRFNRQEQVCAHFAP---RLLPLDHYLVNFTCLRPSPEEAVAQAESEVGRPEEEEAE .::.. . :. .: : .: .: .... .: .:. CCDS64 TLYMKVAKAPVPCS--GPGRVRTYQFDSFL--------------ESTRTYLGVESFDEV- 90 100 110 120 130 140 150 160 170 pF1KSD AAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEA---PRLLAPAALAFRFVEVLLINNN :.::. :.:..::. .:.:.:. . :.. :: :. :: :...: CCDS64 ----LRLCDPSAPLAFLQASKQFLQMRRQQPPQHDGLRPRAGPPGPTDDFSVEYLVVGNR 130 140 150 160 170 180 190 200 210 220 pF1KSD NSSQFTCGVLCRWSEEC--GRAAGRACGFAQPGCSC-PGEAGAGSTTTTSP--------- : :. .: .:::: . : : ... ::. : :.: ::::. .. .: CCDS64 NPSRAACQMLCRWLDACLAGSRSSHPCGIMQTPCACLGGEAGGPAAGPLAPRGDVCLRDA 180 190 200 210 220 230 230 240 pF1KSD --GPPAAHTLSNALVPGG--------------------------------PAPPAE---- : : : . :: ::: .: CCDS64 VAGGPENCLTSLTQDRGGHGATGGWKLWSLWGECTRDCGGGLQTRTRTCLPAPGVEGGGC 240 250 260 270 280 290 250 260 270 pF1KSD -----------------ADLHSGSSNDLFTTEMRYGEE------------PEE-EPKVK- : :. :..: .:. : :: :. .: .. CCDS64 EGVLEEGRQCNREACGPAGRTSSRSQSLRSTDARRREELGDELQQFGFPAPQTGDPAAEE 300 310 320 330 340 350 280 290 300 pF1KSD -TQWPRSADEPGL-------------YMAQT-----------------VHGVWEEWGSWS . : .. : : .: :::.:.::. :: CCDS64 WSPWSVCSSTCGEGWQTRTRFCVSSSYSTQCSGPLREQRLCNNSAVCPVHGAWDEWSPWS 360 370 380 390 400 410 310 320 330 340 350 360 pF1KSD LCSRSCGRGSRSRMRTCVPPQHGGKACEGPELQTKLCSMAACP---VEGQWLEWGPWGPC ::: .:::: :.: ::: ::: ::. ::::: :::.:..: :: :.:.: ::. :. : CCDS64 LCSSTCGRGFRDRTRTCRPPQFGGNPCEGPEKQTKFCNIALCPGRAVDGNWNEWSSWSAC 420 430 440 450 460 470 370 380 390 400 410 420 pF1KSD STSCANGTQQRSRKCSVAGPAW--ATCTGALTDTRECSNLECPATDSKWGPWNAWSLCSK :.::..: :::.:.:. ::.. : : : ..::.: .::. :.:: : .:. :: CCDS64 SASCSQGRQQRTRECN--GPSYGGAECQGHWVETRDCFLQQCPV-DGKWQAWASWGSCSV 480 490 500 510 520 530 430 440 450 460 470 480 pF1KSD TCDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAA :: .: ::: :.:.. : :.: .: . :. .::: ::.: .. . ::.. : CCDS64 TCGAGSQRRERVCSGPFFGGAACQGPQDEYRQCGTQRCPEPHEICDEDNFGAVIWKETPA 540 550 560 570 580 590 490 500 510 520 530 540 pF1KSD GEIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAKGQRM ::. .:: ::.: ::: :. .:.::: :.. ::.: .:: . . ::::::.:: CCDS64 GEVAAVRCPRNATGLILRRCELDEEGIAYWEPPTYIRCVSIDYRNIQMMTREHLAKAQRG 600 610 620 630 640 650 550 560 570 580 590 600 pF1KSD LAGEGMSQVVRSLQELLARRTYYSGDLLFSVDILRNVTDTFKRATYVPSADDVQRFFQVV : :::.:.:...: :. : :::::: ..:.:::.:. :.:: : :. ::: : :.. CCDS64 LPGEGVSEVIQTLVEISQDGTSYSGDLLSTIDVLRNMTEIFRRAYYSPTPGDVQNFVQIL 660 670 680 690 700 710 610 620 630 640 650 660 pF1KSD SFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSLIVTDNLVISIQRE : .. ::..::..:: ..:.. .:.:.::::. ..: .: .... ::::::.::.. CCDS64 SNLLAEENRDKWEEAQLAGPNAKELFRLVEDFVDVIGFRMKDLRDAYQVTDNLVLSIHKL 720 730 740 750 760 770 670 680 690 700 710 720 pF1KSD PVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPATSGAAGSPGRGRGP :.:. ..::.:::.: :. ::.. :::. . : :.: .: . CCDS64 PASG-ATDISFPMKGWRATGDWAKVPEDRVTVSKSVFS---------TGLT--------- 780 790 800 810 730 740 750 760 770 780 pF1KSD GTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPPRPPLAVTSRVMTVTVRPP . ::.: ::.:.::::.:: .: : ...:.:..:::.:: CCDS64 -----------------EADEASVFVVGTVLYRNLGSFLALQRNTTVLNSKVISVTVKPP 820 830 840 850 860 790 800 810 820 830 pF1KSD TQPPAEPLITVELSYIINGTTDPHCASWDYSRADASS-----GDWDTENCQTLETQAAHT . :: .:.... ::::. : :: . . .:: : :. ..:.:. .: .: CCDS64 PRSLRTPL-EIEFAHMYNGTTNQTCILWDETDVPSSSAPPQLGPWSWRGCRTVPLDALRT 870 880 890 900 910 840 850 860 870 880 890 pF1KSD RCQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSE :: :..:::::.::: : ..: : ::: :..::.:: ..:: :. ::.. ::.:.:: CCDS64 RCLCDRLSTFAILAQLSADANMEKATLPSVTLIVGCGVSSLTLLMLVIIYVSVWRYIRSE 920 930 940 950 960 970 900 910 920 930 940 950 pF1KSD RSIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLA ::.::.::::::..:: :::.::... .: :::..:::::::::::::::::::::::.: CCDS64 RSVILINFCLSIISSNALILIGQTQTRNKVVCTLVAAFLHFFFLSSFCWVLTEAWQSYMA 980 990 1000 1010 1020 1030 960 970 980 990 1000 1010 pF1KSD VIGRMRTRLVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPA : :..:.::.:::::::::::::::::.:::::..:::.: .:::::::::::::::::: CCDS64 VTGHLRNRLIRKRFLCLGWGLPALVVAISVGFTKAKGYSTMNYCWLSLEGGLLYAFVGPA 1040 1050 1060 1070 1080 1090 1020 1030 1040 1050 1060 1070 pF1KSD AVIVLVNMLIGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSS :..:::::.:::.:::::...:::.::. :.::: CCDS64 AAVVLVNMVIGILVFNKLVSKDGITDKKLKERAG-------------------------- 1100 1110 1120 1130 1080 1090 1100 1110 1120 1130 pF1KSD ASARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCF :::::::::::::::::::::::.:::::.::: :::::.: .::::. :::. CCDS64 -------ASLWSSCVVLPLLALTWMSAVLAVTDRRSALFQILFAVFDSLEGFVIVMVHCI 1140 1150 1160 1170 1180 1140 1150 1160 1170 1180 1190 pF1KSD LRREVQDVVKCQMGVCRADESE-DSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCN :::::::.:::.. : : .:.. :: : .::. :...::::::::::..:: :.. .: CCDS64 LRREVQDAVKCRV-VDRQEEGNGDSGGSFQNGHAQLMTDFEKDVDLACRSVLNKDIAACR 1190 1200 1210 1220 1230 1240 1200 1210 1220 1230 1240 1250 pF1KSD PSTITGTLSRLSLDEDEEPKSCLVGPEGS-LSFSPLPGNIL-VPMAASPGL-GEPPP--P .::::::.: :: :.:. : :. .: .:. ::.:. . . .:: : : : : CCDS64 TATITGTLKRPSLPEEEKLK--LAHAKGPPTNFNSLPANVSKLHLHGSPRYPGGPLPDFP 1250 1260 1270 1280 1290 1300 1260 1270 1280 1290 1300 pF1KSD Q--------EANPVYMCGEGGL-RQLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGGG . .: . :.: . ..:: : : . . .:..:: : .:.: CCDS64 NHSLTLKRDKAPKSSFVGDGDIFKKLDSELSRAQEKALDTSYVILPTATATLRP------ 1310 1320 1330 1340 1350 1310 1320 1330 1340 1350 pF1KSD GEDAPRARPEGT---PRRAAKTVAHTEGYP-SFLSVDHSGLGLGPAYGSLQNPYGMTFQP :. .:. . . . : : . : . :. : . : .. : CCDS64 ---KPKEEPKYSIHIDQMPQTRLIHLSTAPEASLPARSPPSRQPPSGGPPEAPPAQPPPP 1360 1370 1380 1390 1400 1410 1360 1370 1380 1390 pF1KSD PPPTPSARQVP---------------EPGE-RSRTMPRTVPGS------TMKMGSLERKK ::: : : : .::: .. : : :.. :....::::.: CCDS64 PPPPPPPPQQPLPPPPNLEPAPPSLGDPGEPAAHPGPSTGPSTKNENVATLSVSSLERRK 1420 1430 1440 1450 1460 1470 1400 1410 1420 1430 1440 1450 pF1KSD LRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAKREKRWSVSSGGAAERSVC ::..:::::.:::::::......::.:. : .:...:. .. . :. CCDS64 SRYAELDFEKIMHTRKRHQDMFQDLNRKL--------QHAAEKDKE-VLGPDSKPEK--- 1480 1490 1500 1510 1520 1460 1470 1480 1490 1500 1510 pF1KSD TDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTLH--RAAAWEPTEPPDG-D . .:..:: : .. : . . :. : : :.: : ... :..: : : : CCDS64 --QQTPNKRPWESLRKAHGTPTWVKK-ELEPLQPSPLELRSVEWERSGATIPLVGQDIID 1530 1540 1550 1560 1570 pF1KSD FQTEV .:::: CCDS64 LQTEV 1580 >>CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923 aa) initn: 283 init1: 171 opt: 612 Z-score: 448.3 bits: 96.6 E(32554): 1.2e-18 Smith-Waterman score: 737; 23.8% identity (50.1% similar) in 1200 aa overlap (307-1471:1841-2891) 280 290 300 310 320 330 pF1KSD VKTQWPRSADEPGLYMAQTVHGVWEEWGSWSLCSRSCGRGSRSRMRTC-VPPQHGGKACE :.:.: . : . :: ::.. : :: CCDS79 DWDSYSCSCDPGYYGDNCTNVCDLNPCEHQSVCTR---KPSAPHGYTCECPPNYLGPYCE 1820 1830 1840 1850 1860 340 350 360 370 380 390 pF1KSD GPELQTKLCSMAACPVEGQWLEWG-PW-GPCSTSCANGTQQRSRKCSVAGPAWATCTGAL :.. . :: .: : :: : :::. . ..: . : : . : CCDS79 -----TRIDQ--PCP-RG-W--WGHPTCGPCNCDVSKGFDPDCNKTS------GECHCKE 1870 1880 1890 1900 1910 400 410 420 430 440 450 pF1KSD TDTRECSNLECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEVK . : .. : : . . :: :..:: . :. :. : :. . CCDS79 NHYRPPGSPTCLLCDC----YPTGSL-SRVCDP--EDGQCPCKP-GVIGRQCDRCDNPFA 1920 1930 1940 1950 1960 460 470 480 490 500 510 pF1KSD PCSEKRCPAFHEMCRDEYVMLMTWKKAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYWG . . : . .. : . : .. : :: .. :.: :.: .: : CCDS79 EVTTNGCEVNYDSCPRAIEAGIWWPRTRFGLPAAAPCPKGSFGTAVRHCD-EHRG---WL 1970 1980 1990 2000 2010 520 530 540 550 560 570 pF1KSD LPSFARCISHEYRYLYLSLREHLAKGQRMLAGEGMSQVVRSLQELLARRT--YYSGDLLF :.. : : . : .. :.: ... : : :: . : . ...: :...:. CCDS79 PPNLFNCTSITFSELK-GFAERLQRNESGL-DSGRSQQLALLLRNATQHTAGYFGSDVKV 2020 2030 2040 2050 2060 2070 580 590 600 610 620 pF1KSD SVDILRNVT--DTFKRATYVPSADDV---QRFFQVVSFMVDAENKEKWDDAQQVSPGSVH . .. . .. .:. . ...:: . ...: : ..:. ::..:. ::. :.. CCDS79 AYQLATRLLAHESTQRGFGLSATQDVHFTENLLRVGSALLDTANKRHWELIQQTEGGTAW 2080 2090 2100 2110 2120 2130 630 640 650 660 670 680 pF1KSD LLRVVEDFIHLVGDALK-AFQSSL-IVTDNLVISIQREPVSAVSSDITFPMRGRRGMKDW ::. : . ... .. .. : . ::: :.:::. : . .. ... :: . CCDS79 LLQHYEAYASALAQNMRHTYLSPFTIVTPNIVISVVRLDKGNFAGAKLPRYEALRGEQP- 2140 2150 2160 2170 2180 2190 690 700 710 720 730 740 pF1KSD VRHSEDRLFLPKEVLSLSSPG-KPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDE : ..::. :. . : .:: .::... : . .:: : . CCDS79 -PDLETTVILPESVFRETPPVVRPA------GPGEAQEPEELA-----RRQRRHPELSQG 2200 2210 2220 2230 2240 750 760 770 780 pF1KSD SSYFVIGAVLYRTLGLILP----PPRPPLAVTSR------VMTVTVRPPTQ--PPA--EP . : ....::::. .:: : . : : .: :....:. . : : .: CCDS79 EA--VASVIIYRTLAGLLPHNYDPDKRSLRVPKRPIINTPVVSISVHDDEELLPRALDKP 2250 2260 2270 2280 2290 2300 790 800 810 820 830 840 pF1KSD LITVELSYI-INGTTDPHCASWDYSRADASSGDWDTENCQTLETQAAHTRCQCQHLSTFA .::.. . . : : :. :..: ...: :....:... . .:. :::.:...:: CCDS79 -VTVQFRLLETEERTKPICVFWNHSILVSGTGGWSARGCEVVFRNESHVSCQCNHMTSFA 2310 2320 2330 2340 2350 2360 850 860 870 880 890 900 pF1KSD VLAQPPKDLTLELAGSPSVPLVIGCAVSCMALLTLLAIYAAFWRFIKSERSIILLNFCLS :: . . . :. .. : . .:. ::: : .. .. :...:.. : :. . CCDS79 VLMDVSRRENGEILPLKTLTYV-ALGVTLAALL-LTFFFLTLLRILRSNQHGIRRNLTAA 2370 2380 2390 2400 2410 910 920 930 940 950 960 pF1KSD ILASNILILVGQSRVLSKGVCTMTAAFLHFFFLSSFCWVLTEAWQSYLAV--IGRMRTRL . .....:.: ... .::. : .:::..: .: :.: :: . : :. . . : CCDS79 LGLAQLVFLLGINQADLPFACTVIAILLHFLYLCTFSWALLEALHLYRALTEVRDVNTGP 2420 2430 2440 2450 2460 2470 970 980 990 1000 1010 1020 pF1KSD VRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAAVIVLVNML .: .. ::::.::......::. .:::. ..::::. :...:.::.: : .... CCDS79 MRFYYM-LGWGVPAFITGLAVGLD-PEGYGNPDFCWLSIYDTLIWSFAGPVAFAVSMSVF 2480 2490 2500 2510 2520 2530 1030 1040 1050 1060 1070 1080 pF1KSD IGIIVFNKLMARDGISDKSKKQRAGSERCPWASLLLPCSACGAVPSPLLSSASARNAMAS . : : :: . . :: : :. .. ... CCDS79 LYI-----LAARASCA----AQRQGFEK--------------------------KGPVSG 2540 2550 2560 1090 1100 1110 1120 1130 1140 pF1KSD LWSSCVVLPLLALTWMSAVLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFLRREVQDVV : : .:: ::. ::. :.:.. . ..::. :::. : :: : . : .::. .. CCDS79 LQPSFAVLLLLSATWLLALLSV-NSDTLLFHYLFATCNCIQGPFIFLSYVVLSKEVRKAL 2570 2580 2590 2600 2610 2620 1150 1160 1170 1180 1190 1200 pF1KSD KCQMGVCRADESEDSPDSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPSTITGTLSR : .: . ::: . . . :... : . :.. . .:.: CCDS79 KL---ACS---RKPSPDPALTTKSTLTSSYNCPSPYA-DGRLYQPYGDS-----AGSLHS 2630 2640 2650 2660 1210 1220 1230 1240 1250 1260 pF1KSD LSLDEDEEPKSCLVGPEGSLSFSPLPGNILVPMAASPGLGEPPPPQEANPVYMCGEGGLR : . .: : .: . : .:: : :: ..: . :: . CCDS79 TSRSGKSQP-------------SYIPFLLREESALNPGQG---PPGLGDPGSLFLEGQDQ 2670 2680 2690 2700 2710 1270 1280 1290 1300 1310 1320 pF1KSD QLDLTWLRPTEPGSEGDYMVLPRRTLSLQPGGGGG-GGEDAPRARPEGTPRRAAKTVAHT : : : ...: :::. .:. .. . .. : .. . CCDS79 QHD--------PDTDSD------SDLSLEDDQSGSYASTHSSDSEEEEEEEEEEAAFPGE 2720 2730 2740 2750 1330 1340 1350 1360 1370 1380 pF1KSD EGYPSFLSVDHSGLGLGPAYGSLQNPYGMTFQPPPPTPSARQVPEPGERSRTMPRTVPGS .:. :.: :: :. . : : . : :. ..: ::. . : . : CCDS79 QGWDSLL---------GP--GAERLPLHSTPKDGGPGPG--KAPWPGDFGTTAKE----S 2760 2770 2780 2790 2800 1390 1400 1410 1420 1430 1440 pF1KSD TMKMGSLERKKLRYSDLDFEKVMHTRKRHSELYHELNQKFHTFDRYRSQSTAKR---EKR . . . :: . . :. : . : :. : . . .:. : :. CCDS79 SGNGAPEERLRENGDALSREGSLGPLPGSSAQPHKGILKKKCLPTISEKSSLLRLPLEQC 2810 2820 2830 2840 2850 2860 1450 1460 1470 1480 1490 1500 pF1KSD WSVSSGGAA-ERSVCTDKPSPGERPSLSQHRRHQSWSTFKSMTLGSLPPKPRERLTLHRA . : :..: : : : : : ::... CCDS79 TGSSRGSSASEGSRGGPPPRPPPRQSLQEQLNGVMPIAMSIKAGTVDEDSSGSEFLFFNF 2870 2880 2890 2900 2910 2920 >>CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635 aa) initn: 791 init1: 255 opt: 579 Z-score: 420.4 bits: 92.4 E(32554): 4.3e-17 Smith-Waterman score: 584; 31.6% identity (53.5% similar) in 361 aa overlap (296-620:4585-4941) 270 280 290 300 310 320 pF1KSD RYGEEPEEEPKVKTQWPRSADEPGLYMAQTVHGVWEEWGSWSLCSRSCGRGSRSRMRTCV : : : ::. : :.::::::...: ::: CCDS30 LCNQPLPANGGKPCQGSDLEMRNCQNKPCPVDGSWSEWSLWEECTRSCGRGNQTRTRTCN 4560 4570 4580 4590 4600 4610 330 340 350 360 370 380 pF1KSD PP--QHGGKACEGPELQTKLCSMAACPVEGQWLEWGPWGPCSTSCANGTQQRSRKCSVAG : ::::. ::: .. .:.. :::.: : : ::: :: ::..::: :.: :. CCDS30 NPSVQHGGRPCEGNAVEIIMCNIRPCPVHGAWSAWQPWGTCSESCGKGTQTRARLCNNPP 4620 4630 4640 4650 4660 4670 390 400 410 420 430 440 pF1KSD PAW--ATCTGALTDTRECSNLECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQ ::. . : :: :. . :.. .:: .::. : .:: :: .: : ..: : :. : CCDS30 PAFGGSYCDGAETQMQVCNERNCPI-HGKWATWASWSACSVSCGGGARQRTRGCSDPVPQ 4680 4690 4700 4710 4720 4730 450 460 470 480 490 pF1KSD --GYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAAGEII--YNKC---PPNA : :::. . :. ::. . . . : ... : . : : ::. CCDS30 YGGRKCEGSDVQSDFCNSDPCPTHGNW--SPWSGWGTCSRTCNGGQMRRYRTCDNPPPSN 4740 4750 4760 4770 4780 4790 500 510 520 530 540 pF1KSD SGSAS-------RRCLLSAQGV-AYWG-LPSFARCISH----EYRYLYLSLREHLAKGQR .: : .:: . : . :: :...: . : : . .:: : CCDS30 GGRACGGPDSQIQRCNTDMCPVDGSWGSWHSWSQCSASCGGGEKTRKRLCDHPVPVKGGR 4800 4810 4820 4830 4840 4850 550 560 570 580 590 pF1KSD MLAGEGMSQVVR-SLQEL-----LARRTYYSG--DLLFSVDILR-NVTDTFKRATYVPSA :. .::.: ..: :: . .. :. :.. .: ..::. . : . : CCDS30 PCPGD-TTQVTRCNVQACPGGPQRARGSVIGNINDVEFGIAFLNATITDSPNSDTRIIRA 4860 4870 4880 4890 4900 4910 600 610 620 630 640 pF1KSD D--DVQRFF-QVVSFMVDAENKEKWDDAQQVSPGSVHLLRVVEDFIHLVGDALKAFQSSL .: : . ... .:. : : :... CCDS30 KITNVPRSLGSAMRKIVSILNPIYWTTAKEIGEAVNGFTLTNAVFKRETQVEFATGEILQ 4920 4930 4940 4950 4960 4970 650 660 670 680 690 700 pF1KSD IVTDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKEVLSLSSPGKPAT CCDS30 MSHIARGLDSDGSLLLDIVVSGYVLQLQSPAEVTVKDYTEDYIQTGPGQLYAYSTRLFTI 4980 4990 5000 5010 5020 5030 >>CCDS41352.1 ADGRL4 gene_id:64123|Hs108|chr1 (690 aa) initn: 377 init1: 275 opt: 526 Z-score: 393.5 bits: 84.4 E(32554): 1.3e-15 Smith-Waterman score: 577; 30.8% identity (58.8% similar) in 415 aa overlap (746-1144:302-673) 720 730 740 750 760 770 pF1KSD PGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGAVLYRTLGLILPPP-----RPPLAV : :: .: . ...: : . : CCDS41 MNMDGDYINIFPKRKAAYDSNGNVAVAFVYYKSIGPLLSSSDNFLLKPQNYDNSEEEERV 280 290 300 310 320 330 780 790 800 810 820 pF1KSD TSRVMTVTVR--PPTQPPAEPLITVELSYIINGTTDPH---CASWDYSRADASSGDWDTE : :..:.. ::: : :: ::. .:: . :: :.:: :. .:.:..: CCDS41 ISSVISVSMSSNPPTLYELEK-ITFTLSH--RKVTDRYRSLCAFWNYS-PDTMNGSWSSE 340 350 360 370 380 830 840 850 860 870 880 pF1KSD NCQTLETQAAHTRCQCQHLSTFAVLAQPPKDLTLELAGSPSVPLVIGCAVS--CMALLTL .:. .. .:: :.:.::. ::.: . .. .. . . .: .: :.:. . CCDS41 GCELTYSNETHTSCRCNHLTHFAILMSSGPSIGIKDYNILTRITQLGIIISLICLAICIF 390 400 410 420 430 440 890 900 910 920 930 940 pF1KSD LAIYAAFWRF--IKSERSIILLNFCLSILASNILILVGQSRVLSKGVCTMTAAFLHFFFL .:: : :.: :. : :.: :.. .....::: . .: :.. :..::.::: CCDS41 -----TFWFFSEIQSTRTTIHKNLCCSLFLAELVFLVGINTNTNKLFCSIIAGLLHYFFL 450 460 470 480 490 500 950 960 970 980 990 1000 pF1KSD SSFCWVLTEAWQSYLAVIGRMRTR-LVRKRFLCLGWGLPALVVAVSVGFTRTKGYGTSSY ..: :. :. . :: :.: . .. ...: : .:. ::.::. :... . :::.. CCDS41 AAFAWMCIEGIHLYLIVVGVIYNKGFLHKNFYIFGYLSPAVVVGFSAALGY-RYYGTTKV 510 520 530 540 550 560 1010 1020 1030 1040 1050 pF1KSD CWLSLEGGLLYAFVGPAAVIVLVNML-IGIIVFNKLMARDGISDKSKKQRAGSERCPWAS :::: :......:.::: .:.:::.: .:.:.. : .. :: . : .: CCDS41 CWLSTENNFIWSFIGPACLIILVNLLAFGVIIY-----------KVFRHTAGLK--PEVS 570 580 590 600 1060 1070 1080 1090 1100 1110 pF1KSD LLLPCSACGAVPSPLLSSASARNAMASLWSSCVVLPLLALTWMSAVLAMTDRRSVLFQAL . .: ::.:.: :. ::. ::. .:: .. . ::. : CCDS41 CFENIRSC------------ARGALALLF-------LLGTTWIFGVLHVV-HASVVTAYL 610 620 630 640 1120 1130 1140 1150 1160 1170 pF1KSD FAVFNSAQGFVITAVHCFLRREVQDVVKCQMGVCRADESEDSPDSCKNGQLQILSDFEKD :.: :. ::. : : : :..:. CCDS41 FTVSNAFQGMFIFLFLCVLSRKIQEEYYRLFKNVPCCFGCLR 650 660 670 680 690 >>CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074 aa) initn: 394 init1: 223 opt: 524 Z-score: 389.5 bits: 84.3 E(32554): 2.2e-15 Smith-Waterman score: 531; 29.7% identity (51.7% similar) in 333 aa overlap (149-455:622-940) 120 130 140 150 160 170 pF1KSD EEAEAAAGLELCSGSGPFTFLHFDKNFVQLCLSAEPSEAPRLLAPAALAFRFVEVLLINN : . : .. :. . :. . :. CCDS38 CSRNGGWTPWTSWSPCSTTCGIGFQVRQRSCSNPTPRHGGRVCVGQNREERYCNEHLLCP 600 610 620 630 640 650 180 190 200 210 220 230 pF1KSD NNSSQFTCGVLCRWSEECG---RAAGRACGFAQPGCSCPGEAGAGSTTTTSPGPPAAHTL . : : . .:: .: : : . : .: : .. .:.: : .: CCDS38 PHMFWTGWGPWERCTAQCGGGIQARRRIC---ENGPDCAGCNVEYQSCNTNPCPELKKT- 660 670 680 690 700 240 250 260 270 280 pF1KSD SNALVPGGPAPPAEADLHSGSSNDLF--TTEMRYGEEPEEE---PKVKTQWPRS------ .: : :.. . ..: .. : : . : .. : ... .. : CCDS38 ----TPWTPWTPVNISDNGGHYEQRFRYTCKARLADPNLLEVGRQRIEMRYCSSDGTSGC 710 720 730 740 750 760 290 300 310 320 330 pF1KSD -AD-------EPGLYMAQTVHGVWEEWGSWSLCSRSCGRGSRSRMRTCV-P-PQHGGKAC .: . : : :.::.:.: : ::: :::.:.:: :.: :.: : :..:: : CCDS38 STDGLSGDFLRAGRYSAHTVNGAWSAWTSWSQCSRDCSRGIRNRKRVCNNPEPKYGGMPC 770 780 790 800 810 820 340 350 360 370 380 390 pF1KSD EGPELQTKLCSMAACPVEGQWLEWGPWGPCSTSCANGTQQRSRKCSVAGPAWA--TCTGA :: :. . :.. :::.: : :.:: ::..:..: .:.:.:: .::.. : : CCDS38 LGPSLEYQECNILPCPVDGVWSCWSPWTKCSATCGGGHYMRTRSCSNPAPAYGGDICLGL 830 840 850 860 870 880 400 410 420 430 440 450 pF1KSD LTDTRECSNLECPATDSKWGPWNAWSLCSKTCDTGWQRRFRMCQATGTQGYPCEGTGEEV :. :.. :: . :. :. :: : .: : : :.: .: : :. : CCDS38 HTEEALCNTQPCPES---WSEWSDWSECEA---SGVQVRARQCILLFPMGSQCSGNTTES 890 900 910 920 930 460 470 480 490 500 510 pF1KSD KPCSEKRCPAFHEMCRDEYVMLMTWKKAAAGEIIYNKCPPNASGSASRRCLLSAQGVAYW .:: CCDS38 RPCVFDSNFIPEVSVARSSSVEEKRCGEFNMFHMIAVGLSSSILGCLLTLLVYTYCQRYQ 940 950 960 970 980 990 >>CCDS82926.1 ADGRL3 gene_id:23284|Hs108|chr4 (1240 aa) initn: 542 init1: 227 opt: 521 Z-score: 386.5 bits: 83.9 E(32554): 3.3e-15 Smith-Waterman score: 690; 24.9% identity (55.6% similar) in 754 aa overlap (454-1166:485-1156) 430 440 450 460 470 480 pF1KSD CDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAAG : . .. ::..: :. . . : :. : CCDS82 TTPSVSGRRNRSTSTPSPAVEVLDDMTTHLPSASSQIPALEESCEAVEAREIMWFKTRQG 460 470 480 490 500 510 490 500 510 520 530 540 pF1KSD EIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAKGQRML .: . :: .. : .. :: . .:. :... : : .:.. :.. CCDS82 QIAKQPCPAGTIGVSTYLCL-APDGIWDPQGPDLSNCSS--------PWVNHIT--QKLK 520 530 540 550 560 550 560 570 580 pF1KSD AGEGMSQVVRSLQELLARRTYYSGDLLFSV----------DI-LRNVT----DTFKRATY .:: ....: : : .: .::. .:: :. :::.: :. :. CCDS82 SGETAANIARELAEQ-TRNHLNAGDITYSVRAMDQLVGLLDVQLRNLTPGGKDSAARSLN 570 580 590 600 610 620 590 600 610 620 630 pF1KSD VPSADD------VQRFFQVVSFMVDAENKEKWDD---AQQVSPGSVHLLRVVEDFIHLVG . . :: . ..:. ... . . : : ..:. ... ::..::. ... CCDS82 KLQKRERSCRAYVQAMVETVNNLLQPQALNAWRDLTTSDQLRAATM-LLHTVEESAFVLA 630 640 650 660 670 680 640 650 660 670 680 690 pF1KSD DALKAFQSSLIV--TDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKE : : ...... :::. . . : . . :. :: .: CCDS82 DNL--LKTDIVRENTDNIKLEVARLSTEGNLEDLKFPENMGHG----------------S 690 700 710 720 700 710 720 730 740 750 pF1KSD VLSLSSPGKPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGA-VLYRT ...::. : : :. : .. .. : : :.. . .:. .: . CCDS82 TIQLSA----NTLKQNGRNGEIRVAFVL-------YNNLGPYLSTENASMKLGTEALSTN 730 740 750 760 770 760 770 780 790 800 810 pF1KSD LGLILPPPRPPLAVTSRVMTVTVRPPTQPPAEPLI-TVELSYIINGTTDPHCASWDYSRA ..:. : :.... . . :.:.. ::. . . .:.:. :.::. CCDS82 HSVIVNSPVITAAINKEFSNKVYL------ADPVVFTVKHIKQSEENFNPNCSFWSYSKR 780 790 800 810 820 820 830 840 850 860 pF1KSD DASSGDWDTENCQTLETQAAHTRCQCQHLSTFAVL--------AQPPKDLTLELAGSPSV . : :.:..:. : :. .:: :.:.::..:::: .. .:: :.. .. CCDS82 TMT-GYWSTQGCRLLTTNKTHTTCSCNHLTNFAVLMAHVEVKHSDAVHDLLLDVITWVGI 830 840 850 860 870 880 870 880 890 900 910 920 pF1KSD PLVIGCAVSCMALLTLLAIYAAFWRFIKSERSIILLNFCLSILASNILILVGQSRVLSKG : . : . :. . :.: ..:.:. : :.:.:......:.:.: .:. . CCDS82 LLSLVCLLICIFTFC-------FFRGLQSDRNTIHKNLCISLFVAELLFLIGINRTDQPI 890 900 910 920 930 930 940 950 960 970 980 pF1KSD VCTMTAAFLHFFFLSSFCWVLTEAWQSYLAVIGRMRTRLVRKRFLCL-GWGLPALVVAVS .:.. ::.::::::..: :.. :. : :. .. .... :.... : :.:.:::.:::: CCDS82 ACAVFAALLHFFFLAAFTWMFLEGVQLYIMLVEVFESEHSRRKYFYLVGYGMPALIVAVS 940 950 960 970 980 990 990 1000 1010 1020 1030 1040 pF1KSD VGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAAVIVLVNMLIGIIVFNKLMARDGISDKSK .. ..:::.. ::: :. ....:.:::..:...:... :.. :.. . .: CCDS82 AAVDY-RSYGTDKVCWLRLDTYFIWSFIGPATLIIMLNVIFLGIALYKMFHHTAI----- 1000 1010 1020 1030 1040 1050 1050 1060 1070 1080 1090 1100 pF1KSD KQRAGSERCPWASLLLPCSACGAVPSPLLSSASARNAMASLW--SSCVVLPLLALTWMSA : : :.: .. . : . : : .. ..: ::.::: . CCDS82 --------------LKPESGC----LDNINYEDNRPFIKS-WVIGAIALLCLLGLTWAFG 1060 1070 1080 1090 1110 1120 1130 1140 1150 1160 pF1KSD VLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFLRREV-QDVVKC-QMGVCRADESEDSP .. . .. .:.. ::..::: ::. : :: :...: .. :: . : . .:.: CCDS82 LMYI-NESTVIMAYLFTIFNSLQGMFIFIFHCVLQKKVRKEYGKCLRTHCCSGKSTESSI 1100 1110 1120 1130 1140 1150 1170 1180 1190 1200 1210 1220 pF1KSD DSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPSTITGTLSRLSLDEDEEPKSCLVGP : : CCDS82 GSGKTSGSRTPGRYSTGSQSRIRRMWNDTVRKQSESSFITGDINSSASLNREPYRETSMG 1160 1170 1180 1190 1200 1210 >>CCDS54768.1 ADGRL3 gene_id:23284|Hs108|chr4 (1469 aa) initn: 552 init1: 227 opt: 521 Z-score: 385.6 bits: 84.0 E(32554): 3.7e-15 Smith-Waterman score: 690; 24.9% identity (55.6% similar) in 754 aa overlap (454-1166:485-1156) 430 440 450 460 470 480 pF1KSD CDTGWQRRFRMCQATGTQGYPCEGTGEEVKPCSEKRCPAFHEMCRDEYVMLMTWKKAAAG : . .. ::..: :. . . : :. : CCDS54 TTPSVSGRRNRSTSTPSPAVEVLDDMTTHLPSASSQIPALEESCEAVEAREIMWFKTRQG 460 470 480 490 500 510 490 500 510 520 530 540 pF1KSD EIIYNKCPPNASGSASRRCLLSAQGVAYWGLPSFARCISHEYRYLYLSLREHLAKGQRML .: . :: .. : .. :: . .:. :... : : .:.. :.. CCDS54 QIAKQPCPAGTIGVSTYLCL-APDGIWDPQGPDLSNCSS--------PWVNHIT--QKLK 520 530 540 550 560 550 560 570 580 pF1KSD AGEGMSQVVRSLQELLARRTYYSGDLLFSV----------DI-LRNVT----DTFKRATY .:: ....: : : .: .::. .:: :. :::.: :. :. CCDS54 SGETAANIARELAEQ-TRNHLNAGDITYSVRAMDQLVGLLDVQLRNLTPGGKDSAARSLN 570 580 590 600 610 620 590 600 610 620 630 pF1KSD VPSADD------VQRFFQVVSFMVDAENKEKWDD---AQQVSPGSVHLLRVVEDFIHLVG . . :: . ..:. ... . . : : ..:. ... ::..::. ... CCDS54 KLQKRERSCRAYVQAMVETVNNLLQPQALNAWRDLTTSDQLRAATM-LLHTVEESAFVLA 630 640 650 660 670 680 640 650 660 670 680 690 pF1KSD DALKAFQSSLIV--TDNLVISIQREPVSAVSSDITFPMRGRRGMKDWVRHSEDRLFLPKE : : ...... :::. . . : . . :. :: .: CCDS54 DNL--LKTDIVRENTDNIKLEVARLSTEGNLEDLKFPENMGHG----------------S 690 700 710 720 700 710 720 730 740 750 pF1KSD VLSLSSPGKPATSGAAGSPGRGRGPGTVPPGPGHSHQRLLPADPDESSYFVIGA-VLYRT ...::. : : :. : .. .. : : :.. . .:. .: . CCDS54 TIQLSA----NTLKQNGRNGEIRVAFVL-------YNNLGPYLSTENASMKLGTEALSTN 730 740 750 760 770 760 770 780 790 800 810 pF1KSD LGLILPPPRPPLAVTSRVMTVTVRPPTQPPAEPLI-TVELSYIINGTTDPHCASWDYSRA ..:. : :.... . . :.:.. ::. . . .:.:. :.::. CCDS54 HSVIVNSPVITAAINKEFSNKVYL------ADPVVFTVKHIKQSEENFNPNCSFWSYSKR 780 790 800 810 820 820 830 840 850 860 pF1KSD DASSGDWDTENCQTLETQAAHTRCQCQHLSTFAVL--------AQPPKDLTLELAGSPSV . : :.:..:. : :. .:: :.:.::..:::: .. .:: :.. .. CCDS54 TMT-GYWSTQGCRLLTTNKTHTTCSCNHLTNFAVLMAHVEVKHSDAVHDLLLDVITWVGI 830 840 850 860 870 880 870 880 890 900 910 920 pF1KSD PLVIGCAVSCMALLTLLAIYAAFWRFIKSERSIILLNFCLSILASNILILVGQSRVLSKG : . : . :. . :.: ..:.:. : :.:.:......:.:.: .:. . CCDS54 LLSLVCLLICIFTFC-------FFRGLQSDRNTIHKNLCISLFVAELLFLIGINRTDQPI 890 900 910 920 930 930 940 950 960 970 980 pF1KSD VCTMTAAFLHFFFLSSFCWVLTEAWQSYLAVIGRMRTRLVRKRFLCL-GWGLPALVVAVS .:.. ::.::::::..: :.. :. : :. .. .... :.... : :.:.:::.:::: CCDS54 ACAVFAALLHFFFLAAFTWMFLEGVQLYIMLVEVFESEHSRRKYFYLVGYGMPALIVAVS 940 950 960 970 980 990 990 1000 1010 1020 1030 1040 pF1KSD VGFTRTKGYGTSSYCWLSLEGGLLYAFVGPAAVIVLVNMLIGIIVFNKLMARDGISDKSK .. ..:::.. ::: :. ....:.:::..:...:... :.. :.. . .: CCDS54 AAVDY-RSYGTDKVCWLRLDTYFIWSFIGPATLIIMLNVIFLGIALYKMFHHTAI----- 1000 1010 1020 1030 1040 1050 1050 1060 1070 1080 1090 1100 pF1KSD KQRAGSERCPWASLLLPCSACGAVPSPLLSSASARNAMASLW--SSCVVLPLLALTWMSA : : :.: .. . : . : : .. ..: ::.::: . CCDS54 --------------LKPESGC----LDNINYEDNRPFIKS-WVIGAIALLCLLGLTWAFG 1060 1070 1080 1090 1110 1120 1130 1140 1150 1160 pF1KSD VLAMTDRRSVLFQALFAVFNSAQGFVITAVHCFLRREV-QDVVKC-QMGVCRADESEDSP .. . .. .:.. ::..::: ::. : :: :...: .. :: . : . .:.: CCDS54 LMYI-NESTVIMAYLFTIFNSLQGMFIFIFHCVLQKKVRKEYGKCLRTHCCSGKSTESSI 1100 1110 1120 1130 1140 1150 1170 1180 1190 1200 1210 1220 pF1KSD DSCKNGQLQILSDFEKDVDLACQTVLFKEVNTCNPSTITGTLSRLSLDEDEEPKSCLVGP : : CCDS54 GSGKTSGSRTPGRYSTGSQSRIRRMWNDTVRKQSESSFITGDINSSASLNREGLLNNARD 1160 1170 1180 1190 1200 1210 1518 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 00:16:59 2016 done: Fri Nov 4 00:17:00 2016 Total Scan time: 5.510 Total Display time: 0.620 Function used was FASTA [36.3.4 Apr, 2011]