FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1568, 1378 aa 1>>>pF1KA1568 1378 - 1378 aa - 1378 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.8432+/-0.00109; mu= 7.9161+/- 0.066 mean_var=278.9014+/-58.995, 0's: 0 Z-trim(112.0): 200 B-trim: 46 in 1/50 Lambda= 0.076798 statistics sampled from 12623 (12844) to 12623 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.711), E-opt: 0.2 (0.395), width: 16 Scan time: 6.270 The best scores are: opt bits E(32554) CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378) 9310 1046.6 0 CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394) 9179 1032.1 0 CCDS54610.1 ROBO1 gene_id:6091|Hs108|chr3 (1551) 4138 473.6 1.9e-132 CCDS46872.2 ROBO1 gene_id:6091|Hs108|chr3 (1606) 4100 469.4 3.6e-131 CCDS54611.1 ROBO1 gene_id:6091|Hs108|chr3 (1651) 4053 464.2 1.3e-129 CCDS44755.1 ROBO3 gene_id:64221|Hs108|chr11 (1386) 3375 389.0 4.9e-107 CCDS11952.1 DCC gene_id:1630|Hs108|chr18 (1447) 648 86.9 4.5e-16 CCDS42929.1 DSCAM gene_id:1826|Hs108|chr21 (2012) 622 84.2 4.2e-15 CCDS8384.1 DSCAML1 gene_id:57453|Hs108|chr11 (2113) 602 82.0 2e-14 CCDS46221.1 PXDN gene_id:7837|Hs108|chr2 (1479) 597 81.2 2.3e-14 CCDS53957.1 NEO1 gene_id:4756|Hs108|chr15 (1408) 588 80.2 4.5e-14 CCDS58378.1 NEO1 gene_id:4756|Hs108|chr15 (1450) 588 80.2 4.5e-14 CCDS10247.1 NEO1 gene_id:4756|Hs108|chr15 (1461) 588 80.2 4.6e-14 CCDS45769.1 SDK2 gene_id:54549|Hs108|chr17 (2172) 562 77.5 4.4e-13 CCDS8455.1 ROBO4 gene_id:54538|Hs108|chr11 (1007) 552 76.1 5.6e-13 CCDS47855.1 PXDNL gene_id:137902|Hs108|chr8 (1463) 544 75.4 1.3e-12 CCDS33790.1 CNTN3 gene_id:5067|Hs108|chr3 (1028) 523 72.9 5.3e-12 CCDS73385.1 NCAM1 gene_id:4684|Hs108|chr11 ( 858) 504 70.7 2e-11 CCDS61010.1 IGSF9B gene_id:22997|Hs108|chr11 (1437) 507 71.3 2.3e-11 CCDS73386.1 NCAM1 gene_id:4684|Hs108|chr11 ( 761) 487 68.8 6.9e-11 >>CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378 aa) initn: 9310 init1: 9310 opt: 9310 Z-score: 5589.0 bits: 1046.6 E(32554): 0 Smith-Waterman score: 9310; 100.0% identity (100.0% similar) in 1378 aa overlap (1-1378:1-1378) 10 20 30 40 50 60 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAEGRPTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAEGRPTP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 TIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNYLGEAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNYLGEAV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 SRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKDKVRIDDKEER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKDKVRIDDKEER 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 ISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRRPINQVVLEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRRPINQVVLEEE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 AVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGTYMCIAENRVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGTYMCIAENRVG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 KMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKEGSQNLLFPNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKEGSQNLLFPNQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 PQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTDVLTDRPPPII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTDVLTDRPPPII 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 LQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQGTLQIKNLRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQGTLQIKNLRI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 SDTGTYTCVATSSSGETSWSAVLDVTESGATISKNYDLSDLPGPPSKPQVTDVTKNSVTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SDTGTYTCVATSSSGETSWSAVLDVTESGATISKNYDLSDLPGPPSKPQVTDVTKNSVTL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 SWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRPNTIYLFMVRAINP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRPNTIYLFMVRAINP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 QGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTPTTVQVTWTVDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTPTTVQVTWTVDR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 QPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYEIKVRPYFNEFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYEIKVRPYFNEFQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 GMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQNGIIQEYKIWCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQNGIIQEYKIWCL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 GNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQPIIIGRRNEVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQPIIIGRRNEVV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 ITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKGLSNYAVTFQRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKGLSNYAVTFQRG 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 DGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNSNSGPNEIGNFGRGDVLPPVPGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNSNSGPNEIGNFGRGDVLPPVPGQ 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KA1 GDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQATPYATTQILHSNSIHELAVDLPDPQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQATPYATTQILHSNSIHELAVDLPDPQW 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KA1 KSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKNKNSSKPQKNNGSTWANVPLPPPPVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKNKNSSKPQKNNGSTWANVPLPPPPVQ 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KA1 PLPGTELEHYAVEQQENGYDSDSWCPPLPVQTYLHQGLEDELEEDDDRVPTPPVRGVASS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PLPGTELEHYAVEQQENGYDSDSWCPPLPVQTYLHQGLEDELEEDDDRVPTPPVRGVASS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KA1 PAISFGQQSTATLTPSPREEMQPMLQAHLDELTRAYQFDIAKQTWHIQSNNQPPQPPVPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PAISFGQQSTATLTPSPREEMQPMLQAHLDELTRAYQFDIAKQTWHIQSNNQPPQPPVPP 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KA1 LGYVSGALISDLETDVADDDADDEEEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LGYVSGALISDLETDVADDDADDEEEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTSS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KA1 QRPRPTSPFSTDSNTSAALSQSQRPRPTKKHKGGRMDQQPALPHRREGMTDEEALVPYSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QRPRPTSPFSTDSNTSAALSQSQRPRPTKKHKGGRMDQQPALPHRREGMTDEEALVPYSK 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 pF1KA1 PSFPSPGGHSSSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PSFPSPGGHSSSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL 1330 1340 1350 1360 1370 >>CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394 aa) initn: 9179 init1: 9179 opt: 9179 Z-score: 5510.5 bits: 1032.1 E(32554): 0 Smith-Waterman score: 9179; 100.0% identity (100.0% similar) in 1358 aa overlap (21-1378:37-1394) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTL :::::::::::::::::::::::::::::: CCDS54 RVTRRMWTWAPGLLMMTVVFWGHQGNGQGQGSRLRQEDFPPRIVEHPSDVIVSKGEPTTL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KA1 NCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVC 70 80 90 100 110 120 120 130 140 150 160 170 pF1KA1 VARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKD 130 140 150 160 170 180 180 190 200 210 220 230 pF1KA1 KVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRR 190 200 210 220 230 240 240 250 260 270 280 290 pF1KA1 PINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGT 250 260 270 280 290 300 300 310 320 330 340 350 pF1KA1 YMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KA1 GSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTD 370 380 390 400 410 420 420 430 440 450 460 470 pF1KA1 VLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQ 430 440 450 460 470 480 480 490 500 510 520 530 pF1KA1 GTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTESGATISKNYDLSDLPGPPSKPQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTESGATISKNYDLSDLPGPPSKPQV 490 500 510 520 530 540 540 550 560 570 580 590 pF1KA1 TDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRPNTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRPNTI 550 560 570 580 590 600 600 610 620 630 640 650 pF1KA1 YLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTPT 610 620 630 640 650 660 660 670 680 690 700 710 pF1KA1 TVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYEI 670 680 690 700 710 720 720 730 740 750 760 770 pF1KA1 KVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQNG 730 740 750 760 770 780 780 790 800 810 820 830 pF1KA1 IIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQP 790 800 810 820 830 840 840 850 860 870 880 890 pF1KA1 IIIGRRNEVVITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 IIIGRRNEVVITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKGL 850 860 870 880 890 900 900 910 920 930 940 950 pF1KA1 SNYAVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNSNSGPNEIGNFGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SNYAVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNSNSGPNEIGNFGR 910 920 930 940 950 960 960 970 980 990 1000 1010 pF1KA1 GDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQATPYATTQILHSNSIHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQATPYATTQILHSNSIHE 970 980 990 1000 1010 1020 1020 1030 1040 1050 1060 1070 pF1KA1 LAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKNKNSSKPQKNNGSTWA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKNKNSSKPQKNNGSTWA 1030 1040 1050 1060 1070 1080 1080 1090 1100 1110 1120 1130 pF1KA1 NVPLPPPPVQPLPGTELEHYAVEQQENGYDSDSWCPPLPVQTYLHQGLEDELEEDDDRVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NVPLPPPPVQPLPGTELEHYAVEQQENGYDSDSWCPPLPVQTYLHQGLEDELEEDDDRVP 1090 1100 1110 1120 1130 1140 1140 1150 1160 1170 1180 1190 pF1KA1 TPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQAHLDELTRAYQFDIAKQTWHIQSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQAHLDELTRAYQFDIAKQTWHIQSN 1150 1160 1170 1180 1190 1200 1200 1210 1220 1230 1240 1250 pF1KA1 NQPPQPPVPPLGYVSGALISDLETDVADDDADDEEEALEIPRPLRALDQTPGSSMDNLDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NQPPQPPVPPLGYVSGALISDLETDVADDDADDEEEALEIPRPLRALDQTPGSSMDNLDS 1210 1220 1230 1240 1250 1260 1260 1270 1280 1290 1300 1310 pF1KA1 SVTGKAFTSSQRPRPTSPFSTDSNTSAALSQSQRPRPTKKHKGGRMDQQPALPHRREGMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SVTGKAFTSSQRPRPTSPFSTDSNTSAALSQSQRPRPTKKHKGGRMDQQPALPHRREGMT 1270 1280 1290 1300 1310 1320 1320 1330 1340 1350 1360 1370 pF1KA1 DEEALVPYSKPSFPSPGGHSSSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 DEEALVPYSKPSFPSPGGHSSSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNS 1330 1340 1350 1360 1370 1380 pF1KA1 QGQFTGEL :::::::: CCDS54 QGQFTGEL 1390 >>CCDS54610.1 ROBO1 gene_id:6091|Hs108|chr3 (1551 aa) initn: 3986 init1: 1608 opt: 4138 Z-score: 2491.4 bits: 473.6 E(32554): 1.9e-132 Smith-Waterman score: 4771; 53.7% identity (75.2% similar) in 1422 aa overlap (5-1332:10-1399) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAE .: . ::. :::::::::::::::::::.:::::::.::::::: CCDS54 MIAEPAHFYLFGLICLCS-------GSRLRQEDFPPRIVEHPSDLIVSKGEPATLNCKAE 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 GRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNY ::::::::::: ::::::::::::::::::::::::::::::::.:.:::: :::::::: CCDS54 GRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYVCVARNY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 LGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKDKVRID ::::::.:::::::.:::::::::.::.::.::::..::::::::::::: :::: .: CCDS54 LGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKKDGSPLD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 DKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRRPINQV ::.:::.::::::::. ::::::: :.::::::::::.:. :::::.:::.:..:: : . CCDS54 DKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVKRPSNLA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KA1 VLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGTYMCIA : ....::.:...::: :::::.:::..::..::.:.::.::.:.:. . : :.: :.: CCDS54 VTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMGSYTCVA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KA1 ENRVGKMEASATLTVRA---PPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKEGS :: ::: ::::::::.. ::.:::.::::.:: :::::: ::. ::::::.::..::: CCDS54 ENMVGKAEASATLTVQVGSEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIFWRREGS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KA1 QNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTDVL ::::: :: : .:: ::: ::::::::.::::.::::::.:.:::::..:: ::::::. CCDS54 QNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYLEVTDVI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KA1 TDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQGT .:::::.: :::.:::.::::: .:.: :::.:.:.: : :.: .: : :.:. CCDS54 ADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIKQLENGV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KA1 LQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTESGATIS--KNYDLSDLPGPPSKPQV :::. ...::: :::.:.. :::..::: ..: : :. .. . : . .:. ::::.: CCDS54 LQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQEFGVPVQPPRPTDPNLIPSAPSKPEV 480 490 500 510 520 530 540 550 560 570 580 pF1KA1 TDVTKNSVTLSWQPG-TPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRPNT :::..:.:::::::. . :. :.: :::::::.. ..::::::..::: ...::.::. CCDS54 TDVSRNTVTLSWQPNLNSGATPTS-YIIEAFSHASGSSWQTVAENVKTETSAIKGLKPNA 540 550 560 570 580 590 590 600 610 620 630 640 pF1KA1 IYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTP ::::.::: : :.:::: .::::.:::. : .:::::.:::.:::.....::::.::. CCDS54 IYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHNPTVLSS 600 610 620 630 640 650 650 660 670 680 690 700 pF1KA1 TTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYE ....: ::::.: :.::::...:: ... .. :.: .....:.. :.:. .:.:::.:: CCDS54 SSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLRKGVNYE 660 670 680 690 700 710 710 720 730 740 750 760 pF1KA1 IKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQN ::.::.:::::: ::: : ..: :::::::::.::: . .. :.:.: :::.::: : :: CCDS54 IKARPFFNEFQGADSEIKFAKTLEEAPSAPPQGVTV-SKNDGNGTAILVSWQPPPEDTQN 720 730 740 750 760 770 770 780 790 800 810 820 pF1KA1 GIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQ :..::::.::::::::.:::::::.. ::.: : :::.: :::::::.:: ::::::: CCDS54 GMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGSGVKSEPQ 780 790 800 810 820 830 830 840 850 860 870 880 pF1KA1 PIIIGRRNEVVITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKG : . ... : :.. :...::.:::::::::::::.:::.::: :::::: .::::.: CCDS54 FIQLDAHGNPVSPEDQVSLAQQISDVVKQPAFIAGIGAACWIILMVFSIWLYRHRKKRNG 840 850 860 870 880 890 890 900 910 920 930 940 pF1KA1 L-SNYA----VTFQRGDGGLMSNGSRPGLLNAGDPS-YPWLADSWPATSLPVNNSNSGPN : :.:: ::.::: : .:.:.:::::: ..:. :::::.:: :. :. . . CCDS54 LTSTYAGIRKVTYQRG-GEAVSSGGRPGLLNISEPAAQPWLADTWPNTGNNHNDCSISCC 900 910 920 930 940 950 950 960 970 980 990 pF1KA1 EIGNFGRGD---VLPPVPGQGDKTATM------LSDGAIYSSIDFTTKTSYNSSSQITQA :: : .: . ::: :: ::.. .: : . . .. .: : CCDS54 TAGN-GNSDSNLTTYSRPGQPTPYATTQLIQSNLSNNMNNGSGD-SGEKHWKPLGQQKQE 960 970 980 990 1000 1000 1010 1020 1030 1040 1050 pF1KA1 TPYATTQILHSNSIHE--LAVDLPDPQ--WKSSIQQKTDLMGFGYSLPDQNKGNNGGKGG . . .:...:.... : : : ...: .:.: : .:. :......:..: CCDS54 VAPVQYNIVEQNKLNKDYRANDTVPPTIPYNQSYDQNT---GGSYNSSDRGSSTSGSQG- 1010 1020 1030 1040 1050 1060 1060 1070 1080 1090 1100 1110 pF1KA1 KKKKNKNSSKPQKNNGSTWANVPLPPPPVQPLPGTELEHYAVEQQENGYDSDSWCPPLPV .::. . : :..: .::.. :::::..: : .. :.: . .:. ::.. :: :. CCDS54 -HKKGARTPKVPKQGGMNWADL-LPPPPAHPPPHSNSEEYNISVDES-YDQEMPCPVPPA 1070 1080 1090 1100 1110 1120 1120 1130 1140 1150 1160 pF1KA1 QTYLHQGLEDELEEDDD-RVPTPPVRGVASSPA-ISFGQQSTATLTPSPREEMQPMLQAH . ::.: :::::..: : :::::::.::::: .:...::::::::::.::.::::: CCDS54 RMYLQQ---DELEEEEDERGPTPPVRGAASSPAAVSYSHQSTATLTPSPQEELQPMLQDC 1130 1140 1150 1160 1170 1170 1180 1190 1200 1210 1220 pF1KA1 LDELTRAYQFDIAKQTWHIQSNNQPPQPPVPP--LGYVSGALISDLETDVAD---DDADD .: : .: . .. . : ::.: :: ::.:: :.::..::. . :.:: CCDS54 PEE-TGHMQHQPDRRRQPV-SPPPPPRPISPPHTYGYISGPLVSDMDTDAPEEEEDEADM 1180 1190 1200 1210 1220 1230 1230 1240 1250 pF1KA1 EEEALEIPRPL-RALDQTPGSSMDNLDSSVTG---------------------------- : .. : : :.:.:::.::. .:.::::: CCDS54 EVAKMQTRRLLLRGLEQTPASSVGDLESSVTGSMINGWGSASEEDNISSGRSSVSSSDGS 1240 1250 1260 1270 1280 1290 1260 1270 1280 pF1KA1 ---------------------------------KAFTSSQRPRPTSPFSTDSNTSAALSQ . : .:: :::::: ::::: :::. : CCDS54 FFTDADFAQAVAAAAEYAGLKVARRQMQDAAGRRHFHASQCPRPTSPVSTDSNMSAAVMQ 1300 1310 1320 1330 1340 1350 1290 1300 1310 1320 1330 1340 pF1KA1 SQRPRPTKKHKGGRMDQQPALPHRREGMTDEEALVPYSKPSFPSPGGHSSSGTASSKGST . :: ::. :.. ::: .::. : :.. :: ..:.. CCDS54 KTRPAKKLKHQPGHL--------RRETYTDDLPPPPVPPPAIKSPTAQSKTQLEVRPVVV 1360 1370 1380 1390 1400 1350 1360 1370 pF1KA1 GPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL CCDS54 PKLPSMDARTDRSSDRKGSSYKGREVLDGRQVVDMRTNPGDPREAQEQQNDGKGRGNKAA 1410 1420 1430 1440 1450 1460 >>CCDS46872.2 ROBO1 gene_id:6091|Hs108|chr3 (1606 aa) initn: 3986 init1: 1608 opt: 4100 Z-score: 2468.5 bits: 469.4 E(32554): 3.6e-131 Smith-Waterman score: 4752; 54.9% identity (77.6% similar) in 1361 aa overlap (5-1279:10-1352) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAE .: . ::. :::::::::::::::::::.:::::::.::::::: CCDS46 MIAEPAHFYLFGLICLCS-------GSRLRQEDFPPRIVEHPSDLIVSKGEPATLNCKAE 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 GRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNY ::::::::::: ::::::::::::::::::::::::::::::::.:.:::: :::::::: CCDS46 GRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYVCVARNY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 LGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKDKVRID ::::::.:::::::.:::::::::.::.::.::::..::::::::::::: :::: .: CCDS46 LGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKKDGSPLD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 DKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRRPINQV ::.:::.::::::::. ::::::: :.::::::::::.:. :::::.:::.:..:: : . CCDS46 DKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVKRPSNLA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KA1 VLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGTYMCIA : ....::.:...::: :::::.:::..::..::.:.::.::.:.:. . : :.: :.: CCDS46 VTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMGSYTCVA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KA1 ENRVGKMEASATLTVRA---PPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKEGS :: ::: ::::::::.. ::.:::.::::.:: :::::: ::. ::::::.::..::: CCDS46 ENMVGKAEASATLTVQVGSEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIFWRREGS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KA1 QNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTDVL ::::: :: : .:: ::: ::::::::.::::.::::::.:.:::::..:: ::::::. CCDS46 QNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYLEVTDVI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KA1 TDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQGT .:::::.: :::.:::.::::: .:.: :::.:.:.: : :.: .: : :.:. CCDS46 ADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIKQLENGV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KA1 LQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTESGATIS--KNYDLSDLPGPPSKPQV :::. ...::: :::.:.. :::..::: ..: : :. .. . : . .:. ::::.: CCDS46 LQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQEFGVPVQPPRPTDPNLIPSAPSKPEV 480 490 500 510 520 530 540 550 560 570 580 pF1KA1 TDVTKNSVTLSWQPG-TPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRPNT :::..:.:::::::. . :. :.: :::::::.. ..::::::..::: ...::.::. CCDS46 TDVSRNTVTLSWQPNLNSGATPTS-YIIEAFSHASGSSWQTVAENVKTETSAIKGLKPNA 540 550 560 570 580 590 590 600 610 620 630 640 pF1KA1 IYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTP ::::.::: : :.:::: .::::.:::. : .:::::.:::.:::.....::::.::. CCDS46 IYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHNPTVLSS 600 610 620 630 640 650 650 660 670 680 690 700 pF1KA1 TTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYE ....: ::::.: :.::::...:: ... .. :.: .....:.. :.:. .:.:::.:: CCDS46 SSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLRKGVNYE 660 670 680 690 700 710 710 720 730 740 750 760 pF1KA1 IKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQN ::.::.:::::: ::: : ..: :::::::::.::: . .. :.:.: :::.::: : :: CCDS46 IKARPFFNEFQGADSEIKFAKTLEEAPSAPPQGVTV-SKNDGNGTAILVSWQPPPEDTQN 720 730 740 750 760 770 770 780 790 800 810 820 pF1KA1 GIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQ :..::::.::::::::.:::::::.. ::.: : :::.: :::::::.:: ::::::: CCDS46 GMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGSGVKSEPQ 780 790 800 810 820 830 830 840 850 860 870 880 pF1KA1 PIIIGRRNEVVITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKG : . ... : :.. :...::.:::::::::::::.:::.::: :::::: .::::.: CCDS46 FIQLDAHGNPVSPEDQVSLAQQISDVVKQPAFIAGIGAACWIILMVFSIWLYRHRKKRNG 840 850 860 870 880 890 890 900 910 920 930 pF1KA1 L-SNYA----VTFQRGDGGLMSNGSRPGLLNAGDPS-YPWLADSWPATSLPVN------- : :.:: ::.::: : .:.:.:::::: ..:. :::::.:: :. : CCDS46 LTSTYAGIRKVTYQRG-GEAVSSGGRPGLLNISEPAAQPWLADTWPNTGNNHNDCSISCC 900 910 920 930 940 950 940 950 960 970 980 pF1KA1 ---NSNSGPNEIGNFGR-GDVLPPVPGQGD--KTATMLSDGAIYSSIDFTTKT----SYN :.:: : . ...: .: . .: : .: :: ....:...:...: ..: CCDS46 TAGNGNSDSN-LTTYSRPADCIANYNNQLDNKQTNLMLPESTVYGDVDLSNKINEMKTFN 960 970 980 990 1000 990 1000 1010 1020 1030 pF1KA1 SSSQIT--------QATPYATTQILHSN---SIHELAVDLPDPQWKSSIQQKTDLMGFGY : . : :::::::...:: .... . : . .:: ::: .. : CCDS46 SPNLKDGRFVNPSGQPTPYATTQLIQSNLSNNMNNGSGDSGEKHWKPLGQQKQEVAPVQY 1010 1020 1030 1040 1050 1060 1040 1050 1060 pF1KA1 SLPDQNK----------------------GNNGG------KG----GKKKKNKNSSKPQ- .. .::: :.:: .: :.. ..:.. :. CCDS46 NIVEQNKLNKDYRANDTVPPTIPYNQSYDQNTGGSYNSSDRGSSTSGSQGHKKGARTPKV 1070 1080 1090 1100 1110 1120 1070 1080 1090 1100 1110 1120 pF1KA1 -KNNGSTWANVPLPPPPVQPLPGTELEHYAVEQQENGYDSDSWCPPLPVQTYLHQGLEDE :..: .::.. :::::..: : .. :.: . .:. ::.. :: :.. ::.: :: CCDS46 PKQGGMNWADL-LPPPPAHPPPHSNSEEYNISVDES-YDQEMPCPVPPARMYLQQ---DE 1130 1140 1150 1160 1170 1180 1130 1140 1150 1160 1170 pF1KA1 LEEDDD-RVPTPPVRGVASSPA-ISFGQQSTATLTPSPREEMQPMLQAHLDELTRAYQFD :::..: : :::::::.::::: .:...::::::::::.::.::::: : : .: . CCDS46 LEEEEDERGPTPPVRGAASSPAAVSYSHQSTATLTPSPQEELQPMLQ-DCPEETGHMQHQ 1190 1200 1210 1220 1230 1240 1180 1190 1200 1210 1220 1230 pF1KA1 IAKQTWHIQSNNQPPQPPVPP--LGYVSGALISDLETDVAD---DDADDEEEALEIPRPL .. . : ::.: :: ::.:: :.::..::. . :.:: : .. : : CCDS46 PDRRRQPV-SPPPPPRPISPPHTYGYISGPLVSDMDTDAPEEEEDEADMEVAKMQTRRLL 1250 1260 1270 1280 1290 1300 1240 1250 1260 1270 1280 pF1KA1 -RALDQTPGSSMDNLDSSVTGKAF----TSSQRPRPTSPFSTDSNTSAALSQSQRPRPTK :.:.:::.::. .:.:::::. . ..:.. .: :. :...... CCDS46 LRGLEQTPASSVGDLESSVTGSMINGWGSASEEDNISSGRSSVSSSDGSFFTDADFAQAV 1310 1320 1330 1340 1350 1360 1290 1300 1310 1320 1330 1340 pF1KA1 KHKGGRMDQQPALPHRREGMTDEEALVPYSKPSFPSPGGHSSSGTASSKGSTGPRKTEVL CCDS46 AAAAEYAGLKVARRQMQDAAGRRHFHASQCPRPTSPVSTDSNMSAAVMQKTRPAKKLKHQ 1370 1380 1390 1400 1410 1420 >>CCDS54611.1 ROBO1 gene_id:6091|Hs108|chr3 (1651 aa) initn: 4052 init1: 2501 opt: 4053 Z-score: 2440.2 bits: 464.2 E(32554): 1.3e-129 Smith-Waterman score: 4748; 55.1% identity (77.6% similar) in 1351 aa overlap (21-1279:58-1397) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTL :::::::::::::::::::.:::::::.:: CCDS54 IPDPEDVERGNDHGTPIPTSDNDDNSLGYTGSRLRQEDFPPRIVEHPSDLIVSKGEPATL 30 40 50 60 70 80 60 70 80 90 100 110 pF1KA1 NCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVC :::::::::::::::: ::::::::::::::::::::::::::::::::.:.:::: ::: CCDS54 NCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYVC 90 100 110 120 130 140 120 130 140 150 160 170 pF1KA1 VARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKD :::::::::::.:::::::.:::::::::.::.::.::::..::::::::::::: :::: CCDS54 VARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKKD 150 160 170 180 190 200 180 190 200 210 220 230 pF1KA1 KVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRR .:::.:::.::::::::. ::::::: :.::::::::::.:. :::::.:::.:..: CCDS54 GSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVKR 210 220 230 240 250 260 240 250 260 270 280 290 pF1KA1 PINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDEGT : : .: ....::.:...::: :::::.:::..::..::.:.::.::.:.:. . : :. CCDS54 PSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMGS 270 280 290 300 310 320 300 310 320 330 340 350 pF1KA1 YMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKE : :.::: ::: ::::::::. ::.:::.::::.:: :::::: ::. ::::::.::..: CCDS54 YTCVAENMVGKAEASATLTVQEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIFWRRE 330 340 350 360 370 380 360 370 380 390 400 410 pF1KA1 GSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTD ::::::: :: : .:: ::: ::::::::.::::.::::::.:.:::::..:: ::::: CCDS54 GSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYLEVTD 390 400 410 420 430 440 420 430 440 450 460 470 pF1KA1 VLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQ :..:::::.: :::.:::.::::: .:.: :::.:.:.: : :.: .: : :. CCDS54 VIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIKQLEN 450 460 470 480 490 500 480 490 500 510 520 pF1KA1 GTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTESGATIS--KNYDLSDLPGPPSKP :.:::. ...::: :::.:.. :::..::: ..: : :. .. . : . .:. :::: CCDS54 GVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQEFGVPVQPPRPTDPNLIPSAPSKP 510 520 530 540 550 560 530 540 550 560 570 580 pF1KA1 QVTDVTKNSVTLSWQPG-TPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRP .::::..:.:::::::. . :. :.: :::::::.. ..::::::..::: ...::.: CCDS54 EVTDVSRNTVTLSWQPNLNSGATPTS-YIIEAFSHASGSSWQTVAENVKTETSAIKGLKP 570 580 590 600 610 620 590 600 610 620 630 640 pF1KA1 NTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVL :.::::.::: : :.:::: .::::.:::. : .:::::.:::.:::.....::::.:: CCDS54 NAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHNPTVL 630 640 650 660 670 680 650 660 670 680 690 700 pF1KA1 TPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVT . ....: ::::.: :.::::...:: ... .. :.: .....:.. :.:. .:.:::. CCDS54 SSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLRKGVN 690 700 710 720 730 740 710 720 730 740 750 760 pF1KA1 YEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDH ::::.::.:::::: ::: : ..: :::::::::.::: . .. :.:.: :::.::: : CCDS54 YEIKARPFFNEFQGADSEIKFAKTLEEAPSAPPQGVTV-SKNDGNGTAILVSWQPPPEDT 750 760 770 780 790 800 770 780 790 800 810 820 pF1KA1 QNGIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSE :::..::::.::::::::.:::::::.. ::.: : :::.: :::::::.:: ::::: CCDS54 QNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGSGVKSE 810 820 830 840 850 860 830 840 850 860 870 880 pF1KA1 PQPIIIGRRNEVVITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKR :: : . ... : :.. :...::.:::::::::::::.:::.::: :::::: .:::: CCDS54 PQFIQLDAHGNPVSPEDQVSLAQQISDVVKQPAFIAGIGAACWIILMVFSIWLYRHRKKR 870 880 890 900 910 920 890 900 910 920 930 pF1KA1 KGL-SNYA-------------VTFQRGDGGLMSNGSRPGLLNAGDPS-YPWLADSWPATS .:: :.:: ::.::: : .:.:.:::::: ..:. :::::.:: :. CCDS54 NGLTSTYAGIRKVPSFTFTPTVTYQRG-GEAVSSGGRPGLLNISEPAAQPWLADTWPNTG 930 940 950 960 970 980 940 950 960 970 pF1KA1 LPVN----------NSNSGPNEIGNFGR-GDVLPPVPGQGD--KTATMLSDGAIYSSIDF : :.:: : . ...: .: . .: : .: :: ....:...:. CCDS54 NNHNDCSISCCTAGNGNSDSN-LTTYSRPADCIANYNNQLDNKQTNLMLPESTVYGDVDL 990 1000 1010 1020 1030 1040 980 990 1000 1010 1020 pF1KA1 TTKT----SYNSSSQIT--------QATPYATTQILHSN---SIHELAVDLPDPQWKSSI ..: ..:: . : :::::::...:: .... . : . .:: CCDS54 SNKINEMKTFNSPNLKDGRFVNPSGQPTPYATTQLIQSNLSNNMNNGSGDSGEKHWKPLG 1050 1060 1070 1080 1090 1100 1030 1040 1050 pF1KA1 QQKTDLMGFGYSLPDQNK----------------------GNNGG------KG----GKK ::: .. :.. .::: :.:: .: :.. CCDS54 QQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYNQSYDQNTGGSYNSSDRGSSTSGSQ 1110 1120 1130 1140 1150 1160 1060 1070 1080 1090 1100 1110 pF1KA1 KKNKNSSKPQ--KNNGSTWANVPLPPPPVQPLPGTELEHYAVEQQENGYDSDSWCPPLPV ..:.. :. :..: .::.. :::::..: : .. :.: . .:. ::.. :: :. CCDS54 GHKKGARTPKVPKQGGMNWADL-LPPPPAHPPPHSNSEEYNISVDES-YDQEMPCPVPPA 1170 1180 1190 1200 1210 1220 1120 1130 1140 1150 1160 pF1KA1 QTYLHQGLEDELEEDDD-RVPTPPVRGVASSPA-ISFGQQSTATLTPSPREEMQPMLQAH . ::.: :::::..: : :::::::.::::: .:...::::::::::.::.::::: CCDS54 RMYLQQ---DELEEEEDERGPTPPVRGAASSPAAVSYSHQSTATLTPSPQEELQPMLQ-D 1230 1240 1250 1260 1270 1170 1180 1190 1200 1210 1220 pF1KA1 LDELTRAYQFDIAKQTWHIQSNNQPPQPPVPP--LGYVSGALISDLETDVAD---DDADD : : .: . .. . : ::.: :: ::.:: :.::..::. . :.:: CCDS54 CPEETGHMQHQPDRRRQPV-SPPPPPRPISPPHTYGYISGPLVSDMDTDAPEEEEDEADM 1280 1290 1300 1310 1320 1330 1230 1240 1250 1260 1270 pF1KA1 EEEALEIPRPL-RALDQTPGSSMDNLDSSVTGKAF----TSSQRPRPTSPFSTDSNTSAA : .. : : :.:.:::.::. .:.:::::. . ..:.. .: :. :..... CCDS54 EVAKMQTRRLLLRGLEQTPASSVGDLESSVTGSMINGWGSASEEDNISSGRSSVSSSDGS 1340 1350 1360 1370 1380 1390 1280 1290 1300 1310 1320 1330 pF1KA1 LSQSQRPRPTKKHKGGRMDQQPALPHRREGMTDEEALVPYSKPSFPSPGGHSSSGTASSK . CCDS54 FFTDADFAQAVAAAAEYAGLKVARRQMQDAAGRRHFHASQCPRPTSPVSTDSNMSAAVMQ 1400 1410 1420 1430 1440 1450 >>CCDS44755.1 ROBO3 gene_id:64221|Hs108|chr11 (1386 aa) initn: 3435 init1: 2137 opt: 3375 Z-score: 2035.1 bits: 389.0 E(32554): 4.9e-107 Smith-Waterman score: 3654; 44.6% identity (68.5% similar) in 1366 aa overlap (19-1346:52-1364) 10 20 30 40 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPT ..:::. :: :::::.: :..::.:::. CCDS44 DISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPA 30 40 50 60 70 80 50 60 70 80 90 100 pF1KA1 TLNCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSY :: :.::::: :.:::::.: :: : ..:::.::.:::::.::: :::::::..:::: : CCDS44 TLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVY 90 100 110 120 130 140 110 120 130 140 150 160 pF1KA1 VCVARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWK .:::::::: :.:::::::::.:::::::.: .::::.::::.::: ::::::::.. :. CCDS44 TCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWR 150 160 170 180 190 200 170 180 190 200 210 220 pF1KA1 KDKVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFL :: .:. ..: ::.:::::::.:.: :::::::.::..::.:::.: ::. :.:::.:: CCDS44 KDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFL 210 220 230 240 250 260 230 240 250 260 270 280 pF1KA1 RRPINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDE :::.::::: . : : :.:.::: : .::.:.:..:: :::.:..:..: : .. . :: CCDS44 RRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDE 270 280 290 300 310 320 290 300 310 320 330 340 pF1KA1 GTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQ ::: :.::: ::. :::..:.:..:::.:..:.::..: :..:.: ::::::: ::.::: CCDS44 GTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIFWQ 330 340 350 360 370 380 350 360 370 380 390 400 pF1KA1 KEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEV ::::: ::::.: ::..: :::: :.:.:: .::.:::::.:::..::::::::: ::. CCDS44 KEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALLEI 390 400 410 420 430 440 410 420 430 440 450 460 pF1KA1 TDVLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQ . : ::.::::::::::.. ... : :..::.: : . : :.: . : : . . CCDS44 KGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFKTM 450 460 470 480 490 500 470 480 490 500 510 520 pF1KA1 EQGTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTES-GATISKNYDLSDLPGPPSK .::: : :.. : : :.::: ::.::..::. : . :. :.. . . :. :: ::. CCDS44 ANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPPTEPSSPPGAPSQ 510 520 530 540 550 560 530 540 550 560 570 580 pF1KA1 PQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRP : ::..::::.::.:.:. ...:.::::: ...:.:.:::. :. .:: ::.: CCDS44 PVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVSGLQP 570 580 590 600 610 620 590 600 610 620 630 640 pF1KA1 NTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVL ::::::.:::.. :::.:::.:.:::::: :: : . :. :..: :::..:.:: CCDS44 NTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQEPIVL 630 640 650 660 670 680 650 660 670 680 690 700 pF1KA1 TPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVT : :.::.:::: :..::.:: .: ..: .. .:: :: . :...:.:: .: :. CCDS44 GPRTLQVSWTVDGPVQLVQGFRVSWR-VAGPEG-GSWTMLDLQSPSQQSTVLRGLPPGTQ 690 700 710 720 730 710 720 730 740 750 760 pF1KA1 YEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDH .:::. .: : .: : : :::::.:::.:.: :. :: ::.:::.:: :.. CCDS44 IQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALGGDGNS-SITVSWEPPLPSQ 740 750 760 770 780 790 770 780 790 800 810 820 pF1KA1 QNGIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSE :::.: ::.:::::::.:::.:... . ::... :: ::. ::. :::.::::::: : CCDS44 QNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGVGVPSA 800 810 820 830 840 850 830 840 850 860 870 880 pF1KA1 PQPIIIGRRNEVVI-TENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKK : . . .. : . ... ... :...:::.:: :.:: ..:.:. ::::::. CCDS44 PVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAALYWRRKQ 860 870 880 890 900 910 890 900 910 920 930 pF1KA1 RKGLSNY--------AVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNS :: ::.: ::.: ...: : . .::: . . : : ::::::: : . : CCDS44 RKELSHYTASFAYTPAVSFPHSEG-LSGASSRPPM-GLGPAPYSWLADSWPHPSR--SPS 920 930 940 950 960 970 940 950 960 970 980 990 pF1KA1 NSGPNEIGNFGRGDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQAT--P . : ::. : : :. . ....: . :.. . . . .: : CCDS44 AQEP-------RGSCCPSNPDPDDR---YYNEAGISLYLAQTARGTAAPGEGPVYSTIDP 980 990 1000 1010 1020 1000 1010 1020 1030 1040 1050 pF1KA1 YATT-QILHSNSIHELAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKN . : .:.. .. . :: : :.. :. :. ..:..:.:::: : CCDS44 AGEELQTFHGGFPQHPSGDL-GP-WSQ------------YAPPEWSQGDSGAKGGKVKL- 1030 1040 1050 1060 1060 1070 1080 1090 1100 1110 pF1KA1 KNSSKPQKNNGSTWANVPLPPPPVQPLPGTELE--HYAVEQQENGYDSDSWCPPLPVQTY .:: . . .: .. ::::: :. :: . :. :.. . . ::::.: ... CCDS44 --LGKPVQMPSLNWPEA-LPPPP----PSCELSCLEGPEEELEGSSEPEEWCPPMPERSH 1070 1080 1090 1100 1110 1120 1120 1130 1140 1150 1160 1170 pF1KA1 LHQGLEDELEEDDDRVPTPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQA-HLDEL : . .. . : : . ::. :.:::::::::::: . :: . :: .. CCDS44 LTE------PSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQM 1130 1140 1150 1160 1170 1180 1190 1200 1210 1220 pF1KA1 TRAYQFDIAKQTWHIQSNNQPPQP--PVPPLGYVSGALISD-LETDVADDDADDE----- : . .. : .:: . : : .: : : . : . :.. CCDS44 PRRVPLGPSSPL----SVSQPMLGIREARPAGLGAGPAASPHLSPSPAPSTASSAPGRTW 1180 1190 1200 1210 1220 1230 1230 1240 1250 1260 1270 1280 pF1KA1 EEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTSSQR--PRPTSPFSTDSNTSAALSQS . :. :: : : . . . ... . .: : : : ... . : . CCDS44 QGNGEMTPPL----QGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEEASWALELRAA 1240 1250 1260 1270 1280 1290 1300 1310 1320 1330 pF1KA1 QRPRPTKKHKGGRMDQQPALP--HRREGMTDEEALVPYSKPSFPS----------PGGHS .....:. :.: .: :::: .:::.::: : :..: CCDS44 GSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCSTAGSNS 1290 1300 1310 1320 1330 1340 1340 1350 1360 1370 pF1KA1 SSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL : :..::.:: :: .. CCDS44 SRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR 1350 1360 1370 1380 >>CCDS11952.1 DCC gene_id:1630|Hs108|chr18 (1447 aa) initn: 410 init1: 186 opt: 648 Z-score: 402.0 bits: 86.9 E(32554): 4.5e-16 Smith-Waterman score: 762; 27.2% identity (51.8% similar) in 929 aa overlap (30-828:139-1036) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAEGRPT : :.. . .: . :. . :.:.. :.: CCDS11 KPDEGLYQCEASLGDSGSIISRTAKVAVAGPLRFLSQTESVTAFMGDTVLLKCEVIGEPM 110 120 130 140 150 160 60 70 80 90 100 110 pF1KA1 PTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNYLGEA :::.: :. . . : : ..::::.: . :. : : : : : ::: : CCDS11 PTIHWQKNQQDLTPIPGDSRV--VVLPSGALQISRLQPG-----DIGIYRCSARN---PA 170 180 190 200 210 120 130 140 150 160 170 pF1KA1 VSRNAS-LEVALLRDD-------FRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKDK ::... :: .: : : : :..::. :. :.::: :.: :.. : . . CCDS11 SSRTGNEAEVRILSDPGLHRQLYFLQRPSNVVAIEGKDAVLECCVS-GYPPPSFTWLRGE 220 230 240 250 260 270 180 190 200 210 220 230 pF1KA1 VRIDDKEERISIRGGK-LMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFLRR :. . .. :. ::. :.:::. .:.:::::: : . .: : :::::. : :: . CCDS11 EVIQLRSKKYSLLGGSNLLISNVTDDDSGMYTCVVT-YKNENISASAELTVLVPPWFLNH 280 290 300 310 320 330 240 250 260 270 280 pF1KA1 PINQVVLEEEAVEFRCQVQGDPQPTVRWKKD-DADLPRGRYDIKDDYTLRIKKTMSTDEG : : . : .::.: :.: : ::: : :. :. .: ..: .::: ....::: CCDS11 PSNLYAYESMDIEFECTVSGKPVPTVNWMKNGDVVIPSDYFQIVGGSNLRILGVVKSDEG 340 350 360 370 380 390 290 300 310 320 330 pF1KA1 TYMCIAENRVGKMEASATLTVRAP--PQFVV---RPRD--QIVAQGRTVTF----PCETK :.:.:::..:. ..:: : : : :. : ::: .....: : . : :.: CCDS11 FYQCVAENEAGNAQTSAQLIVPKPAIPSSSVLPSAPRDVVPVLVSSRFVRLSWRPPAEAK 400 410 420 430 440 450 340 350 360 370 380 pF1KA1 GNPQP-AVFWQKEGSQNLLFPNQPQQPNSRCSVS---PTGDLTITNIQRSDAG------- :: : .::...::.. : : . . .:. : . :. . .. : CCDS11 GNIQTFTVFFSREGDNRERALNTTQPGSLQLTVGNLKPEAMYTFRVVAYNEWGPGESSQP 460 470 480 490 500 510 390 400 410 420 pF1KA1 -YYICQA-LTVAGSI--LAKAQLEVTDVLTDRPPPIILQGPAN--------------QTL : : : : . : .. :..: :: .::.. :.. CCDS11 IKVATQPELQVPGPVENLQAVSTSPTSILITWEPPAYANGPVQGYRLFCTEVSTGKEQNI 520 530 540 550 560 570 430 440 pF1KA1 AVDGTAL------------LKCKA--------TGDPLPVI-------------------- ::: . :. : . : . :. CCDS11 EVDGLSYKLEGLKKFTEYSLRFLAYNRYGPGVSTDDITVVTLSDVPSAPPQNVSLEVVNS 580 590 600 610 620 630 450 460 470 480 pF1KA1 -----SWL------KEGFT--FPGRDPRATIQ-EQGTLQIKNLRISDTG-------TYTC ::: ..:: . : ..: . :. ::. .:: :: .. CCDS11 RSIKVSWLPPPSGTQNGFITGYKIRHRKTTRRGEMETLEPNNLWYLFTGLEKGSQYSFQV 640 650 660 670 680 690 490 500 510 520 530 540 pF1KA1 VATSSSGE---TSWSAVLDVTESGATISKNYDLSDLPGPPSKPQVTDVTKNSVTLSWQPG : . .: ..: .. : .. : :..: ::. .: : : . .:: : CCDS11 SAMTVNGTGPPSNWY-------TAETPENDLDESQVPDQPSSLHVRPQT-NCIIMSWTPP 700 710 720 730 740 550 560 570 580 590 600 pF1KA1 TPGTLPASAYIIEAFSQSVSNSW-QTVANHVKTTLYTVRGLRPNTIYLFMVRAINPQGLS .. . .::: . .:.. . .:: : :... :. .. :.. ..:.: : CCDS11 LNPNIVVRGYII---GYGVGSPYAETVRVDSKQRYYSIERLESSSHYVISLKAFNNAG-- 750 760 770 780 790 800 610 620 630 640 650 pF1KA1 DPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNP---------VVLTPTTVQVT . :. . . :..:. :.. ::. . .. . : .: :.:: .:.:. CCDS11 EGVPLYESATTRSITDPTDPVDYYPLLDDFPTSVPDLSTPMLPPVGVQAVALTHDAVRVS 810 820 830 840 850 860 660 670 680 690 700 710 pF1KA1 WTVDRQPQFIQGYRV-MY--RQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVTYEIKV :. . :. . .: .: : ....:...... :. : : . ..:: .. ::..: CCDS11 WADNSVPKNQKTSEVRLYTVRWRTSFSASAKYKSEDT---TSLSYTATGLKPNTMYEFSV 870 880 890 900 910 920 720 730 740 750 760 770 pF1KA1 RPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDHQNGII :. .. : . . : : ::.. :...::.: . . .. :::.:: . :: : CCDS11 MVTKNRRSSTWSMTAHATTYEAAPTSAPKDLTVITREG-KPRAVIVSWQPP--LEANGKI 930 940 950 960 970 780 790 800 810 820 pF1KA1 QEYKI-WCLGNETRFH--INKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSEPQ : . . : .. . : .:... . : : .: .. : .: ::: :.: CCDS11 TAYILFYTLDKNIPIDDWIMETISGDRLTHQIMDLNLDTMYYFRIQARNSKGVGPLSDPI 980 990 1000 1010 1020 1030 830 840 850 860 870 880 pF1KA1 PIIIGRRNEVVITENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKKRKG CCDS11 LFRTLKVEHPDKMANDQGRHGDGGYWPVDTNLIDRSTLNEPPIGQMHPPHGSVTPQKNSN 1040 1050 1060 1070 1080 1090 >>CCDS42929.1 DSCAM gene_id:1826|Hs108|chr21 (2012 aa) initn: 390 init1: 209 opt: 622 Z-score: 384.7 bits: 84.2 E(32554): 4.2e-15 Smith-Waterman score: 897; 26.2% identity (51.8% similar) in 1117 aa overlap (27-1076:403-1431) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAEG :: :.:. :. .:: .::..: :...: CCDS42 DHMVKSDGGAYQCFVRKDKLSAQDYVQVVLEDGTPKIISAFSEKVVSPAEPVSLMCNVKG 380 390 400 410 420 430 60 70 80 90 100 110 pF1KA1 RPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNYL : ::: : : . . . : .:. :.. . . . . : : : :.: : CCDS42 TPLPTITWTLDDDPI-LKGGSHRISQMITSEGNVVSYLNISSSQVR-DGGVYRCTANNSA 440 450 460 470 480 490 120 130 140 150 160 170 pF1KA1 GEAVSRNASLEVALLRDDFRQNPTDVVVA-AGEPAILECQPPRGHPEPTIYWKKDKVRID : .: .: ..: : : ..: ::. . ..:. :.: .: : :.. . CCDS42 G-VVLYQARINV---RGPASIRPMKNITAIAGRDTYIHCRVI-GYPYYSIKWYKNSNLLP 500 510 520 530 540 180 190 200 210 220 pF1KA1 DKEERISIRG-GKLMISNTRKS-DAGMYTCVGTNMVGERDSDPAELTV----FERP-TFL ......... : : .:...: : : ::: . :. ...:: : .: : CCDS42 FNHRQVAFENNGTLKLSDVQKEVDEGEYTCNVLVQPQLSTSQSVHVTVKVPPFIQPFEFP 550 560 570 580 590 600 230 240 250 260 270 280 pF1KA1 RRPINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIK-D--DYT--LRIKKT : :.: :. .: :.:: :. :.:: .: : . : :.: :::.. CCDS42 RFSIGQRVFIPCVV-----VSGDLPITITWQKDGRPIP-GSLGVTIDNIDFTSSLRISNL 610 620 630 640 650 290 300 310 320 330 340 pF1KA1 MSTDEGTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQP .:.: :::.:... .: .. : ::.::.:::.:::: :..: . : ..: : : CCDS42 SLMHNGNYTCIARNEAAAVEHQSQLIVRVPPKFVVQPRDQDGIYGKAVILNCSAEGYPVP 660 670 680 690 700 710 350 360 370 380 390 400 pF1KA1 AVFWQ-KEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILA .. :. ..:. : :: :.: .: .:.: : .. . :.:::.:.. . .:. .. CCDS42 TIVWKFSKGAGVPQF--QPIALNGRIQVLSNGSLLIKHVVEEDSGYYLCKVSNDVGADVS 720 730 740 750 760 770 410 420 430 440 450 460 pF1KA1 KAQLEVTDVLTDRPPPIILQGPANQTLAVDGTAL-LKCKATGDPLPVISWLKEGFTFPGR :.. :: . : .: . : : :::..: ..: : :. .. : :: . . CCDS42 KSM-----YLTVKIPAMITSYP-NTTLATQGQKKEMSCTAHGEKPIIVRWEKEDRIINPE 780 790 800 810 820 830 470 480 490 500 510 pF1KA1 DPRATI--QEQGTLQIKNLRI-----SDTGTYTCVATSSSGETSWSAVLDVTESGATISK : . .: : :..:.: :.: ..: : .: :: : : : CCDS42 MARYLVSTKEVGEEVISTLQILPTVREDSGFFSCHAINSYGEDRGIIQLTVQEP------ 840 850 860 870 880 520 530 540 550 560 570 pF1KA1 NYDLSDLPGPPSKPQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTV--A : :: . .. :: ..:: : : :. : ..: :: .. :.::... . CCDS42 -------PDPP-EIEIKDVKARTITLRWTMGFDGNSPITGYDIEC--KNKSDSWDSAQRT 890 900 910 920 930 580 590 600 610 620 630 pF1KA1 NHVKTTLY--TVRGLRPNTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQV . :. : :. ..:.. : . . : : : :.:: .. . : : . : .: ..: CCDS42 KDVSPQLNSATIIDIHPSSTYSIRMYAKNRIGKSEPS--NELTITADEAAP-DG-PPQEV 940 950 960 970 980 990 640 650 660 670 680 pF1KA1 QKELGDVLVRLHNPVVLTPTTVQVTWTVDR---QPQFIQGYRVMYRQ-TSGLQATSSWQN . : :. . ...::: . . : .:.::.. ::. ..: . . . CCDS42 HLE----------PI--SSQSIRVTWKAPKKHLQNGIIRGYQIGYREYSTGGNFQFNIIS 1000 1010 1020 1030 690 700 710 720 730 740 pF1KA1 LDAKVPTERSAVLVNLKKGVTYEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVL .:.. .: .: ::.: . : . :. : .:. . : :..:: ::..: .. CCDS42 VDTSGDSE-VYTLDNLNKFTQYGLVVQACNRAGTGPSSQEIITTTLEDVPSYPPENVQAI 1040 1050 1060 1070 1080 1090 750 760 770 780 790 800 pF1KA1 TVGSYNSTSISVSWDPPPPDHQNGIIQEYKI--WCLGNETRFHINKTVDAAIRSVIIGGL .. . :::.::. . :::.: ... : . .. :.. .. :. . :: CCDS42 AT---SPESISISWSTLSKEALNGILQGFRVIYWANLMDGELGEIKNITTTQPSLELDGL 1100 1110 1120 1130 1140 1150 810 820 830 840 pF1KA1 FPGIQYRVEVAASTSAGVGVKSE----------PQP-----IIIGRRNEVVITE----NN .: ..: : : :: ::.:: : : . . : .. . CCDS42 EKYTNYSIQVLAFTRAGDGVRSEQIFTRTKEDVPGPPAGVKAAAASASMVFVSWLPPLKL 1160 1170 1180 1190 1200 1210 850 860 870 880 890 pF1KA1 NSITEQITDVVKQP------AFIAGIGGACWVILM-----GFSIWLYWRRKKRKGLSNYA :.: .. : ..: : :. . . : .:.:. . .: :. CCDS42 NGIIRKYTVFCSHPYPTVISEFEASPDSFSYRIPNLSRNRQYSVWVVAVTSAGRGNSSEI 1220 1230 1240 1250 1260 1270 900 910 920 930 940 950 pF1KA1 VTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNSNSGPNEIGNFGRGDVL .: . : . .: : .: . ::. : :: . :: CCDS42 ITVE----PLAKAPARI-LTFSGTVTTPWMKD----IVLPCKAV------------GDPS 1280 1290 1300 1310 960 970 980 990 1000 pF1KA1 PPVPGQGDK--TATMLS-DG--AIYSSIDFTTKTSYNSSSQITQATPYATTQILHSNSIH : : . :. : .... :: .:.:. .: .: .: . :... .. : CCDS42 PAVKWMKDSNGTPSLVTIDGRRSIFSNGSFIIRTVKAEDSGYYSCI--ANNNWGSDEIIL 1320 1330 1340 1350 1360 1370 1010 1020 1030 1040 1050 1060 pF1KA1 ELAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKNKNSSKPQKNNGSTW .: :..: : . .... :. :: :.:::.. . . : ..:. : CCDS42 NLQVQVPPDQPRLTVSKTTSSSITLSWLP----GDNGGSSIRGYILQYS----EDNSEQW 1380 1390 1400 1410 1420 1070 1080 1090 1100 1110 1120 pF1KA1 ANVPLPPPPVQPLPGTELEHYAVEQQENGYDSDSWCPPLPVQTYLHQGLEDELEEDDDRV .. :. : CCDS42 GSFPISPSERSYRLENLKCGTWYKFTLTAQNGVGPGRISEIIEAKTLGKEPQFSKEQELF 1430 1440 1450 1460 1470 1480 >>CCDS8384.1 DSCAML1 gene_id:57453|Hs108|chr11 (2113 aa) initn: 418 init1: 231 opt: 602 Z-score: 372.4 bits: 82.0 E(32554): 2e-14 Smith-Waterman score: 892; 27.5% identity (54.7% similar) in 832 aa overlap (27-826:464-1239) 10 20 30 40 50 pF1KA1 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKAEG :: :::: :. .:. :: .: : :.: CCDS83 TSAQKSHSGAYQCFATRKAQTAQDFAIIALEDGTPRIVSSFSEKVVNPGEQFSLMCAAKG 440 450 460 470 480 490 60 70 80 90 100 110 pF1KA1 RPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVCVARNYL : ::. : : : . : . :.... . .:. . : : . . : : : :.::: . CCDS83 APPPTVTWALDDEPIVRD-GSHRTNQYTMSDGTTISHMNVTGPQIR-DGGVYRCTARNLV 500 510 520 530 540 550 120 130 140 150 160 170 pF1KA1 GEAVSRNASLEVALLRDDFRQNPT-----DVVVAAGEPAILECQPPRGHPEPTIYWKKDK : : .: ..: : :. .....::. ....:. :.: .: : :: CCDS83 GSA-EYQARINV-------RGPPSIRAMRNITAVAGRDTLINCRVI-GYPYYSIKWYKDA 560 570 580 590 600 180 190 200 210 220 230 pF1KA1 VRIDDKEERISIRGGKLMISNTRKS-DAGMYTCVGTNMVGERDSDPAELTVFERPTFLRR . . :..... ...: : .....:. : : : : . .. . : . : . : . CCDS83 LLLPDNHRQVVFENGTLKLTDVQKGMDEGEYLC--SVLIQPQLSISQSVHVAVKVPPLIQ 610 620 630 640 650 660 240 250 260 270 280 pF1KA1 PIN-QVVLEEEAVEFRCQVQ-GDPQPTVRWKKDDADLPRGR-YDIKDDY---TLRIKKTM :.. . . . . : :. :: . :.:: . : :.. .:.:... CCDS83 PFEFPPASIGQLLYIPCVVSSGDMPIRITWRKDGQVIISGSGVTIESKEFMSSLQISSVS 670 680 690 700 710 720 290 300 310 320 330 340 pF1KA1 STDEGTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPA .:.: ::: : .. . : ::.::.:::.: .: :.. .. : . : : : CCDS83 LKHNGNYTCIASNAAATVSRERQLIVRVPPRFVVQPNNQDGIYGKAGVLNCSVDGYPPPK 730 740 750 760 770 780 350 360 370 380 390 400 pF1KA1 VFWQK-EGSQNLLFPNQ--PQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSIL :.:.. .:: : :.: : ..: .. :...: : .. . : :::.::: . .:. . CCDS83 VMWKHAKGSGN---PQQYHPVPLTGRIQILPNSSLLIRHVLEEDIGYYLCQASNGVGTDI 790 800 810 820 830 410 420 430 440 450 pF1KA1 AKAQLEVTDVLTDRPPPIILQGPANQTLAVDGTAL-LKCKATGDPLPVISWLKEGFTF-P .:... :: . : .: . : : :.:. : : :.: : :. .: : : .. : CCDS83 SKSMF-----LTVKIPAMITSHP-NTTIAIKGHAKELNCTARGERPIIIRWEKGDTVIDP 840 850 860 870 880 890 460 470 480 490 500 510 pF1KA1 GRDPRATI--QEQG-----TLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTESGATI : : .: ...: ::..: .:. ..: : .: :: : : : CCDS83 DRVMRYAIATKDNGDEVVSTLKLKPADRGDSVFFSCHAINSYGEDRGLIQLTVQEP---- 900 910 920 930 940 520 530 540 550 560 570 pF1KA1 SKNYDLSDLPGPPSKPQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVA : :: . .. .: :..: : :. ... :: ..: : ... . CCDS83 ---------PDPP-ELEIREVKARSMNLRWTQRFDGNSIITGFDIEYKNKSDSWDFKQST 950 960 970 980 990 580 590 600 610 620 630 pF1KA1 NHVKTTLY--TVRGLRPNTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQV ... :. .. :.: ..: . . ..: : :.:: . :.. .: . .: CCDS83 RNISPTINQANIVDLHPASVYSIRMYSFNKIGRSEPSKELT-ISTEEAAPDGPPMD---- 1000 1010 1020 1030 1040 1050 640 650 660 670 680 pF1KA1 QKELGDVLVRLHNPVVLTPTTVQVTWTVDR---QPQFIQGYRVMYRQTS-GLQATSSWQN : :. :: : ..:::: . . : :.::.. ::..: : .. : . CCDS83 --------VTLQ-PV--TSQSIQVTWKAPKKELQNGVIRGYQIGYRENSPGSNGQYSIVE 1060 1070 1080 1090 1100 690 700 710 720 730 740 pF1KA1 LDAKVPTERSAVLVNLKKGVTYEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVL . : .: .: :::: . : . :. . : .: .. : :..:: ::..: .: CCDS83 MKATGDSE-VYTLDNLKKFAQYGVVVQAFNRAGTGPSSSEINATTLEDVPSQPPENVRAL 1110 1120 1130 1140 1150 1160 750 760 770 780 790 800 pF1KA1 TVGSYNSTSISVSWDPPPPDHQNGIIQEYKI--WCLGNETRFHINKTVDAAIRSVIIGGL .. .: .::. :: . ::... :.. : : . .. ... .. . : . :. CCDS83 SI---TSDVAVISWSEPPRSTLNGVLKGYRVIFWSLYVDGEWGEMQNITTTRERVELRGM 1170 1180 1190 1200 1210 810 820 830 840 850 860 pF1KA1 FPGIQYRVEVAASTSAGVGVKSEPQPIIIGRRNEVVITENNNSITEQITDVVKQPAFIAG .: :.: : :.:: ::.: CCDS83 EKFTNYSVQVLAYTQAGDGVRSSVLYIQTKEDVPGPPAGIKAVPSSASSVVVSWLPPTKP 1220 1230 1240 1250 1260 1270 >>CCDS46221.1 PXDN gene_id:7837|Hs108|chr2 (1479 aa) initn: 367 init1: 254 opt: 597 Z-score: 371.3 bits: 81.2 E(32554): 2.3e-14 Smith-Waterman score: 757; 30.5% identity (58.8% similar) in 495 aa overlap (105-579:217-694) 80 90 100 110 120 130 pF1KA1 KDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSYVC-VARNYLGEAVSRNASLEVALLRD ... .: : :..:. . :. : CCDS46 LRLDSNTLHCDCEILWLADLLKTYAESGNAQAAAICEYPRRIQGRSVATITPEELNCERP 190 200 210 220 230 240 140 150 160 170 180 190 pF1KA1 DFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWKKDKVRIDDKEE-RISI-RGGKLMIS . ..: :. :..:. . . :. .:.:.: : : ... ... : . :... : :::. CCDS46 RITSEPQDADVTSGNTVYFTCRA-EGNPKPEIIWLRNNNELSMKTDSRLNLLDDGTLMIQ 250 260 270 280 290 300 200 210 220 230 240 pF1KA1 NTRKSDAGMYTCVGTNMVGERDSDPAELTVF---ERPTFLRRPINQVVLEEEAVEFRCQV ::...: :.: :.. :..:: .. . : : ::::. .: : :: :.: ..:.. CCDS46 NTQETDQGIYQCMAKNVAGEVKTQEVTLRYFGSPARPTFVIQPQNTEVLVGESVTLECSA 310 320 330 340 350 360 250 260 270 280 290 300 pF1KA1 QGDPQPTVRWKKDD-ADLPRG-RYDIKDDYTLRIKKTMSTDEGTYMCIAENRVGKMEASA : : : . : . : . :: : .: . : :..... : : : : : : . ...:.: CCDS46 TGHPPPRISWTRGDRTPLPVDPRVNITPSGGLYIQNVVQGDSGEYACSATNNIDSVHATA 370 380 390 400 410 420 310 320 330 340 350 360 pF1KA1 TLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQKEGSQNLLFPNQPQQPNS . :.: :::.: :.:..: .:.:: : ::.:::: :.. : : ::: . . CCDS46 FIIVQALPQFTVTPQDRVVIEGQTVDFQCEAKGNPPPVIAWTKGGSQ--------LSVDR 430 440 450 460 470 370 380 390 400 410 420 pF1KA1 RCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEVTDVLTDRPPPIILQGPAN : : .: : :... : : : :::... :: . :.: : : :.. . :.. CCDS46 RHLVLSSGTLRISGVALHDQGQYECQAVNIIGSQKVVAHLTVQP----RVTPVFASIPSD 480 490 500 510 520 530 430 440 450 460 470 480 pF1KA1 QTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQEQGTLQIKNLRISDTGTY :. : ... : :.. :.: :.:.: :.: .. . :. .: : :... .:.: : CCDS46 TTVEVGANVQLPCSSQGEPEPAITWNKDGVQVT-ESGKFHISPEGFLTINDVGPADAGRY 540 550 560 570 580 590 490 500 510 520 530 540 pF1KA1 TCVATSSSGETSWSAVLDVTESGATISKNYD----LSDLPGPPSKPQVTDVTKNSVTLSW ::: .. : .: : ::.:. .:.: : : . . . .. . :.. . : CCDS46 ECVARNTIGSASVSMVLSVNVPD--VSRNGDPFVATSIVEAIATVDRAINSTRTHLFDS- 600 610 620 630 640 550 560 570 580 590 pF1KA1 QPGTPGTL------PASAYIIE-AFSQSV-SNSWQTVANHVKTTLYTVRGLRPNTIYLFM .: .:. : : . : .: : . . . : . .::. : CCDS46 RPRSPNDLLALFRYPRDPYTVEQARAGEIFERTLQLIQEHVQHGLMVDLNGTSYHYNDLV 650 660 670 680 690 700 600 610 620 630 640 650 pF1KA1 VRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVLTPTTVQV CCDS46 SPQYLNLIANLSGCTAHRRVNNCSDMCFHQKYRTHDGTCNNLQHPMWGASLTAFERLLKS 710 720 730 740 750 760 1378 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 21:25:45 2016 done: Wed Nov 2 21:25:46 2016 Total Scan time: 6.270 Total Display time: 0.770 Function used was FASTA [36.3.4 Apr, 2011]