FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0424, 516 aa 1>>>pF1KA0424 516 - 516 aa - 516 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4557+/-0.00101; mu= 8.6268+/- 0.061 mean_var=159.1557+/-34.400, 0's: 0 Z-trim(109.7): 129 B-trim: 276 in 1/51 Lambda= 0.101663 statistics sampled from 10949 (11098) to 10949 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.693), E-opt: 0.2 (0.341), width: 16 Scan time: 3.090 The best scores are: opt bits E(32554) CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 516) 3567 535.5 5.5e-152 CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 495) 3435 516.1 3.6e-146 CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 463) 3132 471.6 8.2e-133 CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 414) 2840 428.8 5.9e-120 CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 ( 574) 2163 329.6 5.8e-90 CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 ( 596) 2163 329.6 6e-90 CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 ( 652) 2163 329.6 6.4e-90 CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277) 2163 329.9 1.1e-89 CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 690) 2107 321.4 2e-87 CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 670) 2044 312.2 1.2e-84 CCDS73553.1 SPATA13 gene_id:221178|Hs108|chr13 ( 512) 1677 258.3 1.5e-68 CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 644 107.2 1.5e-22 CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659) 573 96.8 2.1e-19 CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 445 77.9 8.1e-14 CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 441 77.3 1.1e-13 >>CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX (516 aa) initn: 3567 init1: 3567 opt: 3567 Z-score: 2842.1 bits: 535.5 E(32554): 5.5e-152 Smith-Waterman score: 3567; 100.0% identity (100.0% similar) in 516 aa overlap (1-516:1-516) 10 20 30 40 50 60 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGDVIKVLDASNKDWWWGQIDDEEGWFPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGDVIKVLDASNKDWWWGQIDDEEGWFPAS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 FVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 FVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 HLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 GPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 TPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQW 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 QASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 QASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDIL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 YYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 YYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 REERKMVQEDEKIGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 REERKMVQEDEKIGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQY 430 440 450 460 470 480 490 500 510 pF1KA0 LVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK :::::::::::::::::::::::::::::::::::: CCDS35 LVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK 490 500 510 >>CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX (495 aa) initn: 3435 init1: 3435 opt: 3435 Z-score: 2737.7 bits: 516.1 E(32554): 3.6e-146 Smith-Waterman score: 3435; 100.0% identity (100.0% similar) in 495 aa overlap (22-516:1-495) 10 20 30 40 50 60 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGDVIKVLDASNKDWWWGQIDDEEGWFPAS ::::::::::::::::::::::::::::::::::::::: CCDS83 MANRELAFKAGDVIKVLDASNKDWWWGQIDDEEGWFPAS 10 20 30 70 80 90 100 110 120 pF1KA0 FVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 FVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIK 40 50 60 70 80 90 130 140 150 160 170 180 pF1KA0 HLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 HLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEI 100 110 120 130 140 150 190 200 210 220 230 240 pF1KA0 GPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KA0 TPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 TPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQW 220 230 240 250 260 270 310 320 330 340 350 360 pF1KA0 QASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 QASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDIL 280 290 300 310 320 330 370 380 390 400 410 420 pF1KA0 YYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 YYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAF 340 350 360 370 380 390 430 440 450 460 470 480 pF1KA0 REERKMVQEDEKIGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 REERKMVQEDEKIGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQY 400 410 420 430 440 450 490 500 510 pF1KA0 LVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK :::::::::::::::::::::::::::::::::::: CCDS83 LVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK 460 470 480 490 >>CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX (463 aa) initn: 3129 init1: 3129 opt: 3132 Z-score: 2497.9 bits: 471.6 E(32554): 8.2e-133 Smith-Waterman score: 3132; 98.5% identity (99.1% similar) in 461 aa overlap (56-516:3-463) 30 40 50 60 70 80 pF1KA0 ELAFKAGDVIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLD :. .. :::::::::::::::::::::: CCDS55 MQWIRGGSGMLWVNQEDEVEEGPSDVQNGHLD 10 20 30 90 100 110 120 130 140 pF1KA0 PNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQL 40 50 60 70 80 90 150 160 170 180 190 200 pF1KA0 KVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDAC 100 110 120 130 140 150 210 220 230 240 250 260 pF1KA0 MELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHS 160 170 180 190 200 210 270 280 290 300 310 320 pF1KA0 DYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 DYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEM 220 230 240 250 260 270 330 340 350 360 370 380 pF1KA0 AWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 AWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFN 280 290 300 310 320 330 390 400 410 420 430 440 pF1KA0 VSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQA 340 350 360 370 380 390 450 460 470 480 490 500 pF1KA0 AMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 AMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFW 400 410 420 430 440 450 510 pF1KA0 QNFSRLTPFKK ::::::::::: CCDS55 QNFSRLTPFKK 460 >>CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX (414 aa) initn: 2840 init1: 2840 opt: 2840 Z-score: 2267.1 bits: 428.8 E(32554): 5.9e-120 Smith-Waterman score: 2840; 100.0% identity (100.0% similar) in 414 aa overlap (103-516:1-414) 80 90 100 110 120 130 pF1KA0 EEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQ :::::::::::::::::::::::::::::: CCDS55 MRANVINEIMSTERHYIKHLKDICEGYLKQ 10 20 30 140 150 160 170 180 190 pF1KA0 CRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFW 40 50 60 70 80 90 200 210 220 230 240 250 pF1KA0 IYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQ 100 110 120 130 140 150 260 270 280 290 300 310 pF1KA0 LAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDI 160 170 180 190 200 210 320 330 340 350 360 370 pF1KA0 LDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYE 220 230 240 250 260 270 380 390 400 410 420 430 pF1KA0 VVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEK 280 290 300 310 320 330 440 450 460 470 480 490 pF1KA0 IGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 IGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVF 340 350 360 370 380 390 500 510 pF1KA0 EFTEPKRSQSPFWQNFSRLTPFKK :::::::::::::::::::::::: CCDS55 EFTEPKRSQSPFWQNFSRLTPFKK 400 410 >>CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 (574 aa) initn: 2143 init1: 1140 opt: 2163 Z-score: 1728.5 bits: 329.6 E(32554): 5.8e-90 Smith-Waterman score: 2163; 61.5% identity (83.9% similar) in 517 aa overlap (4-516:65-574) 10 20 30 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD ::. ..: :::.:::::: ..::.::::: CCDS66 GSEEDFSYEDLCQASPRYLQPGGEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGD 40 50 60 70 80 90 40 50 60 70 80 90 pF1KA0 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL ::.::.:::::::::. .:.:.::::::::: :::: :. :. :.. . . : ... CCDS66 VIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQE-ELSENSSSTPSEEQDEEAS-QSR 100 110 120 130 140 150 100 110 120 130 140 150 pF1KA0 GRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIE : .:..:::.::: :::.::: :::::.::::::..::::. ::. :: .:::::: CCDS66 HRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIE 160 170 180 190 200 210 160 170 180 190 200 210 pF1KA0 DIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMK :::.:: :..:::::::...::::::: :::..:.:: ::::::::: ::.::..::: CCDS66 DIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMK 220 230 240 250 260 270 220 230 240 250 260 270 pF1KA0 DSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAA ...:.::::::::::::::::::::::::::::::::::::::::::.:.:.:: . :: CCDS66 QGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAA 280 290 300 310 320 330 280 290 300 310 320 330 pF1KA0 LAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYG .:.::. ::::::.::.:::::.::.:.. ::: ::::::::::..::.. : . : CCDS66 YEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQ-G 340 350 360 370 380 390 340 350 360 370 380 390 pF1KA0 RNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFK ..:::.:::::::.: :::::.:::.::::::.:::..:.::. :::: : :.:.::::: CCDS66 KSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFK 400 410 420 430 440 450 400 410 420 430 440 450 pF1KA0 LHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKVP : .. :.:..:: ::: :.: :::.: .::. ::::...:.:::::::. : ....:. CCDS66 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG 460 470 480 490 500 510 460 470 480 490 500 pF1KA0 --KQKGVNSARSVPPSYPPPQD--PLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFS :.:: : : :: : :... . .: .. :.::: ..::::..: ::..:. CCDS66 HGKSKGYNRC----PVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFN 520 530 540 550 560 510 pF1KA0 RLTPFKK :::::.: CCDS66 RLTPFRK 570 >>CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 (596 aa) initn: 2143 init1: 1140 opt: 2163 Z-score: 1728.3 bits: 329.6 E(32554): 6e-90 Smith-Waterman score: 2163; 61.5% identity (83.9% similar) in 517 aa overlap (4-516:87-596) 10 20 30 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD ::. ..: :::.:::::: ..::.::::: CCDS66 GSEEDFSYEDLCQASPRYLQPGGEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGD 60 70 80 90 100 110 40 50 60 70 80 90 pF1KA0 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL ::.::.:::::::::. .:.:.::::::::: :::: :. :. :.. . . : ... CCDS66 VIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQE-ELSENSSSTPSEEQDEEAS-QSR 120 130 140 150 160 170 100 110 120 130 140 150 pF1KA0 GRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIE : .:..:::.::: :::.::: :::::.::::::..::::. ::. :: .:::::: CCDS66 HRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIE 180 190 200 210 220 230 160 170 180 190 200 210 pF1KA0 DIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMK :::.:: :..:::::::...::::::: :::..:.:: ::::::::: ::.::..::: CCDS66 DIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMK 240 250 260 270 280 290 220 230 240 250 260 270 pF1KA0 DSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAA ...:.::::::::::::::::::::::::::::::::::::::::::.:.:.:: . :: CCDS66 QGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAA 300 310 320 330 340 350 280 290 300 310 320 330 pF1KA0 LAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYG .:.::. ::::::.::.:::::.::.:.. ::: ::::::::::..::.. : . : CCDS66 YEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQ-G 360 370 380 390 400 410 340 350 360 370 380 390 pF1KA0 RNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFK ..:::.:::::::.: :::::.:::.::::::.:::..:.::. :::: : :.:.::::: CCDS66 KSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFK 420 430 440 450 460 470 400 410 420 430 440 450 pF1KA0 LHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKVP : .. :.:..:: ::: :.: :::.: .::. ::::...:.:::::::. : ....:. CCDS66 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG 480 490 500 510 520 530 460 470 480 490 500 pF1KA0 --KQKGVNSARSVPPSYPPPQD--PLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFS :.:: : : :: : :... . .: .. :.::: ..::::..: ::..:. CCDS66 HGKSKGYNRC----PVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFN 540 550 560 570 580 510 pF1KA0 RLTPFKK :::::.: CCDS66 RLTPFRK 590 >>CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 (652 aa) initn: 2143 init1: 1140 opt: 2163 Z-score: 1727.8 bits: 329.6 E(32554): 6.4e-90 Smith-Waterman score: 2163; 61.5% identity (83.9% similar) in 517 aa overlap (4-516:143-652) 10 20 30 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD ::. ..: :::.:::::: ..::.::::: CCDS93 GSEEDFSYEDLCQASPRYLQPGGEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGD 120 130 140 150 160 170 40 50 60 70 80 90 pF1KA0 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL ::.::.:::::::::. .:.:.::::::::: :::: :. :. :.. . . : ... CCDS93 VIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQE-ELSENSSSTPSEEQDEEAS-QSR 180 190 200 210 220 230 100 110 120 130 140 150 pF1KA0 GRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIE : .:..:::.::: :::.::: :::::.::::::..::::. ::. :: .:::::: CCDS93 HRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIE 240 250 260 270 280 290 160 170 180 190 200 210 pF1KA0 DIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMK :::.:: :..:::::::...::::::: :::..:.:: ::::::::: ::.::..::: CCDS93 DIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMK 300 310 320 330 340 350 220 230 240 250 260 270 pF1KA0 DSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAA ...:.::::::::::::::::::::::::::::::::::::::::::.:.:.:: . :: CCDS93 QGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAA 360 370 380 390 400 410 280 290 300 310 320 330 pF1KA0 LAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYG .:.::. ::::::.::.:::::.::.:.. ::: ::::::::::..::.. : . : CCDS93 YEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQ-G 420 430 440 450 460 340 350 360 370 380 390 pF1KA0 RNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFK ..:::.:::::::.: :::::.:::.::::::.:::..:.::. :::: : :.:.::::: CCDS93 KSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFK 470 480 490 500 510 520 400 410 420 430 440 450 pF1KA0 LHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKVP : .. :.:..:: ::: :.: :::.: .::. ::::...:.:::::::. : ....:. CCDS93 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG 530 540 550 560 570 580 460 470 480 490 500 pF1KA0 --KQKGVNSARSVPPSYPPPQD--PLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFS :.:: : : :: : :... . .: .. :.::: ..::::..: ::..:. CCDS93 HGKSKGYNRC----PVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFN 590 600 610 620 630 640 510 pF1KA0 RLTPFKK :::::.: CCDS93 RLTPFRK 650 >>CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277 aa) initn: 2118 init1: 1140 opt: 2163 Z-score: 1723.8 bits: 329.9 E(32554): 1.1e-89 Smith-Waterman score: 2163; 61.5% identity (83.9% similar) in 517 aa overlap (4-516:768-1277) 10 20 30 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD ::. ..: :::.:::::: ..::.::::: CCDS53 GSEEDFSYEDLCQASPRYLQPGGEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGD 740 750 760 770 780 790 40 50 60 70 80 90 pF1KA0 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL ::.::.:::::::::. .:.:.::::::::: :::: :. :. :.. . . : ... CCDS53 VIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQE-ELSENSSSTPSEEQDEEAS-QSR 800 810 820 830 840 850 100 110 120 130 140 150 pF1KA0 GRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIE : .:..:::.::: :::.::: :::::.::::::..::::. ::. :: .:::::: CCDS53 HRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIE 860 870 880 890 900 910 160 170 180 190 200 210 pF1KA0 DIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMK :::.:: :..:::::::...::::::: :::..:.:: ::::::::: ::.::..::: CCDS53 DIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMK 920 930 940 950 960 970 220 230 240 250 260 270 pF1KA0 DSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAA ...:.::::::::::::::::::::::::::::::::::::::::::.:.:.:: . :: CCDS53 QGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAA 980 990 1000 1010 1020 1030 280 290 300 310 320 330 pF1KA0 LAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYG .:.::. ::::::.::.:::::.::.:.. ::: ::::::::::..::.. : . : CCDS53 YEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQ-G 1040 1050 1060 1070 1080 1090 340 350 360 370 380 390 pF1KA0 RNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFK ..:::.:::::::.: :::::.:::.::::::.:::..:.::. :::: : :.:.::::: CCDS53 KSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFK 1100 1110 1120 1130 1140 1150 400 410 420 430 440 450 pF1KA0 LHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKVP : .. :.:..:: ::: :.: :::.: .::. ::::...:.:::::::. : ....:. CCDS53 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG 1160 1170 1180 1190 1200 1210 460 470 480 490 500 pF1KA0 --KQKGVNSARSVPPSYPPPQD--PLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFS :.:: : : :: : :... . .: .. :.::: ..::::..: ::..:. CCDS53 HGKSKGYNRC----PVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFN 1220 1230 1240 1250 1260 1270 510 pF1KA0 RLTPFKK :::::.: CCDS53 RLTPFRK >>CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 (690 aa) initn: 2104 init1: 1674 opt: 2107 Z-score: 1683.1 bits: 321.4 E(32554): 2e-87 Smith-Waterman score: 2107; 60.8% identity (81.7% similar) in 515 aa overlap (4-516:190-690) 10 20 30 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD ::. :.: :::.:::::: ..::.::::: CCDS21 SEEDLYDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGD 160 170 180 190 200 210 40 50 60 70 80 90 pF1KA0 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL ::.:.::.:..::::.. : ::::::::::: ::: :: :.: ... : :: CCDS21 VIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQ-DE----PAD-DDAPLAGNSGAEDG 220 230 240 250 260 270 100 110 120 130 140 150 pF1KA0 GRPLQN-RDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNI : :. .::::.::::::.:::: :::::.::::::..::::: ::::.:::..::::: CCDS21 GAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNI 280 290 300 310 320 330 160 170 180 190 200 210 pF1KA0 EDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLM ::::: : .::. ::...: . :::::.: :::::: : ::::::::: .::.:::.: CCDS21 EDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLT 340 350 360 370 380 390 220 230 240 250 260 270 pF1KA0 KDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAA : :.: .:::::::::.::::..::::::::::::::::::::::::: .: :.. : : CCDS21 KLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEA 400 410 420 430 440 450 280 290 300 310 320 330 pF1KA0 ALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPY :: .:.::.: ::::::::::::::::::.:. ::::::.: :::::::.::.. . :: CCDS21 ALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQ 460 470 480 490 500 510 340 350 360 370 380 390 pF1KA0 GRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAF ...:::.:::::::.. :::::.:::.::::::.::: ::::.:::.: :..::.:::: CCDS21 AKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAF 520 530 540 550 560 570 400 410 420 430 440 450 pF1KA0 KLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKV .:: : . ::. ..: :.: :::.:: .::..:: :.. :: :.: :..:: ... : CCDS21 RLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASK- 580 590 600 610 620 630 460 470 480 490 500 510 pF1KA0 PKQKGVNSARSVP-PSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRL :. ... ..: : : : .: .:.. :.::. ..::.:. : ::...::: CCDS21 --QQVTGKPKAVGRPCYLTRQ---KHPA--LPSNRPQQQVLVLAEPRRKPSTFWHSISRL 640 650 660 670 680 pF1KA0 TPFKK .::.: CCDS21 APFRK 690 >>CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 (670 aa) initn: 2052 init1: 1674 opt: 2044 Z-score: 1633.3 bits: 312.2 E(32554): 1.2e-84 Smith-Waterman score: 2044; 61.1% identity (81.8% similar) in 488 aa overlap (4-490:190-668) 10 20 30 pF1KA0 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD ::. :.: :::.:::::: ..::.::::: CCDS42 SEEDLYDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGD 160 170 180 190 200 210 40 50 60 70 80 90 pF1KA0 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL ::.:.::.:..::::.. : ::::::::::: :::.. :.: ... : :: CCDS42 VIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDE-----PAD-DDAPLAGNSGAEDG 220 230 240 250 260 270 100 110 120 130 140 150 pF1KA0 GRPLQN-RDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNI : :. .::::.::::::.:::: :::::.::::::..::::: ::::.:::..::::: CCDS42 GAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNI 280 290 300 310 320 330 160 170 180 190 200 210 pF1KA0 EDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLM ::::: : .::. ::...: . :::::.: :::::: : ::::::::: .::.:::.: CCDS42 EDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLT 340 350 360 370 380 390 220 230 240 250 260 270 pF1KA0 KDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAA : :.: .:::::::::.::::..::::::::::::::::::::::::: .: :.. : : CCDS42 KLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEA 400 410 420 430 440 450 280 290 300 310 320 330 pF1KA0 ALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPY :: .:.::.: ::::::::::::::::::.:. ::::::.: :::::::.::.. . :: CCDS42 ALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQ 460 470 480 490 500 510 340 350 360 370 380 390 pF1KA0 GRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAF ...:::.:::::::.. :::::.:::.::::::.::: ::::.:::.: :..::.:::: CCDS42 AKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAF 520 530 540 550 560 570 400 410 420 430 440 450 pF1KA0 KLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKV .:: : . ::. ..: :.: :::.:: .::..:: :.. :: :.: :..:: ... : CCDS42 RLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASK- 580 590 600 610 620 630 460 470 480 490 500 510 pF1KA0 PKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLT :. ... .. . :::. : . ..: . ::: CCDS42 --QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS 640 650 660 670 pF1KA0 PFKK 516 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 18:53:28 2016 done: Wed Nov 2 18:53:29 2016 Total Scan time: 3.090 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]