FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1112, 670 aa 1>>>pF1KSDA1112 670 - 670 aa - 670 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3011+/-0.000927; mu= 10.9037+/- 0.055 mean_var=151.2098+/-31.259, 0's: 0 Z-trim(110.6): 153 B-trim: 0 in 0/50 Lambda= 0.104300 statistics sampled from 11587 (11765) to 11587 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.706), E-opt: 0.2 (0.361), width: 16 Scan time: 3.990 The best scores are: opt bits E(32554) CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 670) 4617 707.0 2.1e-203 CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 690) 4426 678.3 9.8e-195 CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 ( 652) 2225 347.1 4.7e-95 CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277) 2225 347.3 7.8e-95 CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 ( 574) 2193 342.2 1.2e-93 CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 ( 596) 2190 341.8 1.7e-93 CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 516) 2044 319.8 6.2e-87 CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 495) 1961 307.3 3.5e-83 CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 463) 1726 271.9 1.4e-72 CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 414) 1694 267.0 3.7e-71 CCDS73553.1 SPATA13 gene_id:221178|Hs108|chr13 ( 512) 1516 240.3 5.1e-63 CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 675 114.2 1.5e-24 CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659) 648 110.1 2.6e-23 CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 487 85.8 4e-16 CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 431 77.4 1.5e-13 CCDS45069.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 753) 402 72.8 2e-12 CCDS32009.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 782) 402 72.8 2e-12 CCDS45068.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 803) 402 72.8 2.1e-12 CCDS33424.1 FARP2 gene_id:9855|Hs108|chr2 (1054) 386 70.5 1.4e-11 CCDS9521.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 646) 379 69.3 1.9e-11 CCDS33022.2 PLEKHG2 gene_id:64857|Hs108|chr19 (1386) 384 70.3 2.1e-11 CCDS82664.1 ITSN1 gene_id:6453|Hs108|chr21 (1716) 377 69.3 5e-11 CCDS33545.1 ITSN1 gene_id:6453|Hs108|chr21 (1721) 377 69.3 5e-11 CCDS6979.1 VAV2 gene_id:7410|Hs108|chr9 ( 839) 367 67.6 8.2e-11 >>CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 (670 aa) initn: 4617 init1: 4617 opt: 4617 Z-score: 3765.1 bits: 707.0 E(32554): 2.1e-203 Smith-Waterman score: 4617; 100.0% identity (100.0% similar) in 670 aa overlap (1-670:1-670) 10 20 30 40 50 60 pF1KSD MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKGRRTAAPPPRLPGPYPADII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKGRRTAAPPPRLPGPYPADII 610 620 630 640 650 660 670 pF1KSD PFSEPQSQAS :::::::::: CCDS42 PFSEPQSQAS 670 >>CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 (690 aa) initn: 4401 init1: 4401 opt: 4426 Z-score: 3609.6 bits: 678.3 E(32554): 9.8e-195 Smith-Waterman score: 4426; 96.2% identity (97.3% similar) in 676 aa overlap (1-670:1-676) 10 20 30 40 50 60 pF1KSD MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA 550 560 570 580 590 600 610 620 630 640 650 pF1KSD FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPK--GRR---TAAPPPRLPGPY :::::::::::::::::::::::::::::::::::::::: :: : : ::. CCDS21 FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKAVGRPCYLTRQKHPALPSNR 610 620 630 640 650 660 660 670 pF1KSD PAD-IIPFSEPQSQAS : . .. ..::. . : CCDS21 PQQQVLVLAEPRRKPSTFWHSISRLAPFRK 670 680 690 >>CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 (652 aa) initn: 1611 init1: 1140 opt: 2225 Z-score: 1820.0 bits: 347.1 E(32554): 4.7e-95 Smith-Waterman score: 2225; 60.5% identity (81.1% similar) in 562 aa overlap (118-668:71-626) 90 100 110 120 130 140 pF1KSD RLHIGAVHKDGVKCWRKTIITSPESLNLPRRSHPLSQSAPTGLNHMGWPEHTPGTAMP-D : .:::.: ::...: .. .. . : CCDS93 ELDNLLTQPASRPPMPAHQVPPYKAVSARFRPFTFSQSTPIGLDRVGRRRQMRASNVSSD 50 60 70 80 90 100 150 160 170 180 190 200 pF1KSD GALDTAVCADEVGSEEDL-YDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDH :. . .. .:. :::::. :.:: ..: .: .::: ::::::::::::.:::::::::: CCDS93 GGTEPSALVDDNGSEEDFSYEDLCQASPRYLQPGG--EQLAINELISDGNVVCAEALWDH 110 120 130 140 150 210 220 230 240 250 260 pF1KSD VTMDDQELGFKAGDVIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDEPADDDAPLA ::::::::::::::::.:..:.:..::::: : :.:::::::::::::.: ..... CCDS93 VTMDDQELGFKAGDVIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQEELSENSSSTP 160 170 180 190 200 210 270 280 290 300 310 320 pF1KSD GNSGAEDGGAEAQS---SKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFS .. :... . .:.::::::: ::..::: ::::::::::::.:::::.. ::. CCDS93 SEEQDEEASQSRHRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFT 220 230 240 250 260 270 330 340 350 360 370 380 pF1KSD EEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNH :: ::::::::::. :. :.: ::...:.:.:::::.:.:::..: : ::::::::: CCDS93 VAQLATIFGNIEDIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNH 280 290 300 310 320 330 390 400 410 420 430 440 pF1KSD PNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTH :.::.::. : : .:: .:::::::::.::::..::::::::::::::::::::::::: CCDS93 PGACLELANLMKQGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTT 340 350 360 370 380 390 450 460 470 480 490 500 pF1KSD PQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIY .: :.....:: .:::::: :::::::.::.:::::.:: :: ::: :.: ::::::. CCDS93 QEHGDYSNIKAAYEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIH 400 410 420 430 440 450 510 520 530 540 550 560 pF1KSD SGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKD :::::..:. :.::::: ::::::::. :::::::::.:::::::::: .:.::: ::.: CCDS93 SGELTKITK-QGKSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRD 460 470 480 490 500 510 570 580 590 600 610 620 pF1KSD RDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQ .: ..:.::::.: .: . .:.:..: :.: :::.: : ::..:: :.: :. :.: : CCDS93 KDCNLSVKNAFKLVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQ 520 530 540 550 560 570 630 640 650 660 670 pF1KSD RKQAMLNASKQQVTGKPKG--RRTAAPPPRLPGPYPAD----IIPFSEPQSQAS .: :::::.: :: :: : .::: . : .: .: : ::.: CCDS93 KKLAMLNAQKAG-HGKSKGYNRCPVAPPHQ--GLHPIHQRHITMPTSVPQQQVFGLAEPK 580 590 600 610 620 630 CCDS93 RKSSLFWHTFNRLTPFRK 640 650 >>CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277 aa) initn: 1611 init1: 1140 opt: 2225 Z-score: 1816.0 bits: 347.3 E(32554): 7.8e-95 Smith-Waterman score: 2225; 60.5% identity (81.1% similar) in 562 aa overlap (118-668:696-1251) 90 100 110 120 130 140 pF1KSD RLHIGAVHKDGVKCWRKTIITSPESLNLPRRSHPLSQSAPTGLNHMGWPEHTPGTAMP-D : .:::.: ::...: .. .. . : CCDS53 ELDNLLTQPASRPPMPAHQVPPYKAVSARFRPFTFSQSTPIGLDRVGRRRQMRASNVSSD 670 680 690 700 710 720 150 160 170 180 190 200 pF1KSD GALDTAVCADEVGSEEDL-YDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDH :. . .. .:. :::::. :.:: ..: .: .::: ::::::::::::.:::::::::: CCDS53 GGTEPSALVDDNGSEEDFSYEDLCQASPRYLQPGG--EQLAINELISDGNVVCAEALWDH 730 740 750 760 770 780 210 220 230 240 250 260 pF1KSD VTMDDQELGFKAGDVIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDEPADDDAPLA ::::::::::::::::.:..:.:..::::: : :.:::::::::::::.: ..... CCDS53 VTMDDQELGFKAGDVIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQEELSENSSSTP 790 800 810 820 830 840 270 280 290 300 310 320 pF1KSD GNSGAEDGGAEAQS---SKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFS .. :... . .:.::::::: ::..::: ::::::::::::.:::::.. ::. CCDS53 SEEQDEEASQSRHRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFT 850 860 870 880 890 900 330 340 350 360 370 380 pF1KSD EEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNH :: ::::::::::. :. :.: ::...:.:.:::::.:.:::..: : ::::::::: CCDS53 VAQLATIFGNIEDIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNH 910 920 930 940 950 960 390 400 410 420 430 440 pF1KSD PNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTH :.::.::. : : .:: .:::::::::.::::..::::::::::::::::::::::::: CCDS53 PGACLELANLMKQGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTT 970 980 990 1000 1010 1020 450 460 470 480 490 500 pF1KSD PQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIY .: :.....:: .:::::: :::::::.::.:::::.:: :: ::: :.: ::::::. CCDS53 QEHGDYSNIKAAYEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIH 1030 1040 1050 1060 1070 1080 510 520 530 540 550 560 pF1KSD SGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKD :::::..:. :.::::: ::::::::. :::::::::.:::::::::: .:.::: ::.: CCDS53 SGELTKITK-QGKSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRD 1090 1100 1110 1120 1130 1140 570 580 590 600 610 620 pF1KSD RDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQ .: ..:.::::.: .: . .:.:..: :.: :::.: : ::..:: :.: :. :.: : CCDS53 KDCNLSVKNAFKLVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQ 1150 1160 1170 1180 1190 1200 630 640 650 660 670 pF1KSD RKQAMLNASKQQVTGKPKG--RRTAAPPPRLPGPYPAD----IIPFSEPQSQAS .: :::::.: :: :: : .::: . : .: .: : ::.: CCDS53 KKLAMLNAQKAG-HGKSKGYNRCPVAPPHQ--GLHPIHQRHITMPTSVPQQQVFGLAEPK 1210 1220 1230 1240 1250 CCDS53 RKSSLFWHTFNRLTPFRK 1260 1270 >>CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 (574 aa) initn: 1642 init1: 1140 opt: 2193 Z-score: 1794.7 bits: 342.2 E(32554): 1.2e-93 Smith-Waterman score: 2193; 61.1% identity (81.2% similar) in 543 aa overlap (135-668:11-548) 110 120 130 140 150 160 pF1KSD TIITSPESLNLPRRSHPLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDL : .. . ::. . .. .:. :::::. CCDS66 MVARGEIARFWSLESLHLVSSDGGTEPSALVDDNGSEEDF 10 20 30 40 170 180 190 200 210 220 pF1KSD -YDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEV :.:: ..: .: .:: :::::::::::::.::::::::::::::::::::::::::.: CCDS66 SYEDLCQASPRYLQPG--GEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGDVIQV 50 60 70 80 90 230 240 250 260 270 280 pF1KSD MDATNREWWWGRVADGEGWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQS---S ..:.:..::::: : :.:::::::::::::.: ..... .. :... . . CCDS66 LEASNKDWWWGRSEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCEN 100 110 120 130 140 150 290 300 310 320 330 340 pF1KSD KDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQ :.::::::: ::..::: ::::::::::::.:::::.. ::. :: ::::::::::. : CCDS66 KQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIEDIYKFQ 160 170 180 190 200 210 350 360 370 380 390 400 pF1KSD KAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVY . :.: ::...:.:.:::::.:.:::..: : ::::::::::.::.::. : : .:: . CCDS66 RKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRH 220 230 240 250 260 270 410 420 430 440 450 460 pF1KSD FFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKN :::::::::.::::..::::::::::::::::::::::::: .: :.....:: .:::: CCDS66 FFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKN 280 290 300 310 320 330 470 480 490 500 510 520 pF1KSD VAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRM :: :::::::.::.:::::.:: :: ::: :.: ::::::.:::::..:. :.::::: CCDS66 VACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITK-QGKSQQRT 340 350 360 370 380 390 530 540 550 560 570 580 pF1KSD FFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGAT ::::::::. :::::::::.:::::::::: .:.::: ::.:.: ..:.::::.: .: CCDS66 FFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFKLVSRTT 400 410 420 430 440 450 590 600 610 620 630 640 pF1KSD GDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPK . .:.:..: :.: :::.: : ::..:: :.: :. :.: :.: :::::.: :: : CCDS66 DEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG-HGKSK 460 470 480 490 500 510 650 660 670 pF1KSD GR-RTAAPPPRLPGPYPAD----IIPFSEPQSQAS : : . ::. : .: .: : ::.: CCDS66 GYNRCPVAPPH-QGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFNRLTPFRK 520 530 540 550 560 570 >>CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 (596 aa) initn: 1642 init1: 1140 opt: 2190 Z-score: 1792.1 bits: 341.8 E(32554): 1.7e-93 Smith-Waterman score: 2190; 62.2% identity (82.1% similar) in 532 aa overlap (146-668:44-570) 120 130 140 150 160 170 pF1KSD PRRSHPLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDL-YDDLHSSSHH ::. . .. .:. :::::. :.:: ..: . CCDS66 RKKLDQGLILKKEKYRKEKKCASLSFEVSSDGGTEPSALVDDNGSEEDFSYEDLCQASPR 20 30 40 50 60 70 180 190 200 210 220 230 pF1KSD YSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWG : .:: :::::::::::::.::::::::::::::::::::::::::.:..:.:..:::: CCDS66 YLQPG--GEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGDVIQVLEASNKDWWWG 80 90 100 110 120 130 240 250 260 270 280 290 pF1KSD RVADGEGWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQS---SKDQMRTNVINE : : :.:::::::::::::.: ..... .. :... . .:.::::::: : CCDS66 RSEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCENKQQMRTNVIRE 140 150 160 170 180 190 300 310 320 330 340 350 pF1KSD ILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRF :..::: ::::::::::::.:::::.. ::. :: ::::::::::. :. :.: ::... CCDS66 IMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIEDIYKFQRKFLKDLEKQY 200 210 220 230 240 250 360 370 380 390 400 410 pF1KSD NRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKM :.:.:::::.:.:::..: : ::::::::::.::.::. : : .:: .:::::::::.: CCDS66 NKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRHFFEACRLLQQM 260 270 280 290 300 310 420 430 440 450 460 470 pF1KSD IDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRR :::..::::::::::::::::::::::::: .: :.....:: .:::::: :::::::. CCDS66 IDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKNVACLINERKRK 320 330 340 350 360 370 480 490 500 510 520 530 pF1KSD LENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYC ::.:::::.:: :: ::: :.: ::::::.:::::..:. :.::::: ::::::::. : CCDS66 LESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITK-QGKSQQRTFFLFDHQLVSC 380 390 400 410 420 430 540 550 560 570 580 590 pF1KSD KKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKP ::::::::.:::::::::: .:.::: ::.:.: ..:.::::.: .: . .:.:..: CCDS66 KKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFKLVSRTTDEVYLFCAKKQ 440 450 460 470 480 490 600 610 620 630 640 650 pF1KSD EQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKGR-RTAAPPPR :.: :::.: : ::..:: :.: :. :.: :.: :::::.: :: :: : . ::. CCDS66 EDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG-HGKSKGYNRCPVAPPH 500 510 520 530 540 660 670 pF1KSD LPGPYPAD----IIPFSEPQSQAS : .: .: : ::.: CCDS66 -QGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFNRLTPFRK 550 560 570 580 590 >>CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX (516 aa) initn: 2052 init1: 1674 opt: 2044 Z-score: 1674.2 bits: 319.8 E(32554): 6.2e-87 Smith-Waterman score: 2044; 61.1% identity (81.8% similar) in 488 aa overlap (190-668:4-490) 160 170 180 190 200 210 pF1KSD SEEDLYDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGD ::. :.: :::.:::::: ..::.::::: CCDS35 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD 10 20 30 220 230 240 250 260 270 pF1KSD VIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDE-----PAD-DDAPLAGNSGAEDG ::.:.::.:..::::.. : ::::::::::: :::.. :.: ... : :: CCDS35 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL 40 50 60 70 80 90 280 290 300 310 320 330 pF1KSD GAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNI : :. .::::.::::::.:::: :::::.::::::..::::: ::::.:::..::::: CCDS35 GRPLQN-RDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNI 100 110 120 130 140 150 340 350 360 370 380 390 pF1KSD EDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLT ::::: : .::. ::...: . :::::.: :::::: : ::::::::: .::.:::.: CCDS35 EDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLM 160 170 180 190 200 210 400 410 420 430 440 450 pF1KSD KLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEA : :.: .:::::::::.::::..::::::::::::::::::::::::: .: :.. : : CCDS35 KDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAA 220 230 240 250 260 270 460 470 480 490 500 510 pF1KSD ALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQ :: .:.::.: ::::::::::::::::::.:. ::::::.: :::::::.::.. . :: CCDS35 ALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPY 280 290 300 310 320 330 520 530 540 550 560 570 pF1KSD AKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAF ...:::.:::::::.. :::::.:::.::::::.::: ::::.:::.: :..::.:::: CCDS35 GRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAF 340 350 360 370 380 390 580 590 600 610 620 630 pF1KSD RLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASK- .:: : . ::. ..: :.: :::.:: .::..:: :.. :: :.: :..:: ... : CCDS35 KLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKV 400 410 420 430 440 450 640 650 660 670 pF1KSD --QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS :. ... .. . :::. : . ..: . ::: CCDS35 PKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLT 460 470 480 490 500 510 CCDS35 PFKK >>CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX (495 aa) initn: 1969 init1: 1674 opt: 1961 Z-score: 1607.0 bits: 307.3 E(32554): 3.5e-83 Smith-Waterman score: 1961; 60.9% identity (81.7% similar) in 470 aa overlap (208-668:1-469) 180 190 200 210 220 230 pF1KSD PGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVA : ..::.:::::::.:.::.:..::::.. CCDS83 MANRELAFKAGDVIKVLDASNKDWWWGQID 10 20 30 240 250 260 270 280 290 pF1KSD DGEGWFPASFVRLRVNQDE-----PAD-DDAPLAGNSGAEDGGAEAQSSKDQMRTNVINE : ::::::::::: :::.. :.: ... : :: : :. .::::.::::: CCDS83 DEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQN-RDQMRANVINE 40 50 60 70 80 300 310 320 330 340 350 pF1KSD ILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRF :.:::: :::::.::::::..::::: ::::.:::..:::::::::: : .::. ::... CCDS83 IMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQY 90 100 110 120 130 140 360 370 380 390 400 410 pF1KSD NRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKM : . :::::.: :::::: : ::::::::: .::.:::.: : :.: .:::::::::.: CCDS83 NNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQM 150 160 170 180 190 200 420 430 440 450 460 470 pF1KSD IDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRR :::..::::::::::::::::::::::::: .: :.. : ::: .:.::.: ::::::: CCDS83 IDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRR 210 220 230 240 250 260 480 490 500 510 520 530 pF1KSD LENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYC :::::::::::.:. ::::::.: :::::::.::.. . :: ...:::.:::::::.. : CCDS83 LENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLC 270 280 290 300 310 320 540 550 560 570 580 590 pF1KSD KKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKP ::::.:::.::::::.::: ::::.:::.: :..::.::::.:: : . ::. ..: CCDS83 KKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKL 330 340 350 360 370 380 600 610 620 630 640 pF1KSD EQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASK---QQVTGKPKGRRTAAPP :.: :::.:: .::..:: :.. :: :.: :..:: ... : :. ... .. . :: CCDS83 EEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPP 390 400 410 420 430 440 650 660 670 pF1KSD PRLPGPYPADIIPFSEPQSQAS :. : . ..: . ::: CCDS83 PQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK 450 460 470 480 490 >>CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX (463 aa) initn: 1717 init1: 1674 opt: 1726 Z-score: 1416.3 bits: 271.9 E(32554): 1.4e-72 Smith-Waterman score: 1726; 59.2% identity (80.0% similar) in 436 aa overlap (242-668:3-437) 220 230 240 250 260 pF1KSD ELGFKAGDVIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDE-----PAD-DDAPLA :. .. : :::.. :.: ... : CCDS55 MQWIRGGSGMLWVNQEDEVEEGPSDVQNGHLD 10 20 30 270 280 290 300 310 320 pF1KSD GNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQ :: : :. .::::.::::::.:::: :::::.::::::..::::: ::::.:: CCDS55 PNSDCLCLGRPLQN-RDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQ 40 50 60 70 80 90 330 340 350 360 370 380 pF1KSD LRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNA :..:::::::::: : .::. ::...: . :::::.: :::::: : ::::::::: .: CCDS55 LKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDA 100 110 120 130 140 150 390 400 410 420 430 440 pF1KSD CVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQH :.:::.: : :.: .:::::::::.::::..::::::::::::::::::::::::: .: CCDS55 CMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDH 160 170 180 190 200 210 450 460 470 480 490 500 pF1KSD RDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGE :.. : ::: .:.::.: ::::::::::::::::::.:. ::::::.: :::::::.:: CCDS55 SDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGE 220 230 240 250 260 270 510 520 530 540 550 560 pF1KSD LTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDL .. . :: ...:::.:::::::.. :::::.:::.::::::.::: ::::.:::.: :. CCDS55 MAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDF 280 290 300 310 320 330 570 580 590 600 610 620 pF1KSD HVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQ .::.::::.:: : . ::. ..: :.: :::.:: .::..:: :.. :: :.: :..: CCDS55 NVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQ 340 350 360 370 380 390 630 640 650 660 670 pF1KSD AMLNASK---QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS : ... : :. ... .. . :::. : . ..: . ::: CCDS55 AAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPF 400 410 420 430 440 450 CCDS55 WQNFSRLTPFKK 460 >>CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX (414 aa) initn: 1702 init1: 1659 opt: 1694 Z-score: 1390.9 bits: 267.0 E(32554): 3.7e-71 Smith-Waterman score: 1694; 62.9% identity (83.5% similar) in 388 aa overlap (284-668:1-388) 260 270 280 290 300 310 pF1KSD QDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQ ::.::::::.:::: :::::.::::::..: CCDS55 MRANVINEIMSTERHYIKHLKDICEGYLKQ 10 20 30 320 330 340 350 360 370 pF1KSD CRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQ :::: ::::.:::..:::::::::: : .::. ::...: . :::::.: :::::: : CCDS55 CRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFW 40 50 60 70 80 90 380 390 400 410 420 430 pF1KSD IYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQ ::::::::: .::.:::.: : :.: .:::::::::.::::..::::::::::::::::: CCDS55 IYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQ 100 110 120 130 140 150 440 450 460 470 480 490 pF1KSD LAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDL :::::::: .: :.. : ::: .:.::.: ::::::::::::::::::.:. ::::::. CCDS55 LAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDI 160 170 180 190 200 210 500 510 520 530 540 550 pF1KSD LVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLE : :::::::.::.. . :: ...:::.:::::::.. :::::.:::.::::::.::: : CCDS55 LDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYE 220 230 240 250 260 270 560 570 580 590 600 610 pF1KSD VVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQE :::.:::.: :..::.::::.:: : . ::. ..: :.: :::.:: .::..:: :.. CCDS55 VVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEK 280 290 300 310 320 330 620 630 640 650 660 670 pF1KSD TGFSITELQRKQAMLNASK---QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS :: :.: :..:: ... : :. ... .. . :::. : . ..: . ::: CCDS55 IGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVF 340 350 360 370 380 390 CCDS55 EFTEPKRSQSPFWQNFSRLTPFKK 400 410 670 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 05:02:56 2016 done: Thu Nov 3 05:02:57 2016 Total Scan time: 3.990 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]