FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1831, 628 aa 1>>>pF1KSDA1831 628 - 628 aa - 628 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.6713+/-0.000872; mu= 2.5146+/- 0.053 mean_var=289.8946+/-57.405, 0's: 0 Z-trim(116.6): 20 B-trim: 0 in 0/55 Lambda= 0.075328 statistics sampled from 17251 (17269) to 17251 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.803), E-opt: 0.2 (0.53), width: 16 Scan time: 4.530 The best scores are: opt bits E(32554) CCDS9603.1 JPH4 gene_id:84502|Hs108|chr14 ( 628) 4359 487.0 3.2e-137 CCDS10962.1 JPH3 gene_id:57338|Hs108|chr16 ( 748) 1544 181.2 4.5e-45 CCDS6217.1 JPH1 gene_id:56704|Hs108|chr8 ( 661) 1492 175.5 2.1e-43 CCDS13325.1 JPH2 gene_id:57158|Hs108|chr20 ( 696) 1164 139.8 1.1e-32 CCDS13326.1 JPH2 gene_id:57158|Hs108|chr20 ( 129) 634 81.6 7.3e-16 >>CCDS9603.1 JPH4 gene_id:84502|Hs108|chr14 (628 aa) initn: 4359 init1: 4359 opt: 4359 Z-score: 2577.0 bits: 487.0 E(32554): 3.2e-137 Smith-Waterman score: 4359; 100.0% identity (100.0% similar) in 628 aa overlap (1-628:1-628) 10 20 30 40 50 60 pF1KSD MSPGGKFDFDDGGCYVGGWEAGRAHGYGVCTGPGAQGEYSGCWAHGFESLGVFTGPGGHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 MSPGGKFDFDDGGCYVGGWEAGRAHGYGVCTGPGAQGEYSGCWAHGFESLGVFTGPGGHS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD YQGHWQQGKREGLGVERKSRWTYRGEWLGGLKGRSGVWESVSGLRYAGLWKDGFQDGYGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 YQGHWQQGKREGLGVERKSRWTYRGEWLGGLKGRSGVWESVSGLRYAGLWKDGFQDGYGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ETYSDGGTYQGQWQAGKRHGYGVRQSVPYHQAALLRSPRRTSLDSGHSDPPTPPPPLPLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 ETYSDGGTYQGQWQAGKRHGYGVRQSVPYHQAALLRSPRRTSLDSGHSDPPTPPPPLPLP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD GDEGGSPASGSRGGFVLAGPGDADGASSRKRTPAAGGFFRRSLLLSGLRAGGRRSSLGSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 GDEGGSPASGSRGGFVLAGPGDADGASSRKRTPAAGGFFRRSLLLSGLRAGGRRSSLGSK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD RGSLRSEVSSEVGSTGPPGSEASGPPAAAPPALIEGSATEVYAGEWRADRRSGFGVSQRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 RGSLRSEVSSEVGSTGPPGSEASGPPAAAPPALIEGSATEVYAGEWRADRRSGFGVSQRS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD NGLRYEGEWLGNRRHGYGRTTRPDGSREEGKYKRNRLVHGGRVRSLLPLALRRGKVKEKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 NGLRYEGEWLGNRRHGYGRTTRPDGSREEGKYKRNRLVHGGRVRSLLPLALRRGKVKEKV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD DRAVEGARRAVSAARQRQEIAAARAADALLKAVAASSVAEKAVEAARMAKLIAQDLQPML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 DRAVEGARRAVSAARQRQEIAAARAADALLKAVAASSVAEKAVEAARMAKLIAQDLQPML 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD EAPGRRPRQDSEGSDTEPLDEDSPGVYENGLTPSEGSPELPSSPASSRQPWRPPACRSPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 EAPGRRPRQDSEGSDTEPLDEDSPGVYENGLTPSEGSPELPSSPASSRQPWRPPACRSPL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD PPGGDQGPFSSPKAWPEEWGGAGAQAEELAGYEAEDEAGMQGPGPRDGSPLLGGCSDSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 PPGGDQGPFSSPKAWPEEWGGAGAQAEELAGYEAEDEAGMQGPGPRDGSPLLGGCSDSSG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD SLREEEGEDEEPLPPLRAPAGTEPEPIAMLVLRGSSSRGPDAGCLTEELGEPAATERPAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 SLREEEGEDEEPLPPLRAPAGTEPEPIAMLVLRGSSSRGPDAGCLTEELGEPAATERPAQ 550 560 570 580 590 600 610 620 pF1KSD PGAANPLVVGAVALLDLSLAFLFSQLLT :::::::::::::::::::::::::::: CCDS96 PGAANPLVVGAVALLDLSLAFLFSQLLT 610 620 >>CCDS10962.1 JPH3 gene_id:57338|Hs108|chr16 (748 aa) initn: 1416 init1: 525 opt: 1544 Z-score: 922.7 bits: 181.2 E(32554): 4.5e-45 Smith-Waterman score: 1630; 47.4% identity (68.8% similar) in 625 aa overlap (1-591:1-605) 10 20 30 40 50 60 pF1KSD MSPGGKFDFDDGGCYVGGWEAGRAHGYGVCTGPGAQGEYSGCWAHGFESLGVFTGPGGHS :: ::.:.::::: : :::: :.:::.:::::: .::::.: :.:::: :::.: :.:.. CCDS10 MSSGGRFNFDDGGSYCGGWEDGKAHGHGVCTGPKGQGEYTGSWSHGFEVLGVYTWPSGNT 10 20 30 40 50 60 70 80 90 100 110 pF1KSD YQGHWQQGKREGLGVERKSRWTYRGEWLGGLKGRSGVWESV-SGLRYAGLWKDGFQDGYG ::: : ::::.:.:.: :..:.:.::: :.::: :: : . .: .: : :..:.::::: CCDS10 YQGTWAQGKRHGIGLESKGKWVYKGEWTHGFKGRYGVRECAGNGAKYEGTWSNGLQDGYG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD TETYSDGGTYQGQWQAGKRHGYGVRQSVPYHQAALLRSPRRTSLDSGHSDPP--TPPPPL :::::::::::::: .: :.:::::::::: .::..::: :::..: .:. : : CCDS10 TETYSDGGTYQGQWVGGMRQGYGVRQSVPYGMAAVIRSPLRTSINSLRSEHTNGTALHPD 130 140 150 160 170 180 180 190 200 210 220 230 pF1KSD PLPGDEGGSPASGSRGGFVLAGPGDADGASSRKRTPAAGGFFRRSLLLSGL--RAGGRRS :. .:::: :::::::.. .:.. .:.:. :.:::::: ::: : . .: CCDS10 ASPA-VAGSPAV-SRGGFVLVAHSDSEILKSKKK-----GLFRRSLL-SGLKLRKSESKS 190 200 210 220 230 240 250 260 270 280 pF1KSD SLGSKRG---SLRSEVS-SEVGSTGPP-GSEASGPPAAAPPALIE----GSATEVYAGEW ::.:.:. :.:::.. : :.::. : : : : :.:: ...::.:.::: CCDS10 SLASQRSKQSSFRSEAGMSTVSSTASDIHSTISLGEAEAELAVIEDDIDATTTETYVGEW 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD RADRRSGFGVSQRSNGLRYEGEWLGNRRHGYGRTTRPDGSREEGKYKRNRLVHGGRVRSL . :.::::::::::.::.::::: .::::::: : :::..::::::.: :: ::. ..: CCDS10 KNDKRSGFGVSQRSDGLKYEGEWASNRRHGYGCMTFPDGTKEEGKYKQNILV-GGKRKNL 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD LPLALRRGKVKEKVDRAVEGARRAVSAARQRQEIAAARAADALLKAVAASSVAEKAVEAA .: :: .:..::::::::.:.::.. :.:. ::::.:.. . :: :: ..:.:: : : CCDS10 IP--LRASKIREKVDRAVEAAERAATIAKQKAEIAASRTSHSRAKAEAALTAAQKAQEEA 360 370 380 390 400 410 420 430 440 450 pF1KSD RMAKLIAQDLQPMLE--APG---RRPRQDSEGSDTE------PLDEDSPGVYENGLTPSE :.:.. :....: .. : .::.... .: : ::...:: .:..: :::. CCDS10 RIARITAKEFSPSFQHRENGLEYQRPKRQTSCDDIEVLSTGTPLQQESPELYRKGTTPSD 410 420 430 440 450 460 460 470 480 490 500 510 pF1KSD GSPELPSSPASSRQPWRPPACRSPLPPGGDQ-GPFSSPKAWPEEWGG-AGAQAEELAGYE .:. .:: .: : : : : : . .. . :: . :: :: : :: CCDS10 LTPD--DSPLQSF-PTSPAATPPPAPAARNKVAHFSRQVSVDEERGGDIQMLLEGRAGDC 470 480 490 500 510 520 520 530 540 550 560 pF1KSD AEDEAGMQGPGPRDG---SPLLGG--CSD--SSGSLREEEGEDEEPLPPLRAPAGTEPEP :.. : . : : . : :: .: . :: :.. :. : : : :: : CCDS10 ARSSWGEEQAGGSRGVRSGALRGGLLVDDFRTRGSGRKQPGN---PKPRERR---TESPP 530 540 550 560 570 580 570 580 590 600 610 620 pF1KSD IAMLVLRGSSSRGPDAGCLTEELGEPAATERPAQPGAANPLVVGAVALLDLSLAFLFSQL . . . .: .: :: : CCDS10 VFTWTSHHRASNHSPGGSRLLELQEEKLSNYRMEMKPLLRMETHPQKRRYSKGGACRGLG 590 600 610 620 630 640 >>CCDS6217.1 JPH1 gene_id:56704|Hs108|chr8 (661 aa) initn: 886 init1: 707 opt: 1492 Z-score: 892.9 bits: 175.5 E(32554): 2.1e-43 Smith-Waterman score: 1517; 41.8% identity (64.8% similar) in 679 aa overlap (4-623:3-656) 10 20 30 40 50 60 pF1KSD MSPGGKFDFDDGGCYVGGWEAGRAHGYGVCTGPGAQGEYSGCWAHGFESLGVFTGPGGHS ::.::::::: : :::: :.:::.:.:::: .:::::: :.:::: .: .: :.:.. CCDS62 MTGGRFDFDDGGTYCGGWEEGKAHGHGICTGPKGQGEYSGSWSHGFEVVGGYTWPSGNT 10 20 30 40 50 70 80 90 100 110 pF1KSD YQGHWQQGKREGLGVERKSRWTYRGEWLGGLKGRSGVWESV-SGLRYAGLWKDGFQDGYG :::.: ::::.::::: :..: ::::: :.::: :: .:. . :: : :..:.::::: CCDS62 YQGYWAQGKRHGLGVETKGKWMYRGEWSHGFKGRYGVRQSLCTPARYEGTWSNGLQDGYG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD TETYSDGGTYQGQWQAGKRHGYGVRQSVPYHQAALLRSPRRTSLDSGHSDPPTPPPPLPL .:::.::::::::: .: :::::::::::: .:...::: :::: : .:. . : CCDS62 VETYGDGGTYQGQWAGGMRHGYGVRQSVPYGMATVIRSPLRTSLASLRSEQ-SNGSVLHD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD PGDEGGSPASGSRGGFVLAGPGDADGASSRKRTPAAGGFFRRSLLLSG--LRAGGRRSSL . . ::: :.:::::: .::. :...: ::.:::. ::.. :: . .::. CCDS62 AAAAADSPA-GTRGGFVLNFHADAELAGKKK-----GGLFRRGSLLGSMKLRKSESKSSI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD GSKRGSLRSEVS-SEVGSTGPPGSEASGPPAA--AP-PALIEGSATEVYAGEWRADRRSG .:::.:.::... :...:. .. . : : .....::.: :::. :.:.: CCDS62 SSKRSSVRSDAAMSRISSSDANSTISFGDVDCDFCPVEDHVDATTTETYMGEWKNDKRNG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD FGVSQRSNGLRYEGEWLGNRRHGYGRTTRPDGSREEGKYKRNRLVHGGRVRSLLPLALRR ::::.::::..::::: .:.::::: :. ::::.:::::: : ::.: : ..:.:. :. CCDS62 FGVSERSNGMKYEGEWANNKRHGYGCTVFPDGSKEEGKYKNNILVRGIR-KQLIPI--RH 300 310 320 330 340 360 370 380 390 400 410 pF1KSD GKVKEKVDRAVEGARRAVSAARQRQEIAAARAADALLKAVAASSVAEKAVEAARMAKLIA :..::::::.:::.::.. :: . ::: .:.: : :: ::...: : . .:. .: CCDS62 TKTREKVDRAIEGAQRAAAMARTKVEIANSRTAHARAKADAADQAALAARQECDIARAVA 350 360 370 380 390 400 420 430 440 450 pF1KSD QDLQPMLEAPG-RRPRQD-SEGSDTE-----------PLDEDSPGVYENGLTPS---EGS ..:.: . :: .: .:: :.. : ..:: :..: :: :.: CCDS62 RELSPDFYQPGPDYVKQRFQEGVDAKENPEEKVPEKPPTPKESPHFYRKGTTPPRSPEAS 410 420 430 440 450 460 460 470 480 pF1KSD PELPSSPASSRQPWR----------------------------PPACRSPLPPGG---DQ :. ::::: .: . : ..: .: : CCDS62 PKHSHSPASSPKPLKKQNPSSGARLNQDKRSVADEQVTAIVNKPLMSKAPTKEAGAVVPQ 470 480 490 500 510 520 490 500 510 520 530 540 pF1KSD GPFSSPKAWPEEWGGAGAQAEELAGYEAEDEAGMQGP-GPRDGSPLLGGCSDSSGSLREE . .:. . :. . : . :: .. .: .. : .::. : :.::..: .. CCDS62 SKYSGRHHIPNP--SNGELHSQYHGYYVKLNAPQHPPVDVEDGD----GSSQSSSALVHK 530 540 550 560 570 580 550 560 570 580 590 600 pF1KSD EGEDE-EPLPPLRAPAGTEP--EPIAMLV-LRGSSSRGPDAGCLTEELGEPAATERPAQP . .. : . :.. : :: : : .. . . .: :: :. :. CCDS62 PSANKWSPSKSVTKPVAKESKAEPKAKKSELAIPKNPASNDSC-------PA-LEKEANS 590 600 610 620 630 610 620 pF1KSD GAANPLVVGAVALLDLSLAFLFSQLLT : : ... : ::...::.:: CCDS62 GP-NSIMIVLVMLLNIGLAILFVHFLT 640 650 660 >>CCDS13325.1 JPH2 gene_id:57158|Hs108|chr20 (696 aa) initn: 870 init1: 509 opt: 1164 Z-score: 699.9 bits: 139.8 E(32554): 1.1e-32 Smith-Waterman score: 1560; 44.0% identity (65.4% similar) in 647 aa overlap (4-603:3-635) 10 20 30 40 50 60 pF1KSD MSPGGKFDFDDGGCYVGGWEAGRAHGYGVCTGPGAQGEYSGCWAHGFESLGVFTGPGGHS ::.::::::: : ::::.:.:::.:.:::: .:::::: : ::: ::.: :.:.. CCDS13 MSGGRFDFDDGGAYCGGWEGGKAHGHGLCTGPKGQGEYSGSWNFGFEVAGVYTWPSGNT 10 20 30 40 50 70 80 90 100 110 pF1KSD YQGHWQQGKREGLGVERKSRWTYRGEWLGGLKGRSGVWESVS-GLRYAGLWKDGFQDGYG ..:.:.::::.:::.: :.:: :.::: :.::: :. .: : : .: : :..:.::::: CCDS13 FEGYWSQGKRHGLGIETKGRWLYKGEWTHGFKGRYGIRQSSSSGAKYEGTWNNGLQDGYG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD TETYSDGGTYQGQWQAGKRHGYGVRQSVPYHQAALLRSPRRTSLDS---GHSDPPTPPPP ::::.::::::::. : :::::::::::: .:...::: ::::.: ::. . : CCDS13 TETYADGGTYQGQFTNGMRHGYGVRQSVPYGMAVVVRSPLRTSLSSLRSEHSNGTVAPDS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD LPLPGDEGG---SPASGSRGGFVLAGPGDADGASSRKRTPAAGGFFRRSLLLSGLRAGGR :...: ::: ::::.:. ..:..:. :.: .::.:.:. ::. :: . CCDS13 PASPASDGPALPSPAI-PRGGFALSLLANAEAAA---RAPKGGGLFQRGALLGKLRRAES 180 190 200 210 220 230 240 250 260 270 280 pF1KSD RSSLGSKRGS---LRSEVSS---EVGSTGPPGSEASGPPAAAP-PALIEGSATEVYAGEW :.:.::.:. :.:..:: ...::. : : : ::: : :....::.: ::: CCDS13 RTSVGSQRSRVSFLKSDLSSGASDAASTASLGEAAEGADEAAPFEADIDATTTETYMGEW 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD RADRRSGFGVSQRSNGLRYEGEWLGNRRHGYGRTTRPDGSREEGKYKRNRLVHGGRVRSL . :.:::::::.::.::::::::: : ::::: :: ::: ::::::..: ::. . : : CCDS13 KNDKRSGFGVSERSSGLRYEGEWLDNLRHGYGCTTLPDGHREEGKYRHNVLVKDTKRRML 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD LPLALRRGKVKEKVDRAVEGARRAVSAARQRQEIAAARAADALLKAVAASSVAEKAVEAA :. .::..::...::::.::.. :::. ::::.:.. : :: :: ..: : . . CCDS13 ---QLKSNKVRQKVEHSVEGAQRAAAIARQKAEIAASRTSHAKAKAEAAEQAALAANQES 360 370 380 390 400 410 410 420 430 440 450 pF1KSD RMAKLIAQDLQPMLEAPG-----RRPRQDS-EGSDT--EPLDEDSPGVYENGLT-PSEGS .:. .:..: : . :: :: :. :.:.. :: :. :. :: : . : CCDS13 NIARTLARELAPDFYQPGPEYQKRRLLQEILENSESLLEPPDR---GAGAAGLPQPPRES 420 430 440 450 460 460 470 480 490 500 pF1KSD PEL-----PSSPASSRQPW-RPPACRSPLPPGGDQGPFSSPKAWPEEWGGAGAQA---EE :.: : ..: .: :: . : : : .. . :: :: : .: :... : CCDS13 PQLHERETPRPEGGSPSPAGTPPQPKRPRP-GVSKDGLLSPGAWNGEPSGEGSRSVTPSE 470 480 490 500 510 520 510 520 530 540 550 pF1KSD LAGYEAED---------EAGMQGPGPRDGSPLLGGCSDSSGSLREEEGE----DEEPLPP :: .. :: . :.: . . : ..: : ...: : CCDS13 GAGRRSPARPATERMAIEALQAPPAPSREPEVALYQGYHSYAVRTTPPEPPPFEDQPEPE 530 540 550 560 570 580 560 570 580 590 600 610 pF1KSD LRAPAGTEPEPI--AMLVLRGSSSRGPDAGCLTEELGEPAATERPAQPGAANPLVVGAVA . .:.: : : :.. . :::. . : :: :.: : CCDS13 V---SGSESAPSSPATAPLQAPTLRGPEPARETPAKLEPKPIIPKAEPRAKARKTEARGL 590 600 610 620 630 640 620 pF1KSD LLDLSLAFLFSQLLT CCDS13 TKAGAKKKARKEAALAAEAEVEVEEVPNTILICMVILLNIGLAILFVHLLT 650 660 670 680 690 >>CCDS13326.1 JPH2 gene_id:57158|Hs108|chr20 (129 aa) initn: 580 init1: 509 opt: 634 Z-score: 398.2 bits: 81.6 E(32554): 7.3e-16 Smith-Waterman score: 634; 63.2% identity (84.0% similar) in 125 aa overlap (4-127:3-127) 10 20 30 40 50 60 pF1KSD MSPGGKFDFDDGGCYVGGWEAGRAHGYGVCTGPGAQGEYSGCWAHGFESLGVFTGPGGHS ::.::::::: : ::::.:.:::.:.:::: .:::::: : ::: ::.: :.:.. CCDS13 MSGGRFDFDDGGAYCGGWEGGKAHGHGLCTGPKGQGEYSGSWNFGFEVAGVYTWPSGNT 10 20 30 40 50 70 80 90 100 110 pF1KSD YQGHWQQGKREGLGVERKSRWTYRGEWLGGLKGRSGVWESVS-GLRYAGLWKDGFQDGYG ..:.:.::::.:::.: :.:: :.::: :.::: :. .: : : .: : :..:.::::: CCDS13 FEGYWSQGKRHGLGIETKGRWLYKGEWTHGFKGRYGIRQSSSSGAKYEGTWNNGLQDGYG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD TETYSDGGTYQGQWQAGKRHGYGVRQSVPYHQAALLRSPRRTSLDSGHSDPPTPPPPLPL ::::.::: CCDS13 TETYADGGMC 120 628 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:28:01 2016 done: Thu Nov 3 07:28:02 2016 Total Scan time: 4.530 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]