FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1971, 809 aa 1>>>pF1KSDA1971 809 - 809 aa - 809 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.6843+/-0.00111; mu= -10.9235+/- 0.067 mean_var=474.3961+/-97.086, 0's: 0 Z-trim(115.2): 16 B-trim: 0 in 0/55 Lambda= 0.058885 statistics sampled from 15781 (15791) to 15781 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.485), width: 16 Scan time: 4.650 The best scores are: opt bits E(32554) CCDS45333.1 WHAMM gene_id:123720|Hs108|chr15 ( 809) 5492 481.5 2.5e-135 CCDS4047.3 JMY gene_id:133746|Hs108|chr5 ( 988) 1177 115.0 6.4e-25 >>CCDS45333.1 WHAMM gene_id:123720|Hs108|chr15 (809 aa) initn: 5492 init1: 5492 opt: 5492 Z-score: 2543.2 bits: 481.5 E(32554): 2.5e-135 Smith-Waterman score: 5492; 100.0% identity (100.0% similar) in 809 aa overlap (1-809:1-809) 10 20 30 40 50 60 pF1KSD MEDEQPDSLEGWVPVREGLFAEPERHRLRFLVAWNGAEGKFAVTCHDRTAQQRRLREGAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MEDEQPDSLEGWVPVREGLFAEPERHRLRFLVAWNGAEGKFAVTCHDRTAQQRRLREGAR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD LGPEPEPKPEAAVSPSSWAGLLSAAGLRGAHRQLAALWPPLERCFPRLPPELDVGGGGAW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LGPEPEPKPEAAVSPSSWAGLLSAAGLRGAHRQLAALWPPLERCFPRLPPELDVGGGGAW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GLGLGLWALLWPTRAGPGEAALQELCGQLERYLGAAADGCGGATVRDALFPAEGGAADCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GLGLGLWALLWPTRAGPGEAALQELCGQLERYLGAAADGCGGATVRDALFPAEGGAADCE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD SPREFRERALRARWVEADARLRQVIQGHGKANTMVALMNVYQEEDEAYQELVTVATMFFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SPREFRERALRARWVEADARLRQVIQGHGKANTMVALMNVYQEEDEAYQELVTVATMFFQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD YLLQPFRAMREVATLCKLDILKSLDEDDLGPRRVVALEKEAEEWTRRAEEAVVSIQDITV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 YLLQPFRAMREVATLCKLDILKSLDEDDLGPRRVVALEKEAEEWTRRAEEAVVSIQDITV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD NYFKETVKALAGMQKEMEQDAKRFGQAAWATAIPRLEKLQLMLARETLQLMRAKELCLNH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NYFKETVKALAGMQKEMEQDAKRFGQAAWATAIPRLEKLQLMLARETLQLMRAKELCLNH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD KRAEIQGKMEDLPEQEKNTNVVDELEIQFYEIQLELYEVKFEILKNEEILLTTQLDSLKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KRAEIQGKMEDLPEQEKNTNVVDELEIQFYEIQLELYEVKFEILKNEEILLTTQLDSLKR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD LIKEKQDEVVYYDPCENPEELKVIDCVVGLQDDKNLEVKELRRQCQQLESKRGRICAKRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LIKEKQDEVVYYDPCENPEELKVIDCVVGLQDDKNLEVKELRRQCQQLESKRGRICAKRA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD SLRSRKDQCKENHRFRLQQAEESIRYSRQHHSIQMKRDKIKEEEQKKKEWINQERQKTLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SLRSRKDQCKENHRFRLQQAEESIRYSRQHHSIQMKRDKIKEEEQKKKEWINQERQKTLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD RLRSFKDKRLAQSVRNTSGSEPVAPNLPSDLSQQMCLPASHAVSVIHPSSRKTRGVPLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RLRSFKDKRLAQSVRNTSGSEPVAPNLPSDLSQQMCLPASHAVSVIHPSSRKTRGVPLSE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD AGNVKSPKCQNCHGNIPVQVFVPVGDQTHSKSSEELSLPPPPPPPPPPPPPPPPPPPPLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AGNVKSPKCQNCHGNIPVQVFVPVGDQTHSKSSEELSLPPPPPPPPPPPPPPPPPPPPLR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD ALSSSSQAATHQNLGFRAPVKDDQPRPLVCESPAERPRDSLESFSCPGSMDEVLASLRHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ALSSSSQAATHQNLGFRAPVKDDQPRPLVCESPAERPRDSLESFSCPGSMDEVLASLRHG 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD RAPLRKVEVPAVRPPHASINEHILAAIRQGVKLKKVHPDLGPNPSSKPTSNRRTSDLERS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RAPLRKVEVPAVRPPHASINEHILAAIRQGVKLKKVHPDLGPNPSSKPTSNRRTSDLERS 730 740 750 760 770 780 790 800 pF1KSD IKAALQRIKRVSADSEEDSDEQDPGQWDG ::::::::::::::::::::::::::::: CCDS45 IKAALQRIKRVSADSEEDSDEQDPGQWDG 790 800 >>CCDS4047.3 JMY gene_id:133746|Hs108|chr5 (988 aa) initn: 1674 init1: 1081 opt: 1177 Z-score: 560.9 bits: 115.0 E(32554): 6.4e-25 Smith-Waterman score: 1576; 37.3% identity (64.4% similar) in 786 aa overlap (63-804:214-982) 40 50 60 70 80 90 pF1KSD AWNGAEGKFAVTCHDRTAQQRRLREGARLGPEPEPKPEAAVSPSSWAGLLSAAGLRGAHR : : . :. . :::::.: ::..:. CCDS40 SASGTVSEEIEVLEMVKEDEAPLALSDAEQPPPATELESPAEECSWAGLFSFQDLRAVHQ 190 200 210 220 230 240 100 110 120 130 140 150 pF1KSD QLAALWPPLERCFPRLPPELDVGGGGAWGLGLGLWALLWPTRAGPGEAALQELCGQLERY :: .. :: :.: .: : . :.:..:. : .. :: ::. : CCDS40 QLCSVNSQLEPCLPVFPEEPS-----------GMWTVLFGGAPEMTEQEIDTLCYQLQVY 250 260 270 280 290 160 170 180 190 200 210 pF1KSD LGAAADGCGGATVRDALFPAEGGAADC-ESPREFRERALRARWVEADARLRQVIQGHGKA :: . : :: . ..:: . :: :.:... . .: :...... : .. CCDS40 LGHGLDTCGWKILSQVLFTETDDPEEYYESLSELRQKGYEEVLQRARKRIQELLDKHKNT 300 310 320 330 340 350 220 230 240 250 260 270 pF1KSD NTMVALMNVYQEEDEAYQELVTVATMFFQYLLQPFRAMREVATLCKLDILKSLDEDDLGP ..:: :...:: :::::. :. ..: ..:::::::: :::.: : . .: :...: ::: CCDS40 ESMVELLDLYQMEDEAYSSLAEATTELYQYLLQPFRDMRELAMLRRQQIKISMENDYLGP 360 370 380 390 400 410 280 290 300 310 320 330 pF1KSD RRVVALEKEAEEWTRRAEEAVVSIQDITVNYFKETVKALAGMQKEMEQDAKRFGQAAWAT ::. .:.:: .: :.:. ::.::::.::.::. :.:: .. .:. : :.::.:.::. CCDS40 RRIESLQKEDADWQRKAHMAVLSIQDLTVKYFEITAKAQKAVYDRMRADQKKFGKASWAA 420 430 440 450 460 470 340 350 360 370 380 390 pF1KSD AIPRLEKLQLMLARETLQLMRAKELCLNHKRAEIQGKMEDLPEQEKNTNVVDELEIQFYE : :.:::: ...::::.:::::.::.... .. .:..: . .:.:: ..:. CCDS40 AAERMEKLQYAVSKETLQMMRAKEICLEQRKHALKEEMQSLRGGTEAIARLDQLEADYYD 480 490 500 510 520 530 400 410 420 430 440 450 pF1KSD IQLELYEVKFEILKNEEILLTTQLDSLKRLIKEKQDEVVYYDPCENPEELKVIDCVVGLQ .::.::::.::::: ::.:::.::.:.::::.::.::::::: :. : . . ... CCDS40 LQLQLYEVQFEILKCEELLLTAQLESIKRLISEKRDEVVYYDTYESMEAMLEKEEMAASA 540 550 560 570 580 590 460 470 480 490 500 510 pF1KSD DDKNLEVKELRRQCQQLESKRGRICAKRASLRSRKDQCKENHRFRLQQAEESIRYSRQHH . :...:... .:::..:::. ::.. ::..:. : .: ..:: . : :: CCDS40 YLQREELQKLQQKARQLEARRGRVSAKKSYLRNKKEICIAKHNEKIQQRTRIEDEYRTHH 600 610 620 630 640 650 520 530 540 550 pF1KSD SIQMKRDKIKEEEQKKKEWINQERQKTLQRLRSFKDK------------RLAQSVRNTSG ..:.::.:...::..:. :..::::.::.:::.::.. :::.. :. .. CCDS40 TVQLKREKLHDEEERKSAWVSQERQRTLDRLRTFKQRYPGQVILKSTRLRLAHARRKGAA 660 670 680 690 700 710 560 570 580 590 600 pF1KSD SEPV-----APNLPSDLSQQMCLPASHAVSVIHPSSRKTRG---VPLSEAG----NVKSP : :: .::: :. . : . :. :. : : ... .. : CCDS40 S-PVLQEDHCDSLPSVLQVEEKTEEVGEGRVKRGPSQTTEPQSLVQLEDTSLTQLEATSL 720 730 740 750 760 770 610 620 630 640 650 660 pF1KSD KCQNCHGNIPVQVFVPVGDQTHSKSS---EELSLPPPPPPPPPPPPPPPPPPPPLRALSS .. ...: . .:. ... : . : : :: :::::::::::::::: . .. CCDS40 PLSGVTSELPPTISLPLLNNNLEPCSVTINPLPSPLPPTPPPPPPPPPPPPPPPLPVAKD 780 790 800 810 820 830 670 680 690 700 710 pF1KSD SSQAATHQNLGF------RAPVKDDQPRPLVCESP---AERPR-----DSLESFSCPGSM :. . ...: : : . . : . .: . : . ..:. . : CCDS40 SGPETLEKDLPRKEGNEKRIPKSASAPSAHLFDSSQLVSARKKLRKTAEGLQRRRVSSPM 840 850 860 870 880 890 720 730 740 750 760 pF1KSD DEVLASLRHGRAPLRKVEVPAVRP-PHASINEHILAAIRQGVKLKKVHPD-LGPNPSSKP :::::::..: :.::: .. : : . ...::: ::.:::::::. : : . . : CCDS40 DEVLASLKRGSFHLKKVEQRTLPPFPDEDDSNNILAQIRKGVKLKKVQKDVLRESFTLLP 900 910 920 930 940 950 770 780 790 800 pF1KSD TSNRRTSDLERSIKAALQRIKRVSADSEEDSDEQDPGQWDG :. : :::. ::.:::..: .:: : .: : CCDS40 D----TDPLTRSIHEALRRIKEASPESE-DEEEALPCTDWEN 960 970 980 809 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:53:53 2016 done: Thu Nov 3 07:53:54 2016 Total Scan time: 4.650 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]