FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0269, 559 aa 1>>>pF1KSDA0269 559 - 559 aa - 559 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 16.2270+/-0.00122; mu= -29.0589+/- 0.074 mean_var=761.4374+/-155.974, 0's: 0 Z-trim(117.4): 82 B-trim: 0 in 0/55 Lambda= 0.046479 statistics sampled from 18085 (18156) to 18085 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.558), width: 16 Scan time: 4.420 The best scores are: opt bits E(32554) CCDS5080.1 WASF1 gene_id:8936|Hs108|chr6 ( 559) 3878 275.0 1.6e-73 CCDS304.1 WASF2 gene_id:10163|Hs108|chr1 ( 498) 1240 98.1 2.7e-20 CCDS9318.1 WASF3 gene_id:10810|Hs108|chr13 ( 502) 1182 94.2 4e-19 CCDS76626.1 WASF3 gene_id:10810|Hs108|chr13 ( 499) 1151 92.1 1.7e-18 CCDS55582.1 WASF2 gene_id:10163|Hs108|chr1 ( 281) 1011 82.5 7.3e-16 >>CCDS5080.1 WASF1 gene_id:8936|Hs108|chr6 (559 aa) initn: 3878 init1: 3878 opt: 3878 Z-score: 1433.3 bits: 275.0 E(32554): 1.6e-73 Smith-Waterman score: 3878; 100.0% identity (100.0% similar) in 559 aa overlap (1-559:1-559) 10 20 30 40 50 60 pF1KSD MPLVKRNIDPRHLCHTALPRGIKNELECVTNISLANIIRQLSSLSKYAEDIFGELFNEAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 MPLVKRNIDPRHLCHTALPRGIKNELECVTNISLANIIRQLSSLSKYAEDIFGELFNEAH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SFSFRVNSLQERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 SFSFRVNSLQERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LQETYDVCEQPPPLNILTPYRDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LQETYDVCEQPPPLNILTPYRDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QKNLDRPHEPEKVPRAPHDRRREWQKLAQGPELAEDDANLLHKHIEVANGPASHFETRPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 QKNLDRPHEPEKVPRAPHDRRREWQKLAQGPELAEDDANLLHKHIEVANGPASHFETRPQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD TYVDHMDGSYSLSALPFSQMSELLTRAEERVLVRPHEPPPPPPMHGAGDAKPIPTCISSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 TYVDHMDGSYSLSALPFSQMSELLTRAEERVLVRPHEPPPPPPMHGAGDAKPIPTCISSA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD TGLIENRPQSPATGRTPVFVSPTPPPPPPPLPSALSTSSLRASMTSTPPPPVPPPPPPPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 TGLIENRPQSPATGRTPVFVSPTPPPPPPPLPSALSTSSLRASMTSTPPPPVPPPPPPPA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TALQAPAVPPPPAPLQIAPGVLHPAPPPIAPPLVQPSPPVARAAPVCETVPVHPLPQGEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 TALQAPAVPPPPAPLQIAPGVLHPAPPPIAPPLVQPSPPVARAAPVCETVPVHPLPQGEV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD QGLPPPPPPPPLPPPGIRPSSPVTVTALAHPPSGLHPTPSTAPGPHVPLMPPSPPSQVIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 QGLPPPPPPPPLPPPGIRPSSPVTVTALAHPPSGLHPTPSTAPGPHVPLMPPSPPSQVIP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD ASEPKRHPSTLPVISDARSVLLEAIRKGIQLRKVEEQREQEAKHERIENDVATILSRRIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 ASEPKRHPSTLPVISDARSVLLEAIRKGIQLRKVEEQREQEAKHERIENDVATILSRRIA 490 500 510 520 530 540 550 pF1KSD VEYSDSEDDSEFDEVDWLE ::::::::::::::::::: CCDS50 VEYSDSEDDSEFDEVDWLE 550 >>CCDS304.1 WASF2 gene_id:10163|Hs108|chr1 (498 aa) initn: 1140 init1: 954 opt: 1240 Z-score: 477.9 bits: 98.1 E(32554): 2.7e-20 Smith-Waterman score: 1638; 50.4% identity (67.3% similar) in 571 aa overlap (1-557:1-496) 10 20 30 40 50 60 pF1KSD MPLVKRNIDPRHLCHTALPRGIKNELECVTNISLANIIRQLSSLSKYAEDIFGELFNEAH :::: :::.:::::. .:: ....::::::::.:::.::::.::::::::::::::..:. CCDS30 MPLVTRNIEPRHLCRQTLP-SVRSELECVTNITLANVIRQLGSLSKYAEDIFGELFTQAN 10 20 30 40 50 70 80 90 100 110 120 pF1KSD SFSFRVNSLQERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIP .:. ::.:: ::::::.:.::::::::::.::: :. ::::::::::::.::::..::.: CCDS30 TFASRVSSLAERVDRLQVKVTQLDPKEEEVSLQGINTRKAFRSSTIQDQKLFDRNSLPVP 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD LQETYDVCEQPPPLNILTPYRDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQK . :::..:. ::::: ::::::::::.:::::.::::::::::::::::.: :::::.. CCDS30 VLETYNTCDTPPPLNNLTPYRDDGKEALKFYTDPSYFFDLWKEKMLQDTKDIMKEKRKHR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KSD QKNLDRPHEPEKVPRAPHDRRREWQKLAQGPELAEDDANLLHKHIEVANGPASHFETRPQ ... : :.. . :: . :..::.:. .: :..:. .: : ... : CCDS30 KEKKDNPNRGNVNPRKIKTRKEEWEKMKMGQEFVESKEKL---------GTSGY----PP 180 190 200 210 220 250 260 270 280 290 pF1KSD TYVDHMDGSYSLSALPFSQMSELLTRAEERVLVRPHEPPP-------PPPMHGAGDAKPI : : ...:: . : : . . ::: : : . . : CCDS30 TLV-YQNGSIGCV---------------ENVDASSYPPPPQSDSASSPSPSFSEDNLPPP 230 240 250 260 270 300 310 320 330 340 350 pF1KSD PTCISSATGLIENRPQSPATG--RTPVFVSPTPPPPPPPLPSALSTSSLRASMTSTPPPP :. .: ..:. : .: :. : :::. ::: ::: : . . : . :::: CCDS30 PAEFSYP---VDNQRGSGLAGPKRSSV-VSPSHPPPAPPLGSPPGPKPGFAPPPAPPPPP 280 290 300 310 320 360 370 380 390 400 pF1KSD VPP----PPPPPATALQAPAVPPPPAPLQIAPGVLHPAPPPIAPPLVQPSPPVARAAPVC :: ::::: ... .:..::::.: .. : :::: :: :: : : CCDS30 -PPMIGIPPPPPPVGFGSPGTPPPPSPPSFPPHPDFAAPPP--PP-----PPPAADYP-- 330 340 350 360 370 410 420 430 440 450 460 pF1KSD ETVPVHPLPQGEVQGLPPPPPPPPLPPPGIRPSSPVTVTALAHPPSGLHPTPSTAPGPHV :.: :: : . : :::::::: ::: :: : : :. . CCDS30 -TLPPPPLSQ-PTGGAPPPPPPPP--PPG--------------PP----PPPFTGADGQ- 380 390 400 410 470 480 490 500 510 520 pF1KSD PLMPPSPPSQVIPASEPKRHPSTLPVISDARSVLLEAIRKGIQLRKVEEQREQEAKHERI : .:: : :. . :.::..::::: :: :::.:.:::.:::::::: :.. . CCDS30 PAIPP-------PLSDTTKPKSSLPAVSDARSDLLSAIRQGFQLRRVEEQREQE-KRDVV 420 430 440 450 460 530 540 550 pF1KSD ENDVATILSRRIAVEYSDSEDDS-EFDEVDWLE :::::::::::::::::::::: :::: :: CCDS30 GNDVATILSRRIAVEYSDSEDDSSEFDEDDWSD 470 480 490 >>CCDS9318.1 WASF3 gene_id:10810|Hs108|chr13 (502 aa) initn: 1513 init1: 915 opt: 1182 Z-score: 456.9 bits: 94.2 E(32554): 4e-19 Smith-Waterman score: 1566; 49.9% identity (65.2% similar) in 561 aa overlap (1-557:1-500) 10 20 30 40 50 60 pF1KSD MPLVKRNIDPRHLCHTALPRGIKNELECVTNISLANIIRQLSSLSKYAEDIFGELFNEAH ::::::::.:::::. :::.:: .::::::: .:: ::::::::::.::::::::::::. CCDS93 MPLVKRNIEPRHLCRGALPEGITSELECVTNSTLAAIIRQLSSLSKHAEDIFGELFNEAN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SFSFRVNSLQERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIP .: .:.::::.:.:::.:.::::: ::.:::::.:.:::.:::.::::. .....: : CCDS93 NFYIRANSLQDRIDRLAVKVTQLDSTVEEVSLQDINMKKAFKSSTVQDQQVVSKNSIPNP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LQETYDVCEQPPPLNILTPYRDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQK . . :. ..::::::::::::: :.::::::.::::::::::::::::::::::::.:: CCDS93 VADIYNQSDKPPPLNILTPYRDDKKDGLKFYTDPSYFFDLWKEKMLQDTEDKRKEKRRQK 130 140 150 160 170 180 190 200 210 220 230 pF1KSD -QKNLDRPHEPEKVPRAPHDRRREWQKLAQGPELAEDDANLLHKHIEVANGPASHFETRP :: .: . : : ..::.::. .: :: : : : . : .: .:. : CCDS93 EQKRIDGTTREVKKVRKARNRRQEWNMMAYDKELRPD--NRLSQ--SVYHGASSEGSLSP 190 200 210 220 230 240 250 260 270 280 290 pF1KSD QTYVDHMDGS-YSLSALPFSQMSELLTRAEERVLVRPHEPPPPPPMHGAGDAKPIPTCIS .: : . :: : : .. : : : : ..:::. : . CCDS93 DTRSHASDVTDYSYPATPNHSL---------------H-PQPVTPSYAAGDVPPHGPASQ 240 250 260 270 280 300 310 320 330 340 350 pF1KSD SATGLIENRPQSPATGRTPVFVSPTPPPPPPPLPSALSTSSLRASMTSTPPPPVPPPP-P .: : :: : :..: .. : :::::: :.: ..:..:.: :. : CCDS93 AAEH--EYRPPS-ASARHMALNRPQQPPPPPP-PQAP-----EGSQASAPMAPADYGMLP 290 300 310 320 330 360 370 380 390 400 410 pF1KSD PPATALQAPAVPPPPAPLQIAPGVLHPAPPPIAPPLVQP-SPPVARAAPVCETVPVHPLP :. :::: : : :. : .. :: .: .:: .: ...: :: CCDS93 AQIIEYYNPSGPPPPPP----PPVIPSAQTAFVSPLQMPMQPPFPASASSTHAAPPHPPS 340 350 360 370 380 420 430 440 450 460 470 pF1KSD QGEVQGLPPPPPPPPLPPPGIRPSSPVTVTALAHPPSGLHPTPSTAPGPHVPLMPPSPPS : . :::: ::: :::: ::. :: . : : CCDS93 TGLLVTAPPPPGPPP-PPPG--------------PPG---------PGSSLSSSPMHGP- 390 400 410 420 480 490 500 510 520 530 pF1KSD QVIPASEPKRHPSTLPVISDARSVLLEAIRKGIQLRKVEEQREQEAKHERIENDVATILS :..: ::. . : :::::: :: ::: ::::.::.::::::::.: . :::::::: CCDS93 ---PVAEAKRQEPAQPPISDARSDLLAAIRMGIQLKKVQEQREQEAKREPVGNDVATILS 430 440 450 460 470 540 550 pF1KSD RRIAVEYSDSEDDSEFDEVDWLE ::::::::::.::::::: :: CCDS93 RRIAVEYSDSDDDSEFDENDWSD 480 490 500 >>CCDS76626.1 WASF3 gene_id:10810|Hs108|chr13 (499 aa) initn: 1511 init1: 913 opt: 1151 Z-score: 445.7 bits: 92.1 E(32554): 1.7e-18 Smith-Waterman score: 1531; 49.3% identity (65.5% similar) in 562 aa overlap (1-557:1-497) 10 20 30 40 50 60 pF1KSD MPLVKRNIDPRHLCHTALPRGIKNELECVTNISLANIIRQLSSLSKYAEDIFGELFNEAH ::::::::.:::::. :::.:: .::::::: .:: ::::::::::.::::::::::::. CCDS76 MPLVKRNIEPRHLCRGALPEGITSELECVTNSTLAAIIRQLSSLSKHAEDIFGELFNEAN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SFSFRVNSLQERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIP .: .:.::::.:.:::.:.::::: ::.:::::.:.:::.:::.::::. .....: : CCDS76 NFYIRANSLQDRIDRLAVKVTQLDSTVEEVSLQDINMKKAFKSSTVQDQQVVSKNSIPNP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LQETYDVCEQPPPLNILTPYRDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQK . . :. ..::::::::::::: :.::::::.::::::::::::::::::::::::.:: CCDS76 VADIYNQSDKPPPLNILTPYRDDKKDGLKFYTDPSYFFDLWKEKMLQDTEDKRKEKRRQK 130 140 150 160 170 180 190 200 210 220 230 pF1KSD -QKNLDRPHEPEKVP-RAPHDRRREWQKLAQGPELAEDDANLLHKHIEVANGPASHFETR .:. :.. ..: : . :..::.. .: :. : :..: : : :. : : CCDS76 REKHKLNPNRNQQVNVRKVRTRKEEWERRKMGIEFMSDA-----KKLEQA-GSAK--EDR 190 200 210 220 230 240 250 260 270 280 290 pF1KSD PQTYVDHMDGS-YSLSALPFSQMSELLTRAEERVLVRPHEPPPPPPMHGAGDAKPIPTCI . : . :: : : .. : : : : ..:::. : CCDS76 VPSGSHASDVTDYSYPATPNHSL---------------H-PQPVTPSYAAGDVPPHGPAS 240 250 260 270 300 310 320 330 340 350 pF1KSD SSATGLIENRPQSPATGRTPVFVSPTPPPPPPPLPSALSTSSLRASMTSTPPPPVPPPP- ..: : :: : :..: .. : :::::: :.: ..:..:.: :. CCDS76 QAAEH--EYRPPS-ASARHMALNRPQQPPPPPP-PQAP-----EGSQASAPMAPADYGML 280 290 300 310 320 360 370 380 390 400 410 pF1KSD PPPATALQAPAVPPPPAPLQIAPGVLHPAPPPIAPPLVQP-SPPVARAAPVCETVPVHPL : :. :::: : : :. : .. :: .: .:: .: ...: :: CCDS76 PAQIIEYYNPSGPPPPPP----PPVIPSAQTAFVSPLQMPMQPPFPASASSTHAAPPHPP 330 340 350 360 370 380 420 430 440 450 460 470 pF1KSD PQGEVQGLPPPPPPPPLPPPGIRPSSPVTVTALAHPPSGLHPTPSTAPGPHVPLMPPSPP : . :::: ::: :::: ::. :: . : : CCDS76 STGLLVTAPPPPGPPP-PPPG--------------PPG---------PGSSLSSSPMHGP 390 400 410 480 490 500 510 520 530 pF1KSD SQVIPASEPKRHPSTLPVISDARSVLLEAIRKGIQLRKVEEQREQEAKHERIENDVATIL :..: ::. . : :::::: :: ::: ::::.::.::::::::.: . ::::::: CCDS76 ----PVAEAKRQEPAQPPISDARSDLLAAIRMGIQLKKVQEQREQEAKREPVGNDVATIL 420 430 440 450 460 470 540 550 pF1KSD SRRIAVEYSDSEDDSEFDEVDWLE :::::::::::.::::::: :: CCDS76 SRRIAVEYSDSDDDSEFDENDWSD 480 490 >>CCDS55582.1 WASF2 gene_id:10163|Hs108|chr1 (281 aa) initn: 1147 init1: 909 opt: 1011 Z-score: 398.3 bits: 82.5 E(32554): 7.3e-16 Smith-Waterman score: 1011; 66.8% identity (89.1% similar) in 220 aa overlap (1-220:1-219) 10 20 30 40 50 60 pF1KSD MPLVKRNIDPRHLCHTALPRGIKNELECVTNISLANIIRQLSSLSKYAEDIFGELFNEAH :::: :::.:::::. .:: ....::::::::.:::.::::.::::::::::::::..:. CCDS55 MPLVTRNIEPRHLCRQTLP-SVRSELECVTNITLANVIRQLGSLSKYAEDIFGELFTQAN 10 20 30 40 50 70 80 90 100 110 120 pF1KSD SFSFRVNSLQERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIP .:. ::.:: ::::::.:.::::::::::.::: :. ::::::::::::.::::..::.: CCDS55 TFASRVSSLAERVDRLQVKVTQLDPKEEEVSLQGINTRKAFRSSTIQDQKLFDRNSLPVP 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD LQETYDVCEQPPPLNILTPYRDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQK . :::..:. ::::: ::::::::::.:::::.::::::::::::::::.: :::::.. CCDS55 VLETYNTCDTPPPLNNLTPYRDDGKEALKFYTDPSYFFDLWKEKMLQDTKDIMKEKRKHR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KSD QKNLDRPHEPEKVPRAPHDRRREWQKLAQGPELAEDDANLLHKHIEVANGPASHFETRPQ ... : :.. . :: . :..::.:. .: :..:. .: CCDS55 KEKKDNPNRGNVNPRKIKTRKEEWEKMKMGQEFVESKEKLGTSGYPPTLVYQNGSIGCVE 180 190 200 210 220 230 250 260 270 280 290 300 pF1KSD TYVDHMDGSYSLSALPFSQMSELLTRAEERVLVRPHEPPPPPPMHGAGDAKPIPTCISSA CCDS55 NVDASSYPPPPQSDSASSPSPSFSEDNLPPPPAEFRFSAAQG 240 250 260 270 280 559 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 01:00:01 2016 done: Thu Nov 3 01:00:02 2016 Total Scan time: 4.420 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]