FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0513, 331 aa 1>>>pF1KE0513 331 - 331 aa - 331 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8026+/-0.000779; mu= 13.8465+/- 0.047 mean_var=74.2597+/-14.586, 0's: 0 Z-trim(108.2): 27 B-trim: 11 in 2/51 Lambda= 0.148832 statistics sampled from 10029 (10053) to 10029 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.689), E-opt: 0.2 (0.309), width: 16 Scan time: 2.030 The best scores are: opt bits E(32554) CCDS14057.1 PARVG gene_id:64098|Hs108|chr22 ( 331) 2133 467.1 9e-132 CCDS58808.1 PARVB gene_id:29780|Hs108|chr22 ( 327) 863 194.4 1.1e-49 CCDS14056.1 PARVB gene_id:29780|Hs108|chr22 ( 364) 863 194.4 1.2e-49 CCDS46724.1 PARVB gene_id:29780|Hs108|chr22 ( 397) 863 194.4 1.3e-49 CCDS44541.2 PARVA gene_id:55742|Hs108|chr11 ( 412) 850 191.6 9.2e-49 CCDS74874.1 PARVB gene_id:29780|Hs108|chr22 ( 289) 513 119.2 4.1e-27 >>CCDS14057.1 PARVG gene_id:64098|Hs108|chr22 (331 aa) initn: 2133 init1: 2133 opt: 2133 Z-score: 2479.2 bits: 467.1 E(32554): 9e-132 Smith-Waterman score: 2133; 100.0% identity (100.0% similar) in 331 aa overlap (1-331:1-331) 10 20 30 40 50 60 pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWINATLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWINATLLP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 EHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVNRSLQLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVNRSLQLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 EWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGLKSEKLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGLKSEKLV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 EQLTEYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSVQNLDTQFAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EQLTEYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSVQNLDTQFAD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 GVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCPVSPEDIVNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCPVSPEDIVNK 250 260 270 280 290 300 310 320 330 pF1KE0 DAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN ::::::::::::::::::::::::::::::: CCDS14 DAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN 310 320 330 >>CCDS58808.1 PARVB gene_id:29780|Hs108|chr22 (327 aa) initn: 862 init1: 465 opt: 863 Z-score: 1005.6 bits: 194.4 E(32554): 1.1e-49 Smith-Waterman score: 863; 45.2% identity (78.7% similar) in 301 aa overlap (19-316:25-323) 10 20 30 40 50 pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWI : . .: .. .. .. :::..::::.:: :::..:: CCDS58 MSDLQEEGKNAINSPMSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVKVLLDWI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 NATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVN : .:. :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: .:::::. CCDS58 NDVLVEERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQTVLEAVH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 RSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGL :. . : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:..... .. : CCDS58 DLLRPRGWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVRKREGLL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 KSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSV .: .. :.:: :. . : .:.:: :: ::.:...::.....:::..:..:.: : CCDS58 HSSHISEELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVKKSLITFVNKHLNKLNLEV 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 QNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCP .:.::::::: :.::.: :: .:. :..:::::.: . .:::..:.::. : :: . CCDS58 TELETQFADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDGGLKKPK 240 250 260 270 280 290 300 310 320 330 pF1KE0 VSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN . :::.:: : ::::::::.:: :. CCDS58 ARPEDVVNLDLKSTLRVLYNLFTKYKNVE 300 310 320 >>CCDS14056.1 PARVB gene_id:29780|Hs108|chr22 (364 aa) initn: 862 init1: 465 opt: 863 Z-score: 1004.8 bits: 194.4 E(32554): 1.2e-49 Smith-Waterman score: 863; 45.2% identity (78.7% similar) in 301 aa overlap (19-316:62-360) 10 20 30 40 pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQK : . .: .. .. .. :::..::::.:: : CCDS14 KRRAREVSDLQEEGKNAINSPMSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVK 40 50 60 70 80 90 50 60 70 80 90 100 pF1KE0 VLMEWINATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTV ::..::: .:. :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: . CCDS14 VLLDWINDVLVEERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQT 100 110 120 130 140 150 110 120 130 140 150 160 pF1KE0 VLEAVNRSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIE :::::. :. . : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:.... CCDS14 VLEAVHDLLRPRGWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVR 160 170 180 190 200 210 170 180 190 200 210 220 pF1KE0 STKSGLKSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLD . .. :.: .. :.:: :. . : .:.:: :: ::.:...::.....:::..:. CCDS14 KREGLLHSSHISEELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVKKSLITFVNKHLN 220 230 240 250 260 230 240 250 260 270 280 pF1KE0 RLGLSVQNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDE .:.: : .:.::::::: :.::.: :: .:. :..:::::.: . .:::..:.::. : CCDS14 KLNLEVTELETQFADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDG 270 280 290 300 310 320 290 300 310 320 330 pF1KE0 GLLSCPVSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN :: . . :::.:: : ::::::::.:: :. CCDS14 GLKKPKARPEDVVNLDLKSTLRVLYNLFTKYKNVE 330 340 350 360 >>CCDS46724.1 PARVB gene_id:29780|Hs108|chr22 (397 aa) initn: 862 init1: 465 opt: 863 Z-score: 1004.3 bits: 194.4 E(32554): 1.3e-49 Smith-Waterman score: 863; 45.2% identity (78.7% similar) in 301 aa overlap (19-316:95-393) 10 20 30 40 pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQK : . .: .. .. .. :::..::::.:: : CCDS46 EYAQGGVSDLQEEGKNAINSPMSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVK 70 80 90 100 110 120 50 60 70 80 90 100 pF1KE0 VLMEWINATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTV ::..::: .:. :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: . CCDS46 VLLDWINDVLVEERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQT 130 140 150 160 170 180 110 120 130 140 150 160 pF1KE0 VLEAVNRSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIE :::::. :. . : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:.... CCDS46 VLEAVHDLLRPRGWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVR 190 200 210 220 230 240 170 180 190 200 210 220 pF1KE0 STKSGLKSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLD . .. :.: .. :.:: :. . : .:.:: :: ::.:...::.....:::..:. CCDS46 KREGLLHSSHISEELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVKKSLITFVNKHLN 250 260 270 280 290 300 230 240 250 260 270 280 pF1KE0 RLGLSVQNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDE .:.: : .:.::::::: :.::.: :: .:. :..:::::.: . .:::..:.::. : CCDS46 KLNLEVTELETQFADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDG 310 320 330 340 350 360 290 300 310 320 330 pF1KE0 GLLSCPVSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN :: . . :::.:: : ::::::::.:: :. CCDS46 GLKKPKARPEDVVNLDLKSTLRVLYNLFTKYKNVE 370 380 390 >>CCDS44541.2 PARVA gene_id:55742|Hs108|chr11 (412 aa) initn: 885 init1: 427 opt: 850 Z-score: 988.9 bits: 191.6 E(32554): 9.2e-49 Smith-Waterman score: 850; 43.5% identity (78.1% similar) in 301 aa overlap (19-316:110-408) 10 20 30 40 pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQK : . : .. . .. :.::.:::..::.: CCDS44 RKKAKEVSELQEEGMNAINLPLSPIPFELDPEDTMLEENEVRTMVDPNSRSDPKLQELMK 80 90 100 110 120 130 50 60 70 80 90 100 pF1KE0 VLMEWINATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTV ::..::: .:. :.:.:..: ::..:: .:..::..: . ::.. ... . .::.:: . CCDS44 VLIDWINDVLVGERIIVKDLAEDLYDGQVLQKLFEKLESEKLNVAEVTQSEIAQKQKLQT 140 150 160 170 180 190 110 120 130 140 150 160 pF1KE0 VLEAVNRSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIE ::: .:..:.: . ::.:.:. :.:.. :::::::.. :. . :: .:...:.... CCDS44 VLEKINETLKLPPRSIKWNVDSVHAKSLVAILHLLVALSQYFRAPIRLPDHVSIQVVVVQ 200 210 220 230 240 250 170 180 190 200 210 220 pF1KE0 STKSGLKSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLD . .. :.:... :..: : . . : .:.:: :: ::.:.:.::.....:::..:. CCDS44 KREGILQSRQIQEEITGNTEALSGRHE--RDAFDTLFDHAPDKLNVVKKTLITFVNKHLN 260 270 280 290 300 310 230 240 250 260 270 280 pF1KE0 RLGLSVQNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDE .:.: : .:.::::::: :.::.: :::.:. :. :.:::.: . . ::..:.::..: CCDS44 KLNLEVTELETQFADGVYLVLLMGLLEGYFVPLHSFFLTPDSFEQKVLNVSFAFELMQDG 320 330 340 350 360 370 290 300 310 320 330 pF1KE0 GLLSCPVSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN :: . :::::: : ::::::::.:: :. CCDS44 GLEKPKPRPEDIVNCDLKSTLRVLYNLFTKYRNVE 380 390 400 410 >>CCDS74874.1 PARVB gene_id:29780|Hs108|chr22 (289 aa) initn: 777 init1: 465 opt: 513 Z-score: 600.2 bits: 119.2 E(32554): 4.1e-27 Smith-Waterman score: 737; 41.9% identity (71.8% similar) in 301 aa overlap (19-316:10-285) 10 20 30 40 50 60 pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWINATLLP : . .: .. .. .. :::..::::.:: :::..::: .:. CCDS74 MSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVKVLLDWINDVLVE 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 EHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVNRSLQLE :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: .:::::. :. . CCDS74 ERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQTVLEAVHDLLRPR 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 EWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGLKSEKLV : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:..... .. :.: .. CCDS74 GWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVRKREGLLHSSHIS 120 130 140 150 160 170 190 200 210 220 230 pF1KE0 EQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSVQNLDTQ :.:: :. . : .:.:: :: ::.:...:: . CCDS74 EELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVK-----------------------K 180 190 200 240 250 260 270 280 290 pF1KE0 FADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCPVSPEDI ::::: :.::.: :: .:. :..:::::.: . .:::..:.::. : :: . . :::. CCDS74 FADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDGGLKKPKARPEDV 210 220 230 240 250 260 300 310 320 330 pF1KE0 VNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN :: : ::::::::.:: :. CCDS74 VNLDLKSTLRVLYNLFTKYKNVE 270 280 331 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 03:00:49 2016 done: Thu Nov 3 03:00:49 2016 Total Scan time: 2.030 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]