FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0423, 474 aa 1>>>pF1KB0423 474 - 474 aa - 474 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4958+/-0.000806; mu= 3.6520+/- 0.049 mean_var=161.3095+/-32.530, 0's: 0 Z-trim(113.8): 15 B-trim: 8 in 1/51 Lambda= 0.100982 statistics sampled from 14410 (14422) to 14410 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.771), E-opt: 0.2 (0.443), width: 16 Scan time: 3.790 The best scores are: opt bits E(32554) CCDS528.1 GPBP1L1 gene_id:60313|Hs108|chr1 ( 474) 3261 486.7 2.2e-137 CCDS47212.2 GPBP1 gene_id:65056|Hs108|chr5 ( 465) 659 107.6 2.9e-23 CCDS34162.1 GPBP1 gene_id:65056|Hs108|chr5 ( 473) 595 98.3 1.9e-20 CCDS47211.1 GPBP1 gene_id:65056|Hs108|chr5 ( 480) 571 94.8 2.1e-19 CCDS56368.1 GPBP1 gene_id:65056|Hs108|chr5 ( 302) 397 69.4 6.1e-12 CCDS82998.1 GPBP1 gene_id:65056|Hs108|chr5 ( 493) 397 69.5 9.3e-12 >>CCDS528.1 GPBP1L1 gene_id:60313|Hs108|chr1 (474 aa) initn: 3261 init1: 3261 opt: 3261 Z-score: 2579.8 bits: 486.7 E(32554): 2.2e-137 Smith-Waterman score: 3261; 100.0% identity (100.0% similar) in 474 aa overlap (1-474:1-474) 10 20 30 40 50 60 pF1KB0 MAQHDFVPAWLNFSTPQSAKSPTATFEKHGEHLPRGEGRFGVSRRRHNSSDGFFNNGPLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 MAQHDFVPAWLNFSTPQSAKSPTATFEKHGEHLPRGEGRFGVSRRRHNSSDGFFNNGPLR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 TAGDSWHQPSLFRHDSVDSGVSKGAYAGITGNPSGWHSSSRGHDGMSQRSGGGTGNHRHW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 TAGDSWHQPSLFRHDSVDSGVSKGAYAGITGNPSGWHSSSRGHDGMSQRSGGGTGNHRHW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 NGSFHSRKGCAFQEKPPMEIREEKKEDKVEKLQFEEEDFPSLNPEAGKQHQPCRPIGTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 NGSFHSRKGCAFQEKPPMEIREEKKEDKVEKLQFEEEDFPSLNPEAGKQHQPCRPIGTPS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 GVWENPPSAKQPSKMLVIKKVSKEDPAAAFSAAFTSPGSHHANGNKLSSVVPSVYKNLVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 GVWENPPSAKQPSKMLVIKKVSKEDPAAAFSAAFTSPGSHHANGNKLSSVVPSVYKNLVP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 KPVPPPSKPNAWKANRMEHKSGSLSSSRESAFTSPISVTKPVVLASGAALSSPKESPSST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 KPVPPPSKPNAWKANRMEHKSGSLSSSRESAFTSPISVTKPVVLASGAALSSPKESPSST 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 TPPIEISSSRLTKLTRRTTDRKSEFLKTLKDDRNGDFSENRDCDKLEDLEDNSTPEPKEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 TPPIEISSSRLTKLTRRTTDRKSEFLKTLKDDRNGDFSENRDCDKLEDLEDNSTPEPKEN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 GEEGCHQNGLALPVVEEGEVLSHSLEAEHRLLKAMGWQEYPENDENCLPLTEDELKEFHM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 GEEGCHQNGLALPVVEEGEVLSHSLEAEHRLLKAMGWQEYPENDENCLPLTEDELKEFHM 370 380 390 400 410 420 430 440 450 460 470 pF1KB0 KTEQLRRNGFGKNGFLQSRSSSLFSPWRSTCKAEFEDSDTETSSSETSDDDAWK :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 KTEQLRRNGFGKNGFLQSRSSSLFSPWRSTCKAEFEDSDTETSSSETSDDDAWK 430 440 450 460 470 >>CCDS47212.2 GPBP1 gene_id:65056|Hs108|chr5 (465 aa) initn: 858 init1: 277 opt: 659 Z-score: 531.3 bits: 107.6 E(32554): 2.9e-23 Smith-Waterman score: 990; 40.4% identity (62.4% similar) in 505 aa overlap (1-471:1-463) 10 20 30 40 50 pF1KB0 MAQHDFVPAWLNFSTPQSAKS-------PTATFEKHGEHLPRGEGRFGVSRRRHNSSDGF ::::::.:::::: :: :. . . .::::.:.. :.:. :.:::::::::: CCDS47 MAQHDFAPAWLNFPTPPSSTKVLTSSLKSSLNFEKHSENFAWTENRYDVNRRRHNSSDGF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB0 FNNGPLRTAGDSWHQPSLFRHDSVDSGVSKGAYAGITGNPSGWHSSSR-GHDGMSQRSGG ::. : .:. : . .::.. .: : .....:.: CCDS47 ---------------------DSA-IGRPNGGNFG-RKEKNGWRTHGRNGTENINHRGGY 70 80 90 120 130 140 150 160 170 pF1KB0 GTGNHRHWNGSFHSRKGCAFQEKPPMEIREEKKEDKVEKLQFEEEDFPSLNPEAGKQHQP :. : .. ::. :. ...:. . . .:::: :. ::: ::::::::: ...: CCDS47 HGGSSRSRSSIFHAGKSQGLHENNIPDNETGRKEDKRERKQFEAEDFPSLNPEY--EREP 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB0 CRPIGTPSGVWENPPSAK-QPSKMLVIKKVSKED-PAAAFSAAFTSPGSHHANGNKLSSV . . .:::: ::. : . .:::::: . .: ..: .. . :.. ::. CCDS47 NHNKSLAAGVWEYPPNPKSRAPRMLVIKKGNTKDLQLSGFPVVGNLPSQPVKNGTG---- 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB0 VPSVYKNLVPKPVPPPSKPNAWKANRMEHKSGSLSSSRESAFTSPISVTKPVVLASGAAL :::::.:::::. ::.::. ::.. :.: :. : .::.: .: . .. : : CCDS47 -PSVYKGLVPKPAAPPTKPTQWKSQTKENKVGT-SFPHESTF----GVGNFNAFKSTAKN 220 230 240 250 260 300 310 320 330 340 pF1KB0 SSPKESPSSTTPPIEISSSRLTKLTRRTTDRKSEFLKTLKDDRNGDFSEN-------RDC ::. . . : ::::::: ::.::::::.:: :: . :. .: CCDS47 FSPSTNSVKEQP-------RLTKLTRMRTDKKSEFLKALKRDRVEEEHEDESRAGSEKDD 270 280 290 300 310 350 360 370 380 pF1KB0 DKLEDLEDNSTPE-------------PKENGEEGC-HQNGLALPVVEEGEVLSHSLEAEH :... ..::: . :.:::. . :. . . . .::: :::::: CCDS47 DSFNLHNSNSTHQERDINRNFDENEIPQENGNASVISQQIIRSSTFPQTDVLSSSLEAEH 320 330 340 350 360 370 390 400 410 420 430 440 pF1KB0 RLLKAMGWQEYPENDENCLPLTEDELKEFHMKTEQLRRNGFGKNGFLQSR--SSSLFSPW :::: ::::: ::::.: ::::::..::.. .:::..::. :::.:.. . :.:: CCDS47 RLLKEMGWQEDSENDETCAPLTEDEMREFQVISEQLQKNGLRKNGILKNGLICDFKFGPW 380 390 400 410 420 430 450 460 470 pF1KB0 R-STCKAEFEDSDTETSSSETSDDDAWK . :: : :..:::::::.::::: CCDS47 KNSTFKPTTENDDTETSSSDTSDDDDV 440 450 460 >>CCDS34162.1 GPBP1 gene_id:65056|Hs108|chr5 (473 aa) initn: 839 init1: 277 opt: 595 Z-score: 480.7 bits: 98.3 E(32554): 1.9e-20 Smith-Waterman score: 1030; 40.6% identity (64.9% similar) in 502 aa overlap (1-471:1-471) 10 20 30 40 50 60 pF1KB0 MAQHDFVPAWLNFSTPQSAKSPTATFEKHGEHLPRGEGRFGVSRRRHNSSDGFFNNGPLR ::::::.:::::: :: :. . . .::::.:.. :.:. :.:::::::::: CCDS34 MAQHDFAPAWLNFPTPPSSTKSSLNFEKHSENFAWTENRYDVNRRRHNSSDGF------- 10 20 30 40 50 70 80 90 100 110 pF1KB0 TAGDSWHQPSLFRHDSVDSGVSKGAYAGITGNPSGWHSSSR-GHDGMSQRSGGGTGNHRH ::. : .:. : . .::.. .: : .....:.: :. : CCDS34 --------------DSA-IGRPNGGNFG-RKEKNGWRTHGRNGTENINHRGGYHGGSSRS 60 70 80 90 120 130 140 150 160 170 pF1KB0 WNGSFHSRKGCAFQEKPPMEIREEKKEDKVEKLQFEEEDFPSLNPEAGKQHQPCRPIGTP .. ::. :. ...:. . . .:::: :. ::: ::::::::: ...: . . CCDS34 RSSIFHAGKSQGLHENNIPDNETGRKEDKRERKQFEAEDFPSLNPEY--EREPNHNKSLA 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB0 SGVWENPPSAK-QPSKMLVIKKVSKED-PAAAFSAAFTSPGSHHANGNKLSSVVPSVYKN .:::: ::. : . .:::::: . .: ..: .. . :.. ::. :::::. CCDS34 AGVWEYPPNPKSRAPRMLVIKKGNTKDLQLSGFPVVGNLPSQPVKNGTG-----PSVYKG 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB0 LVPKPVPPPSKPNAWKANRMEHKSGSLSSSRESAF-TSPISVTKPVVLASGAALSSPKE- :::::. ::.::. ::.. :.: :. : .::.: .. ... : .. . . .: :: CCDS34 LVPKPAAPPTKPTQWKSQTKENKVGT-SFPHESTFGVGNFNAFKSTAKNFSPSTNSVKEC 220 230 240 250 260 300 310 320 330 340 pF1KB0 SPSSTTPPIEI--SSSRLTKLTRRTTDRKSEFLKTLKDDRNGDFSEN-------RDCDKL . :... :.. .. ::::::: ::.::::::.:: :: . :. .: :.. CCDS34 NRSNSSSPVDKLNQQPRLTKLTRMRTDKKSEFLKALKRDRVEEEHEDESRAGSEKDDDSF 270 280 290 300 310 320 350 360 370 380 390 pF1KB0 EDLEDNSTPE-------------PKENGEEGC-HQNGLALPVVEEGEVLSHSLEAEHRLL . ..::: . :.:::. . :. . . . .::: ::::::::: CCDS34 NLHNSNSTHQERDINRNFDENEIPQENGNASVISQQIIRSSTFPQTDVLSSSLEAEHRLL 330 340 350 360 370 380 400 410 420 430 440 pF1KB0 KAMGWQEYPENDENCLPLTEDELKEFHMKTEQLRRNGFGKNGFLQSR--SSSLFSPWR-S : ::::: ::::.: ::::::..::.. .:::..::. :::.:.. . :.::. : CCDS34 KEMGWQEDSENDETCAPLTEDEMREFQVISEQLQKNGLRKNGILKNGLICDFKFGPWKNS 390 400 410 420 430 440 450 460 470 pF1KB0 TCKAEFEDSDTETSSSETSDDDAWK : : :..:::::::.::::: CCDS34 TFKPTTENDDTETSSSDTSDDDDV 450 460 470 >>CCDS47211.1 GPBP1 gene_id:65056|Hs108|chr5 (480 aa) initn: 857 init1: 277 opt: 571 Z-score: 461.8 bits: 94.8 E(32554): 2.1e-19 Smith-Waterman score: 1006; 40.1% identity (64.0% similar) in 509 aa overlap (1-471:1-478) 10 20 30 40 50 pF1KB0 MAQHDFVPAWLNFSTPQSAKS-------PTATFEKHGEHLPRGEGRFGVSRRRHNSSDGF ::::::.:::::: :: :. . . .::::.:.. :.:. :.:::::::::: CCDS47 MAQHDFAPAWLNFPTPPSSTKVLTSSLKSSLNFEKHSENFAWTENRYDVNRRRHNSSDGF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB0 FNNGPLRTAGDSWHQPSLFRHDSVDSGVSKGAYAGITGNPSGWHSSSR-GHDGMSQRSGG ::. : .:. : . .::.. .: : .....:.: CCDS47 ---------------------DSA-IGRPNGGNFG-RKEKNGWRTHGRNGTENINHRGGY 70 80 90 120 130 140 150 160 170 pF1KB0 GTGNHRHWNGSFHSRKGCAFQEKPPMEIREEKKEDKVEKLQFEEEDFPSLNPEAGKQHQP :. : .. ::. :. ...:. . . .:::: :. ::: ::::::::: ...: CCDS47 HGGSSRSRSSIFHAGKSQGLHENNIPDNETGRKEDKRERKQFEAEDFPSLNPEY--EREP 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB0 CRPIGTPSGVWENPPSAK-QPSKMLVIKKVSKED-PAAAFSAAFTSPGSHHANGNKLSSV . . .:::: ::. : . .:::::: . .: ..: .. . :.. ::. CCDS47 NHNKSLAAGVWEYPPNPKSRAPRMLVIKKGNTKDLQLSGFPVVGNLPSQPVKNGTG---- 160 170 180 190 200 210 240 250 260 270 280 pF1KB0 VPSVYKNLVPKPVPPPSKPNAWKANRMEHKSGSLSSSRESAF-TSPISVTKPVVLASGAA :::::.:::::. ::.::. ::.. :.: :. : .::.: .. ... : .. . . CCDS47 -PSVYKGLVPKPAAPPTKPTQWKSQTKENKVGT-SFPHESTFGVGNFNAFKSTAKNFSPS 220 230 240 250 260 290 300 310 320 330 340 pF1KB0 LSSPKE-SPSSTTPPIEI--SSSRLTKLTRRTTDRKSEFLKTLKDDRNGDFSEN------ .: :: . :... :.. .. ::::::: ::.::::::.:: :: . :. CCDS47 TNSVKECNRSNSSSPVDKLNQQPRLTKLTRMRTDKKSEFLKALKRDRVEEEHEDESRAGS 270 280 290 300 310 320 350 360 370 380 pF1KB0 -RDCDKLEDLEDNSTPE-------------PKENGEEGC-HQNGLALPVVEEGEVLSHSL .: :... ..::: . :.:::. . :. . . . .::: :: CCDS47 EKDDDSFNLHNSNSTHQERDINRNFDENEIPQENGNASVISQQIIRSSTFPQTDVLSSSL 330 340 350 360 370 380 390 400 410 420 430 440 pF1KB0 EAEHRLLKAMGWQEYPENDENCLPLTEDELKEFHMKTEQLRRNGFGKNGFLQSR--SSSL :::::::: ::::: ::::.: ::::::..::.. .:::..::. :::.:.. . CCDS47 EAEHRLLKEMGWQEDSENDETCAPLTEDEMREFQVISEQLQKNGLRKNGILKNGLICDFK 390 400 410 420 430 440 450 460 470 pF1KB0 FSPWR-STCKAEFEDSDTETSSSETSDDDAWK :.::. :: : :..:::::::.::::: CCDS47 FGPWKNSTFKPTTENDDTETSSSDTSDDDDV 450 460 470 480 >>CCDS56368.1 GPBP1 gene_id:65056|Hs108|chr5 (302 aa) initn: 518 init1: 277 opt: 397 Z-score: 327.9 bits: 69.4 E(32554): 6.1e-12 Smith-Waterman score: 629; 42.2% identity (66.7% similar) in 306 aa overlap (195-471:1-300) 170 180 190 200 210 220 pF1KB0 EAGKQHQPCRPIGTPSGVWENPPSAKQPSKMLVIKKVSKED-PAAAFSAAFTSPGSHHAN :::::: . .: ..: .. . :.. : CCDS56 MLVIKKGNTKDLQLSGFPVVGNLPSQPVKN 10 20 30 230 240 250 260 270 280 pF1KB0 GNKLSSVVPSVYKNLVPKPVPPPSKPNAWKANRMEHKSGSLSSSRESAF-TSPISVTKPV :. :::::.:::::. ::.::. ::.. :.: :. : .::.: .. ... : . CCDS56 GTG-----PSVYKGLVPKPAAPPTKPTQWKSQTKENKVGT-SFPHESTFGVGNFNAFKST 40 50 60 70 80 290 300 310 320 330 pF1KB0 VLASGAALSSPKE-SPSSTTPPIEI--SSSRLTKLTRRTTDRKSEFLKTLKDDRNGDFSE . . . .: :: . :... :.. .. ::::::: ::.::::::.:: :: . : CCDS56 AKNFSPSTNSVKECNRSNSSSPVDKLNQQPRLTKLTRMRTDKKSEFLKALKRDRVEEEHE 90 100 110 120 130 140 340 350 360 370 pF1KB0 N-------RDCDKLEDLEDNSTPE-------------PKENGEEGC-HQNGLALPVVEEG . .: :... ..::: . :.:::. . :. . . . CCDS56 DESRAGSEKDDDSFNLHNSNSTHQERDINRNFDENEIPQENGNASVISQQIIRSSTFPQT 150 160 170 180 190 200 380 390 400 410 420 430 pF1KB0 EVLSHSLEAEHRLLKAMGWQEYPENDENCLPLTEDELKEFHMKTEQLRRNGFGKNGFLQS .::: :::::::::: ::::: ::::.: ::::::..::.. .:::..::. :::.:.. CCDS56 DVLSSSLEAEHRLLKEMGWQEDSENDETCAPLTEDEMREFQVISEQLQKNGLRKNGILKN 210 220 230 240 250 260 440 450 460 470 pF1KB0 R--SSSLFSPWR-STCKAEFEDSDTETSSSETSDDDAWK . :.::. :: : :..:::::::.::::: CCDS56 GLICDFKFGPWKNSTFKPTTENDDTETSSSDTSDDDDV 270 280 290 300 >>CCDS82998.1 GPBP1 gene_id:65056|Hs108|chr5 (493 aa) initn: 834 init1: 277 opt: 397 Z-score: 324.6 bits: 69.5 E(32554): 9.3e-12 Smith-Waterman score: 980; 39.1% identity (62.5% similar) in 522 aa overlap (1-471:1-491) 10 20 30 40 50 60 pF1KB0 MAQHDFVPAWLNFSTPQSAKSPTATFEKHGEHLPRGEGRFGVSRRRHNSSDGFFNNGPLR ::::::.:::::: :: :. . . .::::.:.. :.:. :.:::::::::: CCDS82 MAQHDFAPAWLNFPTPPSSTKSSLNFEKHSENFAWTENRYDVNRRRHNSSDGF------- 10 20 30 40 50 70 80 90 100 110 pF1KB0 TAGDSWHQPSLFRHDSVDSGVSKGAYAGITGNPSGWHSSSR-GHDGMSQRSGGGTGNHRH ::. : .:. : . .::.. .: : .....:.: :. : CCDS82 --------------DSA-IGRPNGGNFG-RKEKNGWRTHGRNGTENINHRGGYHGGSSRS 60 70 80 90 120 130 140 150 160 170 pF1KB0 WNGSFHSRKGCAFQEKPPMEIREEKKEDKVEKLQFEEEDFPSLNPEAGKQHQPCRPIGTP .. ::. :. ...:. . . .:::: :. ::: ::::::::: ...: . . CCDS82 RSSIFHAGKSQGLHENNIPDNETGRKEDKRERKQFEAEDFPSLNPEY--EREPNHNKSLA 100 110 120 130 140 150 180 190 200 210 pF1KB0 SGVW--------------------ENPPSAK-QPSKMLVIKKVSKED-PAAAFSAAFTSP .::: : ::. : . .:::::: . .: ..: .. . : CCDS82 AGVWGLHAQTHTYPTKKISQAPLLEYPPNPKSRAPRMLVIKKGNTKDLQLSGFPVVGNLP 160 170 180 190 200 210 220 230 240 250 260 270 pF1KB0 GSHHANGNKLSSVVPSVYKNLVPKPVPPPSKPNAWKANRMEHKSGSLSSSRESAF-TSPI .. ::. :::::.:::::. ::.::. ::.. :.: :. : .::.: .. . CCDS82 SQPVKNGTG-----PSVYKGLVPKPAAPPTKPTQWKSQTKENKVGT-SFPHESTFGVGNF 220 230 240 250 260 280 290 300 310 320 330 pF1KB0 SVTKPVVLASGAALSSPKE-SPSSTTPPIEI--SSSRLTKLTRRTTDRKSEFLKTLKDDR .. : .. . . .: :: . :... :.. .. ::::::: ::.::::::.:: :: CCDS82 NAFKSTAKNFSPSTNSVKECNRSNSSSPVDKLNQQPRLTKLTRMRTDKKSEFLKALKRDR 270 280 290 300 310 320 340 350 360 370 pF1KB0 NGDFSEN-------RDCDKLEDLEDNSTPE-------------PKENGEEGC-HQNGLAL . :. .: :... ..::: . :.:::. . :. . CCDS82 VEEEHEDESRAGSEKDDDSFNLHNSNSTHQERDINRNFDENEIPQENGNASVISQQIIRS 330 340 350 360 370 380 380 390 400 410 420 430 pF1KB0 PVVEEGEVLSHSLEAEHRLLKAMGWQEYPENDENCLPLTEDELKEFHMKTEQLRRNGFGK . . .::: :::::::::: ::::: ::::.: ::::::..::.. .:::..::. : CCDS82 STFPQTDVLSSSLEAEHRLLKEMGWQEDSENDETCAPLTEDEMREFQVISEQLQKNGLRK 390 400 410 420 430 440 440 450 460 470 pF1KB0 NGFLQSR--SSSLFSPWR-STCKAEFEDSDTETSSSETSDDDAWK ::.:.. . :.::. :: : :..:::::::.::::: CCDS82 NGILKNGLICDFKFGPWKNSTFKPTTENDDTETSSSDTSDDDDV 450 460 470 480 490 474 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:50:02 2016 done: Sat Nov 5 16:50:03 2016 Total Scan time: 3.790 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]