FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5103, 700 aa 1>>>pF1KB5103 700 - 700 aa - 700 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7907+/-0.00106; mu= 18.1403+/- 0.063 mean_var=127.6791+/-23.743, 0's: 0 Z-trim(107.5): 115 B-trim: 13 in 2/48 Lambda= 0.113505 statistics sampled from 9512 (9635) to 9512 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.664), E-opt: 0.2 (0.296), width: 16 Scan time: 3.410 The best scores are: opt bits E(32554) CCDS3762.1 HHIP gene_id:64399|Hs108|chr4 ( 700) 4896 814.0 0 CCDS1530.2 HHIPL2 gene_id:79802|Hs108|chr1 ( 724) 734 132.5 2.1e-30 CCDS9953.1 HHIPL1 gene_id:84439|Hs108|chr14 ( 608) 656 119.7 1.3e-26 CCDS45162.1 HHIPL1 gene_id:84439|Hs108|chr14 ( 782) 656 119.8 1.6e-26 >>CCDS3762.1 HHIP gene_id:64399|Hs108|chr4 (700 aa) initn: 4896 init1: 4896 opt: 4896 Z-score: 4342.8 bits: 814.0 E(32554): 0 Smith-Waterman score: 4896; 100.0% identity (100.0% similar) in 700 aa overlap (1-700:1-700) 10 20 30 40 50 60 pF1KB5 MLKMLSFKLLLLAVALGFFEGDAKFGERNEGSGARRRRCLNGNPPKRLKRRDRRMMSQLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 MLKMLSFKLLLLAVALGFFEGDAKFGERNEGSGARRRRCLNGNPPKRLKRRDRRMMSQLE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LLSGGEMLCGGFYPRLSCCLRSDSPGLGRLENKIFSVTNNTECGKLLEEIKCALCSPHSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 LLSGGEMLCGGFYPRLSCCLRSDSPGLGRLENKIFSVTNNTECGKLLEEIKCALCSPHSQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 SLFHSPEREVLERDLVLPLLCKDYCKEFFYTCRGHIPGFLQTTADEFCFYYARKDGGLCF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 SLFHSPEREVLERDLVLPLLCKDYCKEFFYTCRGHIPGFLQTTADEFCFYYARKDGGLCF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 PDFPRKQVRGPASNYLDQMEEYDKVEEISRKHKHNCFCIQEVVSGLRQPVGALHSGDGSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 PDFPRKQVRGPASNYLDQMEEYDKVEEISRKHKHNCFCIQEVVSGLRQPVGALHSGDGSQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 RLFILEKEGYVKILTPEGEIFKEPYLDIHKLVQSGIKGGDERGLLSLAFHPNYKKNGKLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 RLFILEKEGYVKILTPEGEIFKEPYLDIHKLVQSGIKGGDERGLLSLAFHPNYKKNGKLY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 VSYTTNQERWAIGPHDHILRVVEYTVSRKNPHQVDLRTARVFLEVAELHRKHLGGQLLFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 VSYTTNQERWAIGPHDHILRVVEYTVSRKNPHQVDLRTARVFLEVAELHRKHLGGQLLFG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 PDGFLYIILGDGMITLDDMEEMDGLSDFTGSVLRLDVDTDMCNVPYSIPRSNPHFNSTNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 PDGFLYIILGDGMITLDDMEEMDGLSDFTGSVLRLDVDTDMCNVPYSIPRSNPHFNSTNQ 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 PPEVFAHGLHDPGRCAVDRHPTDININLTILCSDSNGKNRSSARILQIIKGKDYESEPSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 PPEVFAHGLHDPGRCAVDRHPTDININLTILCSDSNGKNRSSARILQIIKGKDYESEPSL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 LEFKPFSNGPLVGGFVYRGCQSERLYGSYVFGDRNGNFLTLQQSPVTKQWQEKPLCLGTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 LEFKPFSNGPLVGGFVYRGCQSERLYGSYVFGDRNGNFLTLQQSPVTKQWQEKPLCLGTS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 GSCRGYFSGHILGFGEDELGEVYILSSSKSMTQTHNGKLYKIVDPKRPLMPEECRATVQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 GSCRGYFSGHILGFGEDELGEVYILSSSKSMTQTHNGKLYKIVDPKRPLMPEECRATVQP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 AQTLTSECSRLCRNGYCTPTGKCCCSPGWEGDFCRTAKCEPACRHGGVCVRPNKCLCKKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS37 AQTLTSECSRLCRNGYCTPTGKCCCSPGWEGDFCRTAKCEPACRHGGVCVRPNKCLCKKG 610 620 630 640 650 660 670 680 690 700 pF1KB5 YLGPQCEQVDRNIRRVTRAGILDQIIDMTSYLLDLTSYIV :::::::::::::::::::::::::::::::::::::::: CCDS37 YLGPQCEQVDRNIRRVTRAGILDQIIDMTSYLLDLTSYIV 670 680 690 700 >>CCDS1530.2 HHIPL2 gene_id:79802|Hs108|chr1 (724 aa) initn: 1029 init1: 281 opt: 734 Z-score: 659.3 bits: 132.5 E(32554): 2.1e-30 Smith-Waterman score: 1007; 32.6% identity (60.5% similar) in 582 aa overlap (68-603:60-618) 40 50 60 70 80 90 pF1KB5 RCLNGNPPKRLKRRDRRMMSQLELLSGGEMLCGGFYPRLSCC-LRSDSPGLGRLEN--KI .:. : ..:: ..: .: . . CCDS15 IFLLGQVGLLQGHPQCLDYGPPFQPPLHLEFCSD-YESFGCCDQHKDRRIAARYWDIMEY 30 40 50 60 70 80 100 110 120 130 140 150 pF1KB5 FSVTNNTECGKLLEEIKCALCSPHSQSLFHSPEREVLERDLVLPLLCKDYCKEFFYTCRG :.. . :: ...: : :::.. :. . . .. :. :: ::.:::. : .:.. CCDS15 FDLKRHELCGDYIKDILCQECSPYAAHLYDAENTQTPLRN--LPGLCSDYCSAFHSNCHS 90 100 110 120 130 140 160 170 180 190 200 pF1KB5 HIPGF-----LQTT----ADEFCFYYARKDGGLCFPDFPRKQVRGPASNYLDQMEEYDKV : . :: . . .:: : :::. : ..::.. CCDS15 AISLLTNDRGLQESHGRDGTRFCHLLDLPDKDYCFPNVLR-------NDYLNRHLG---- 150 160 170 180 190 210 220 230 240 250 260 pF1KB5 EEISRKHKHNCF--CIQEVVSGLRQPVGALHSGDGSQRLFILEKEGYVKILTPEGEIFKE . . ..:. :..::..:::.::. .:.:::..:.:. :. : : . :.: ... CCDS15 --MVAQDPQGCLQLCLSEVANGLRNPVSMVHAGDGTHRFFVAEQVGVVWVYLPDGSRLEQ 200 210 220 230 240 250 270 280 290 300 310 320 pF1KB5 PYLDIHKLVQSGIKGGDERGLLSLAFHPNYKKNGKLYVSYTTNQERWAIGPHDHILRVVE :.::....: . :::::.:.:::::....: :.:. :. ... . . .:. : CCDS15 PFLDLKNIVLTTPWIGDERGFLGLAFHPKFRHNRKFYIYYSCLDKKKV-----EKIRISE 260 270 280 290 300 330 340 350 360 370 380 pF1KB5 YTVSRKNPHQVDLRTARVFLEVAELHRKHLGGQLLFGPDGFLYIILGDGMITLDDME--- . ::: .:...::.. ::.::. : .: ::::::: ::..::. ::: . : . CCDS15 MKVSRADPNKADLKSERVILEIEEPASNHNGGQLLFGLDGYMYIFTGDGGQAGDPFGLFG 310 320 330 340 350 360 390 400 410 420 430 pF1KB5 EMDGLSDFTGSVLRLDVDTDMCNVP-YSIPRSNPHFNSTNQPPEVFAHGLHDPGRCAVDR . .. :.. :.:::.::. . : .: .:: . . : ..:.:... :::::: CCDS15 NAQNKSSLLGKVLRIDVNRAGSHGKRYRVPSDNPFVSEPGAHPAIYAYGIRNMWRCAVDR 370 380 390 400 410 420 440 450 460 470 480 pF1KB5 -HPTDININLTILCSDSNGKNRSSARILQIIKGKDYE---------------SEPSLLEF : . :.:.: :.:: .. :.:: .: . :: . CCDS15 GDPITRQGRGRIFCGDV-GQNRFE-EVDLILKGGNYGWRAKEGFACYDKKLCHNASLDDV 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 KP-FSNGPLVG-----GFVYRGCQSERLYGSYVFGD-RNGNFLTLQQSPVTKQWQEKPLC : .. : :: :.:::::.: : : :.::: .: ...::.. .:.:... :: CCDS15 LPIYAYGHAVGKSVTGGYVYRGCESPNLNGLYIFGDFMSGRLMALQEDRKNKKWKKQDLC 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB5 LGTSGSCR--GYFSGH---ILGFGEDELGEVYILSSSKSMTQTHNGKLYKIVDPKRPLMP ::.. :: : .: : :..:.::: ::.:.:..: . . :..::.:::.: : CCDS15 LGSTTSCAFPGLISTHSKFIISFAEDEAGELYFLATSYPSAYAPRGSIYKFVDPSRRAPP 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB5 EECRATVQPAQTLTSECSRLCRNGYCTPTGKCCCSPGWEGDFCRTAKCEPACRHGGVCVR .:. :..: CCDS15 GKCKYKPVPVRTKSKRIPFRPLAKTVLDLLKEQSEKAARKSSSATLASGPAQGLSEKGSS 610 620 630 640 650 660 >>CCDS9953.1 HHIPL1 gene_id:84439|Hs108|chr14 (608 aa) initn: 860 init1: 268 opt: 656 Z-score: 591.1 bits: 119.7 E(32554): 1.3e-26 Smith-Waterman score: 920; 31.2% identity (58.4% similar) in 592 aa overlap (68-611:38-597) 40 50 60 70 80 90 pF1KB5 RCLNGNPPKRLKRRDRRMMSQLELLSGGEMLCGGFYPRLSCCLRSDSPGLGRLENKIFSV ::. : ..:: .. . : : . : CCDS99 ALLALWVLGAAAHPQCLDFRPPFRPTQPLRLCAQ-YSDFGCCDEGRDAELTRRFWALASR 10 20 30 40 50 60 100 110 120 130 140 150 pF1KB5 TNNTE---CGKLLEEIKCALCSPHSQSLFHSPEREVLERDLVLPLLCKDYCKEFFYTCRG .. .: :. ... : :::.. :. . . . : ..: ::.::: .... ::: CCDS99 VDAAEWAACAGYARDLLCQECSPYAAHLYDAEDPFTPLR--TVPGLCQDYCLDMWHKCRG 70 80 90 100 110 120 160 170 180 190 200 pF1KB5 ---HIPGFLQTTADE-----FCFYYARKDGGLCFPDFPRKQVRGPASNYLDQMEEYDKVE :. . : : :: : . : ::: . : .. : .. : CCDS99 LFRHLSTDQELWALEGNLARFCRYLSLDDTDYCFPYL---LVNKNLNSNLGHVVADAK-- 130 140 150 160 170 210 220 230 240 250 260 pF1KB5 EISRKHKHNCF--CIQEVVSGLRQPVGALHSGDGSQRLFILEKEGYVKILTPEGEIFKEP .:. :..::..:::.::. .:. ::..:.:. :. : : :. . .: CCDS99 --------GCLQLCLEEVANGLRNPVAMVHARDGTHRFFVAEQVGLVWAYLPDRSRLGKP 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB5 YLDIHKLVQSGIKGGDERGLLSLAFHPNYKKNGKLYVSYTTN--QERWAIGPHDHILRVV .:.: ..: .. :::::.:..::::....: .::: :... . .: .:. CCDS99 FLNISRVVLTSPWEGDERGFLGIAFHPSFQHNRRLYVYYSVGIRSSEW--------IRIS 240 250 260 270 280 330 340 350 360 370 380 pF1KB5 EYTVSRKNPHQVDLRTARVFLEVAELHRKHLGGQLLFGPDGFLYIILGDGMITLDDMEEM :. ::. . . :: . :..::: : .: ::::::: ::.:::. ::: .. : . . CCDS99 EFRVSEDDENAVDHSSERIILEVKEPASNHNGGQLLFGDDGYLYIFTGDGGMAGDPFGTF 290 300 310 320 330 340 390 400 410 420 430 pF1KB5 DGL---SDFTGSVLRLDVDTDMCNVPYSIPRSNPHFNSTNQPPEVFAHGLHDPGRCAVDR . : . :.:::.::: ..::.:: .:: .. :::.: :... ::. :: CCDS99 GNAQNKSALLGKVLRIDVDRKERGLPYGIPPDNPFVGDPAAQPEVYALGVRNMWRCSFDR 350 360 370 380 390 400 440 450 460 470 480 pF1KB5 -HPTDININLTILCSDSNGKNRSSARILQIIKGKDYE---------------SEPSLLEF :.. . ..:.: :.:. .. . .: .: .. :: .. CCDS99 GDPSSGTGRGRLFCGDV-GQNKFE-EVDVVERGGNYGWRAREGFECYDRSLCANTSLNDL 410 420 430 440 450 460 490 500 510 520 530 pF1KB5 KPFSNGP------LVGGFVYRGCQSERLYGSYVFGD-RNGNFLTLQQSPVTKQWQEKPLC :. : ..::.:::::. : : :.::: .: ...::..: : ::: . .: CCDS99 LPIFAYPHTVGKSVTGGYVYRGCEYPNLNGLYIFGDFMSGRLMSLQENPGTGQWQYSEIC 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB5 LGTSGSCR--GYFSGH---ILGFGEDELGEVYILSSSKSMTQTHNGKLYKIVDPKRPLMP .: . .:. : .... :..::::: ::.:..:... . . : .:::.: . CCDS99 MGHGQTCEFPGLINNYYPYIISFGEDEAGELYFMSTGEPSATAPRGVVYKIIDASS---- 530 540 550 560 570 600 610 620 630 640 pF1KB5 EECRA-TVQPAQT-LTSECSRLCRNGYCTPTGKCCCSPGWEGDFCRTAKCEPACRHGGVC :.: ...:. . : :: : CCDS99 --CKARSAMPGYVPAPSVCSSLTSQPFILQWWK 580 590 600 >>CCDS45162.1 HHIPL1 gene_id:84439|Hs108|chr14 (782 aa) initn: 867 init1: 268 opt: 656 Z-score: 589.9 bits: 119.8 E(32554): 1.6e-26 Smith-Waterman score: 954; 31.8% identity (59.0% similar) in 581 aa overlap (68-602:38-590) 40 50 60 70 80 90 pF1KB5 RCLNGNPPKRLKRRDRRMMSQLELLSGGEMLCGGFYPRLSCCLRSDSPGLGRLENKIFSV ::. : ..:: .. . : : . : CCDS45 ALLALWVLGAAAHPQCLDFRPPFRPTQPLRLCAQ-YSDFGCCDEGRDAELTRRFWALASR 10 20 30 40 50 60 100 110 120 130 140 150 pF1KB5 TNNTE---CGKLLEEIKCALCSPHSQSLFHSPEREVLERDLVLPLLCKDYCKEFFYTCRG .. .: :. ... : :::.. :. . . . : ..: ::.::: .... ::: CCDS45 VDAAEWAACAGYARDLLCQECSPYAAHLYDAEDPFTPLR--TVPGLCQDYCLDMWHKCRG 70 80 90 100 110 120 160 170 180 190 200 pF1KB5 ---HIPGFLQTTADE-----FCFYYARKDGGLCFPDFPRKQVRGPASNYLDQMEEYDKVE :. . : : :: : . : ::: . : .. : .. : CCDS45 LFRHLSTDQELWALEGNLARFCRYLSLDDTDYCFPYL---LVNKNLNSNLGHVVADAK-- 130 140 150 160 170 210 220 230 240 250 260 pF1KB5 EISRKHKHNCF--CIQEVVSGLRQPVGALHSGDGSQRLFILEKEGYVKILTPEGEIFKEP .:. :..::..:::.::. .:. ::..:.:. :. : : :. . .: CCDS45 --------GCLQLCLEEVANGLRNPVAMVHARDGTHRFFVAEQVGLVWAYLPDRSRLGKP 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB5 YLDIHKLVQSGIKGGDERGLLSLAFHPNYKKNGKLYVSYTTN--QERWAIGPHDHILRVV .:.: ..: .. :::::.:..::::....: .::: :... . .: .:. CCDS45 FLNISRVVLTSPWEGDERGFLGIAFHPSFQHNRRLYVYYSVGIRSSEW--------IRIS 240 250 260 270 280 330 340 350 360 370 380 pF1KB5 EYTVSRKNPHQVDLRTARVFLEVAELHRKHLGGQLLFGPDGFLYIILGDGMITLDDMEEM :. ::. . . :: . :..::: : .: ::::::: ::.:::. ::: .. : . . CCDS45 EFRVSEDDENAVDHSSERIILEVKEPASNHNGGQLLFGDDGYLYIFTGDGGMAGDPFGTF 290 300 310 320 330 340 390 400 410 420 430 pF1KB5 DGL---SDFTGSVLRLDVDTDMCNVPYSIPRSNPHFNSTNQPPEVFAHGLHDPGRCAVDR . : . :.:::.::: ..::.:: .:: .. :::.: :... ::. :: CCDS45 GNAQNKSALLGKVLRIDVDRKERGLPYGIPPDNPFVGDPAAQPEVYALGVRNMWRCSFDR 350 360 370 380 390 400 440 450 460 470 480 pF1KB5 -HPTDININLTILCSDSNGKNRSSARILQIIKGKDYE---------------SEPSLLEF :.. . ..:.: :.:. .. . .: .: .. :: .. CCDS45 GDPSSGTGRGRLFCGDV-GQNKFE-EVDVVERGGNYGWRAREGFECYDRSLCANTSLNDL 410 420 430 440 450 460 490 500 510 520 530 pF1KB5 KPFSNGP------LVGGFVYRGCQSERLYGSYVFGD-RNGNFLTLQQSPVTKQWQEKPLC :. : ..::.:::::. : : :.::: .: ...::..: : ::: . .: CCDS45 LPIFAYPHTVGKSVTGGYVYRGCEYPNLNGLYIFGDFMSGRLMSLQENPGTGQWQYSEIC 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB5 LGTSGSCR--GYFSGH---ILGFGEDELGEVYILSSSKSMTQTHNGKLYKIVDPKRPLMP .: . .:. : .... :..::::: ::.:..:... . . : .:::.: .: : CCDS45 MGHGQTCEFPGLINNYYPYIISFGEDEAGELYFMSTGEPSATAPRGVVYKIIDASRRAPP 530 540 550 560 570 580 600 610 620 630 640 650 pF1KB5 EECRATVQPAQTLTSECSRLCRNGYCTPTGKCCCSPGWEGDFCRTAKCEPACRHGGVCVR .:. .:::: CCDS45 GKCQ--IQPAQVKIRSRLIPFVPKEKFIPKTRSTPRPTARAPTRAPRRGRPTAAPPAPTP 590 600 610 620 630 700 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 22:16:57 2016 done: Thu Nov 3 22:16:57 2016 Total Scan time: 3.410 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]