FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5994, 609 aa 1>>>pF1KB5994 609 - 609 aa - 609 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5991+/-0.000952; mu= 18.0120+/- 0.057 mean_var=70.0500+/-13.769, 0's: 0 Z-trim(104.3): 29 B-trim: 0 in 0/51 Lambda= 0.153239 statistics sampled from 7839 (7854) to 7839 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.588), E-opt: 0.2 (0.241), width: 16 Scan time: 2.740 The best scores are: opt bits E(32554) CCDS3555.1 ALB gene_id:213|Hs108|chr4 ( 609) 4118 919.9 0 CCDS3556.1 AFP gene_id:174|Hs108|chr4 ( 609) 1727 391.3 2e-108 CCDS3557.1 AFM gene_id:173|Hs108|chr4 ( 599) 1452 330.5 3.9e-90 CCDS3550.1 GC gene_id:2638|Hs108|chr4 ( 474) 593 140.5 4.7e-33 CCDS56332.1 GC gene_id:2638|Hs108|chr4 ( 493) 593 140.5 4.9e-33 >>CCDS3555.1 ALB gene_id:213|Hs108|chr4 (609 aa) initn: 4118 init1: 4118 opt: 4118 Z-score: 4916.9 bits: 919.9 E(32554): 0 Smith-Waterman score: 4118; 100.0% identity (100.0% similar) in 609 aa overlap (1-609:1-609) 10 20 30 40 50 60 pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 ERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 ARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 ECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYAR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 RHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 RHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 QLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 QLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 LNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 SEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLV 550 560 570 580 590 600 pF1KB5 AASQAALGL ::::::::: CCDS35 AASQAALGL >>CCDS3556.1 AFP gene_id:174|Hs108|chr4 (609 aa) initn: 2021 init1: 1666 opt: 1727 Z-score: 2060.1 bits: 391.3 E(32554): 2e-108 Smith-Waterman score: 1727; 40.0% identity (71.0% similar) in 610 aa overlap (1-609:1-609) 10 20 30 40 50 60 pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF :::: : :.::.. . :: . : . . . .. .: .. :. : :::..:. . CCDS35 MKWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP .. :.:... . ..::.. .: .. : ..:: . : ::. .:::...: CCDS35 KEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGH-SDCCSQSEE 70 80 90 100 110 130 140 150 160 170 pF1KB5 ERNECFLQHKDDNP-NLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELL :..::: :: .: ..: . :: . : :.....:::..:..::::::::..::: .: CCDS35 GRHNCFLAHKKPTPASIPLFQVPEPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTIL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 FFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWA ..: :: . ::.: . . :. : . : . :: .. :: ...:: :.:.: . CCDS35 LWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLNQHACAVMKNFGTRTFQAIT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 VARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKL :..:::.: :..:.:..::: :...:: .::.::.:.: .: . .::: .::..:.:. CCDS35 VTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 KECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYA :::. ::...:: ..:::: : : :. ..: . . :..::. :..::. CCDS35 TECCKLTTLERGQCIIHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 RRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELF ::::. .: ..::.:: :. :::: . .: :: : .:.. ..: : : :..: :: CCDS35 RRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLF 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 EQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSV ..:::: .:::.:: ::::.::... :. ..:... ... ::. : : . :.: .. CCDS35 QKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADI 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 VLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICT ....::. :: :::. : .::: : .:::::::.: ::::::: :. . : :: :.: CCDS35 IIGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQ 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 LSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKL . : :: :..:::.::. :.:::.::. ::....::::.....:.::::::.:: CCDS35 AQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKL 540 550 560 570 580 590 600 pF1KB5 VAASQAALGL .. ..::::. CCDS35 ISKTRAALGV 600 >>CCDS3557.1 AFM gene_id:173|Hs108|chr4 (599 aa) initn: 1413 init1: 1023 opt: 1452 Z-score: 1731.6 bits: 330.5 E(32554): 3.9e-90 Smith-Waterman score: 1452; 35.5% identity (69.0% similar) in 603 aa overlap (1-599:4-597) 10 20 30 40 50 pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQ .: . :: .::... . . . :: .. . ...: :.:.. ...::::::.:. CCDS35 MKLLKLTGFIFFLFFLTESLTLPTQPRDIENFNSTQKFI---EDNIEYITIIAFAQYVQE 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 CPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAK ::. :::....:. :.::.. .:.: .... .:.:.. : . .. .. ::.: CCDS35 ATFEEMEKLVKDMVEYKDRCMADKTLPECSKLPNNVLQEKICAMEGLPQKHN-FSHCCSK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 QEPERNECFLQHKDDN----PNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYF . .: ::. .: .. : .: : :: : :...:.:..:...:::.:::.:. CCDS35 VDAQRRLCFFYNKKSDVGFLPPFPTL-DPEEK--CQAYESNRESLLNHFLYEVARRNPFV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 YAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGER .:: :: : ... . ::. .:. :: . . . :: :. :. :..: ::: . CCDS35 FAPTLLTVAVHFEEVAKSCCEEQNKVNCLQTRAIPVTQYLKAFSSYQKHVCGALLKFGTK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 AFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQD . . .: :::.::: :: :. .:: :... . ::.::...: : . . ..:: .:: CCDS35 VVHFIYIAILSQKFPKIEFKELISLVEDVSSNYDGCCEGDVVQCIRDTSKVMNHICSKQD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 SISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGM :::::.:::::: . :...:: . ..:. : :: . :..:..::.. :.:.. CCDS35 SISSKIKECCEKKIPERGQCIINSNKDDRPKDLSLREGKFTDSENVCQERDADPDTFFAK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 FLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIK : .::.::::: :. :::... :. :..:: . .: :: . :.:. .:. .... CCDS35 FTFEYSRRHPDLSIPELLRIVQIYKDLLRNCCNTENPPGCYRYAEDKFNETTEKSLKMVQ 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 QNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCA :.:. :..::. .. :.: :: .::.:: :: ..... . . :: : .. :. CCDS35 QECKHFQNLGKDGLKYHYLIRLTKIAPQLSTEELVSLGEKMVTAFTTCCTLSE--EFACV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 EDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTF .. ..:...:: ..:. .. : .:: ... ::::: .:..:.:::: :. . ::: CCDS35 DNLADLVFGELCGVNENRTINPAVDHCCKTNFAFRRPCFESLKADKTYVPPPFSQDLFTF 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 HADICTLSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFA :::.: ...: : : . ::.::: : . : :.:.... .:: :.:::::.. :.:: CCDS35 HADMCQSQNEELQRKTDRFLVNLVKLKHELTDEELQSLFTNFANVVDKCCKAESPEVCFN 540 550 560 570 580 590 600 pF1KB5 EEGKKLVAASQAALGL ::. :. CCDS35 EESPKIGN >>CCDS3550.1 GC gene_id:2638|Hs108|chr4 (474 aa) initn: 424 init1: 302 opt: 593 Z-score: 706.9 bits: 140.5 E(32554): 4.7e-33 Smith-Waterman score: 596; 25.4% identity (58.3% similar) in 472 aa overlap (1-462:1-453) 10 20 30 40 50 60 pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF :: : . : :. : :: :: .:..: ..:. ::.:.: .: :. ... . . : CCDS35 MKRVLVLLLAVAFGHALERG---RDYEKNKVCKEFSHLGKEDFTSLSLVLYSRKFPSGTF 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP :. .::.::. ....: :. . .: . . .. : : . .. :.::.:. CCDS35 EQVSQLVKEVVSLTEACCAEGADPDCYDTRTSALSAKSCESNSPFPVHPGTAECCTKEGL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 ERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLF ::. :. : . ..: :.: : .: ::. . . . .....: . : :: :. CCDS35 ERKLCMAALKHQPQEFPTYVEPTNDEICEAFRKDPKEYANQFMWEYSTN--YGQAPLSLL 120 130 140 150 160 170 190 200 210 220 230 pF1KB5 --FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAW ..: : . :: .:. ..:.: . .:. . .. ..:. :.. .::. . CCDS35 VSYTKSYLSMVGSCCTSASPTVCFLKERLQLKHLSLLTTLSNRV-CSQYAAYGEKKSRLS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 AVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLEC-ADDRADLAKYICENQDSISS . .:.:. : :.. .: :. :.:.. ..::.. .: : . . . .:.: .. .: CCDS35 NLIKLAQKVPTADLEDVLPLAEDITNILSKCCESASEDCMAKELPEHTVKLCDNLSTKNS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 KLKECC-EKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLY :...:: :: .. : . ..: .::.. .. .:::: . ...: . . . CCDS35 KFEDCCQEKTAMDVFVCTYFMPAAQLP-ELPDV--ELPTNKDVC-DPGNTK--VMDKYTF 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 EYARR-H-PDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVE-EPQNLIK : .:: : :. :.: .. . .: .:: . : : :. ::.. : ...: CCDS35 ELSRRTHLPE---VFLSKVLEPTLKSLGECCDVEDSTTC----FNAKGPLLKKELSSFID 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB5 QNCELFEQLGEYKF---QNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRM .. :: . .: : .. : : :.:... :... . . .:.:: CCDS35 KGQELCADYSENTFTEYKKKLAERLKAKLPDATPTELAKLVNKHSDFASNCCSINSPPLY 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB5 PCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAET CCDS35 CDSEIDAELKNIL 470 >>CCDS56332.1 GC gene_id:2638|Hs108|chr4 (493 aa) initn: 424 init1: 302 opt: 593 Z-score: 706.6 bits: 140.5 E(32554): 4.9e-33 Smith-Waterman score: 596; 25.4% identity (58.3% similar) in 472 aa overlap (1-462:20-472) 10 20 30 40 pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEE :: : . : :. : :: :: .:..: ..:. ::.: CCDS56 MLWSWSEERGGAARLSGRKMKRVLVLLLAVAFGHALERG---RDYEKNKVCKEFSHLGKE 10 20 30 40 50 50 60 70 80 90 100 pF1KB5 NFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTV .: .: :. ... . . ::. .::.::. ....: :. . .: . . .. : : CCDS56 DFTSLSLVLYSRKFPSGTFEQVSQLVKEVVSLTEACCAEGADPDCYDTRTSALSAKSCES 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 ATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKK . .. :.::.:. ::. :. : . ..: :.: : .: ::. . . . .. CCDS56 NSPFPVHPGTAECCTKEGLERKLCMAALKHQPQEFPTYVEPTNDEICEAFRKDPKEYANQ 120 130 140 150 160 170 170 180 190 200 210 pF1KB5 YLYEIARRHPYFYAPELLF--FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAK ...: . : :: :. ..: : . :: .:. ..:.: . .:. . .. . CCDS56 FMWEYSTN--YGQAPLSLLVSYTKSYLSMVGSCCTSASPTVCFLKERLQLKHLSLLTTLS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB5 QRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLEC-A .:. :.. .::. . . .:.:. : :.. .: :. :.:.. ..::.. .: : CCDS56 NRV-CSQYAAYGEKKSRLSNLIKLAQKVPTADLEDVLPLAEDITNILSKCCESASEDCMA 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB5 DDRADLAKYICENQDSISSKLKECC-EKPLLEKSHCIAEVENDEMPADLPSLAADFVESK . . . .:.: .. .::...:: :: .. : . ..: .::.. .. .: CCDS56 KELPEHTVKLCDNLSTKNSKFEDCCQEKTAMDVFVCTYFMPAAQLP-ELPDV--ELPTNK 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB5 DVCKNYAEAKDVFLGMFLYEYARR-H-PDYSVVLLLRLAKTYETTLEKCCAAADPHECYA ::: . ...: . . .: .:: : :. :.: .. . .: .:: . : : CCDS56 DVC-DPGNTK--VMDKYTFELSRRTHLPE---VFLSKVLEPTLKSLGECCDVEDSTTC-- 360 370 380 390 400 400 410 420 430 440 450 pF1KB5 KVFDEFKPLVE-EPQNLIKQNCELFEQLGEYKF---QNALLVRYTKKVPQVSTPTLVEVS :. ::.. : ...: .. :: . .: : .. : : :.:... :... CCDS56 --FNAKGPLLKKELSSFIDKGQELCADYSENTFTEYKKKLAERLKAKLPDATPTELAKLV 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB5 RNLGKVGSKCCKHPEAKRMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPC . . .:.:: CCDS56 NKHSDFASNCCSINSPPLYCDSEIDAELKNIL 470 480 490 609 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:33:02 2016 done: Mon Nov 7 19:33:03 2016 Total Scan time: 2.740 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]