FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7865, 557 aa 1>>>pF1KB7865 557 - 557 aa - 557 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8299+/-0.000917; mu= 7.8090+/- 0.055 mean_var=156.4391+/-32.174, 0's: 0 Z-trim(111.0): 31 B-trim: 20 in 1/50 Lambda= 0.102542 statistics sampled from 11987 (12009) to 11987 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.718), E-opt: 0.2 (0.369), width: 16 Scan time: 3.870 The best scores are: opt bits E(32554) CCDS11324.1 HNF1B gene_id:6928|Hs108|chr17 ( 557) 3695 558.7 6.8e-159 CCDS58538.1 HNF1B gene_id:6928|Hs108|chr17 ( 531) 2343 358.6 1.1e-98 CCDS77007.1 HNF1B gene_id:6928|Hs108|chr17 ( 457) 1611 250.3 3.7e-66 CCDS9209.1 HNF1A gene_id:6927|Hs108|chr12 ( 631) 907 146.2 1.1e-34 CCDS76611.1 HNF1A gene_id:6927|Hs108|chr12 ( 638) 907 146.3 1.1e-34 >>CCDS11324.1 HNF1B gene_id:6928|Hs108|chr17 (557 aa) initn: 3695 init1: 3695 opt: 3695 Z-score: 2966.2 bits: 558.7 E(32554): 6.8e-159 Smith-Waterman score: 3695; 100.0% identity (100.0% similar) in 557 aa overlap (1-557:1-557) 10 20 30 40 50 60 pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI 490 500 510 520 530 540 550 pF1KB7 STLTNMSSSKQCPLQAW ::::::::::::::::: CCDS11 STLTNMSSSKQCPLQAW 550 >>CCDS58538.1 HNF1B gene_id:6928|Hs108|chr17 (531 aa) initn: 2343 init1: 2343 opt: 2343 Z-score: 1885.5 bits: 358.6 E(32554): 1.1e-98 Smith-Waterman score: 3464; 95.3% identity (95.3% similar) in 557 aa overlap (1-557:1-531) 10 20 30 40 50 60 pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP :: :::::::::::::::::::::::::::::::: CCDS58 RQ--------------------------FSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP 190 200 210 250 260 270 280 290 300 pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB7 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB7 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS 400 410 420 430 440 450 490 500 510 520 530 540 pF1KB7 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI 460 470 480 490 500 510 550 pF1KB7 STLTNMSSSKQCPLQAW ::::::::::::::::: CCDS58 STLTNMSSSKQCPLQAW 520 530 >>CCDS77007.1 HNF1B gene_id:6928|Hs108|chr17 (457 aa) initn: 1611 init1: 1611 opt: 1611 Z-score: 1301.2 bits: 250.3 E(32554): 3.7e-66 Smith-Waterman score: 2732; 93.6% identity (93.8% similar) in 451 aa overlap (1-451:1-425) 10 20 30 40 50 60 pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP ::: ::::::::::::::::::::::::::::::: CCDS77 RQF--------------------------SQQSHGPGQSDDACSEPTNKKMRRNRFKWGP 190 200 210 250 260 270 280 290 300 pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB7 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB7 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS :::::::::::::::::::::::::: .:: CCDS77 SLSHHNPQQSQNLIMTPLSGVMAIAQMSSTSLVMPTHHLLRAQQQGPCFPHHHPLGSCHG 400 410 420 430 440 450 490 500 510 520 530 540 pF1KB7 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI CCDS77 KAQ >>CCDS9209.1 HNF1A gene_id:6927|Hs108|chr12 (631 aa) initn: 1676 init1: 565 opt: 907 Z-score: 736.3 bits: 146.2 E(32554): 1.1e-34 Smith-Waterman score: 1852; 54.4% identity (75.9% similar) in 577 aa overlap (1-551:1-541) 10 20 30 40 50 60 pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP :::::..:: :::.::: ::..::.:.::: : :.: . . : ::. : . . CCDS92 MVSKLSQLQTELLAALLESGLSKEALIQALGE--PGP-YLLAGEG-PLDKGESC-GGGRG 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR . : :: .. : : :: ..::.:. ::::::::. :. ::::.:.: :. .:.::::: CCDS92 ELAELPNGLGETRGSEDETDDDGEDF-TPPILKELENLSPEEAAHQKAVVETLLQEDPWR 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL .:::.:.:.::::::::::::.::::::::::::::::::::::::::::::::::::. CCDS92 VAKMVKSYLQQHNIPQREVVDTTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREVA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP .::... : :.. .. . :.: :: :: ::::::::: CCDS92 QQFTHAGQ--GGLIEEPTGDEL-----------------------PT-KKGRRNRFKWGP 180 190 200 250 260 270 280 290 300 pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF ::::::.:::.:::::::::::.::::::::::.:::::::.:.:::::::::::::::: CCDS92 ASQQILFQAYERQKNPSKEERETLVEECNRAECIQRGVSPSQAQGLGSNLVTEVRVYNWF 210 220 230 240 250 260 310 320 330 340 350 pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTH-SLNPLL-SHGSPHHQPSSSPPNKLSGVRYSQQGNN ::::::::::.:::::.::. . .: : .:.:: : . :.:. ::::.: ... CCDS92 ANRRKEEAFRHKLAMDTYSGPPPGPGPGPALPAHSSPGLPPPALSPSKVHGVRYGQPATS 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB7 EITSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTN : .. . ... .:: .. :.::::..:.:.:.::: ..:..:..:: :::::::: CCDS92 E---TAEVPSSSGGPLVTVSTPLHQVSPTGLEPSHSLLSTEAKLVSAAGGPLPPVSTLTA 330 340 350 360 370 380 420 430 440 450 pF1KB7 IHSLSHHNP---QQSQNLIMTPLSGVMAIAQS--------------------LNTSQAQS .::: . .: :: :::::. : :::.:. . : ..:::: CCDS92 LHSLEQTSPGLNQQPQNLIMASLPGVMTIGPGEPASLGPTFTNTGASTLVIGLASTQAQS 390 400 410 420 430 440 460 470 480 490 500 510 pF1KB7 VPVINSVAGSLAALQPVQFSQQLHSPHQQPLMQQSPGSHMAQQPFMAAVTQLQNSH-MYA ::::::...::..:::::::: :: .::::: ::..:.::::...:::. : .:. CCDS92 VPVINSMGSSLTTLQPVQFSQPLHPSYQQPLMPPVQ-SHVTQSPFMATMAQLQSPHALYS 450 460 470 480 490 500 520 530 540 550 pF1KB7 HKQEPPQYSHTSRFPSAMVVTDTSSISTLTNMSSSKQCPLQAW :: : ::.::. .:..:..:::...:.:.... .:: CCDS92 HKPEVAQYTHTGLLPQTMLITDTTNLSALASLTPTKQVFTSDTEASSESGLHTPASQATT 510 520 530 540 550 560 CCDS92 LHVPSQDPASIQHLQPAHRLSASPTVSSSSLVLYQSSDSSNGQSHLLPSNHSVIETFIST 570 580 590 600 610 620 >>CCDS76611.1 HNF1A gene_id:6927|Hs108|chr12 (638 aa) initn: 1676 init1: 565 opt: 907 Z-score: 736.3 bits: 146.3 E(32554): 1.1e-34 Smith-Waterman score: 1852; 54.4% identity (75.9% similar) in 577 aa overlap (1-551:1-541) 10 20 30 40 50 60 pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP :::::..:: :::.::: ::..::.:.::: : :.: . . : ::. : . . CCDS76 MVSKLSQLQTELLAALLESGLSKEALIQALGE--PGP-YLLAGEG-PLDKGESC-GGGRG 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR . : :: .. : : :: ..::.:. ::::::::. :. ::::.:.: :. .:.::::: CCDS76 ELAELPNGLGETRGSEDETDDDGEDF-TPPILKELENLSPEEAAHQKAVVETLLQEDPWR 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL .:::.:.:.::::::::::::.::::::::::::::::::::::::::::::::::::. CCDS76 VAKMVKSYLQQHNIPQREVVDTTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREVA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP .::... : :.. .. . :.: :: :: ::::::::: CCDS76 QQFTHAGQ--GGLIEEPTGDEL-----------------------PT-KKGRRNRFKWGP 180 190 200 250 260 270 280 290 300 pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF ::::::.:::.:::::::::::.::::::::::.:::::::.:.:::::::::::::::: CCDS76 ASQQILFQAYERQKNPSKEERETLVEECNRAECIQRGVSPSQAQGLGSNLVTEVRVYNWF 210 220 230 240 250 260 310 320 330 340 350 pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTH-SLNPLL-SHGSPHHQPSSSPPNKLSGVRYSQQGNN ::::::::::.:::::.::. . .: : .:.:: : . :.:. ::::.: ... CCDS76 ANRRKEEAFRHKLAMDTYSGPPPGPGPGPALPAHSSPGLPPPALSPSKVHGVRYGQPATS 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB7 EITSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTN : .. . ... .:: .. :.::::..:.:.:.::: ..:..:..:: :::::::: CCDS76 E---TAEVPSSSGGPLVTVSTPLHQVSPTGLEPSHSLLSTEAKLVSAAGGPLPPVSTLTA 330 340 350 360 370 380 420 430 440 450 pF1KB7 IHSLSHHNP---QQSQNLIMTPLSGVMAIAQS--------------------LNTSQAQS .::: . .: :: :::::. : :::.:. . : ..:::: CCDS76 LHSLEQTSPGLNQQPQNLIMASLPGVMTIGPGEPASLGPTFTNTGASTLVIGLASTQAQS 390 400 410 420 430 440 460 470 480 490 500 510 pF1KB7 VPVINSVAGSLAALQPVQFSQQLHSPHQQPLMQQSPGSHMAQQPFMAAVTQLQNSH-MYA ::::::...::..:::::::: :: .::::: ::..:.::::...:::. : .:. CCDS76 VPVINSMGSSLTTLQPVQFSQPLHPSYQQPLMPPVQ-SHVTQSPFMATMAQLQSPHALYS 450 460 470 480 490 500 520 530 540 550 pF1KB7 HKQEPPQYSHTSRFPSAMVVTDTSSISTLTNMSSSKQCPLQAW :: : ::.::. .:..:..:::...:.:.... .:: CCDS76 HKPEVAQYTHTGLLPQTMLITDTTNLSALASLTPTKQEAALLPQVFTSDTEASSESGLHT 510 520 530 540 550 560 CCDS76 PASQATTLHVPSQDPASIQHLQPAHRLSASPTVSSSSLVLYQSSDSSNGQSHLLPSNHSV 570 580 590 600 610 620 557 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 09:57:35 2016 done: Sat Nov 5 09:57:35 2016 Total Scan time: 3.870 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]