FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4894, 407 aa 1>>>pF1KB4894 407 - 407 aa - 407 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8125+/-0.000305; mu= 15.2799+/- 0.019 mean_var=84.4690+/-16.436, 0's: 0 Z-trim(118.1): 7 B-trim: 11 in 1/52 Lambda= 0.139549 statistics sampled from 30800 (30807) to 30800 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.361), width: 16 Scan time: 9.880 The best scores are: opt bits E(85289) NP_065852 (OMIM: 612464) arrestin domain-containin ( 414) 1449 301.3 2.9e-81 NP_006463 (OMIM: 606599) thioredoxin-interacting p ( 391) 891 188.9 1.9e-47 XP_016855574 (OMIM: 606599) PREDICTED: thioredoxin ( 395) 876 185.9 1.5e-46 NP_001300901 (OMIM: 606599) thioredoxin-interactin ( 336) 776 165.7 1.5e-40 NP_001316599 (OMIM: 612464) arrestin domain-contai ( 194) 699 150.1 4.5e-36 NP_001316601 (OMIM: 612464) arrestin domain-contai ( 194) 699 150.1 4.5e-36 NP_001316600 (OMIM: 612464) arrestin domain-contai ( 194) 699 150.1 4.5e-36 >>NP_065852 (OMIM: 612464) arrestin domain-containing pr (414 aa) initn: 1434 init1: 951 opt: 1449 Z-score: 1579.8 bits: 301.3 E(85289): 2.9e-81 Smith-Waterman score: 1449; 53.6% identity (78.9% similar) in 412 aa overlap (1-404:1-411) 10 20 30 40 50 60 pF1KB4 MLFDKVKAFSVQLDGATAGVEPVFSGGQAVAGRVLLELSSAARVGALRLRARGRAHVHWT :.. :::......: . . ::.:.:..:.::: ::... :: .:...:::.:.:.:: NP_065 MVLGKVKSLTISFDCLNDSNVPVYSSGDTVSGRVNLEVTGEIRVKSLKIHARGHAKVRWT 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 ESRSAGSSTAYTQSYSERVEVVSHRATLLA----PDTGETT--TLPPGRHEFLFSFQLPP :::.:::.:::::.:.:.:: .:. :.. :..: :. ::::. :::.:: NP_065 ESRNAGSNTAYTQNYTEEVEYFNHKDILIGHERDDDNSEEGFHTIHSGRHEYAFSFELPQ 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB4 T-LVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEPVDINTPALLAPQAGAREKV : :.:::::.:::::: .:: :::::. . .: :::.: .:::::.::.::::..::. NP_065 TPLATSFEGRHGSVRYWVKAELHRPWLLPVKLKKEFTVFEHIDINTPSLLSPQAGTKEKT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB4 ARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGAR :.:. : .::::::.:::::::: : .::::.: :.: :.:.::. :::.:.:.: NP_065 LCCWFCTSGPISLSAKIERKGYTPGESIQIFAEIENCSSRMVVPKAAIYQTQAFYAKGKM 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB4 KQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSK :. . .::.: :: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. NP_065 KEVKQLVANLRGESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB4 LLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAA :.:.::::::::::::::::.:::.:. :. ..: .::::::::: :.:::.. :. NP_065 LFLNLPLVIGTIPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRR 310 320 330 340 350 360 370 380 390 400 pF1KB4 LGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC . .: .: . .:.::.::::::::. ::::::: :::: .: :: : NP_065 NNLAPVSACDDFERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR 360 370 380 390 400 410 >>NP_006463 (OMIM: 606599) thioredoxin-interacting prote (391 aa) initn: 808 init1: 529 opt: 891 Z-score: 973.0 bits: 188.9 E(85289): 1.9e-47 Smith-Waterman score: 891; 38.6% identity (66.2% similar) in 399 aa overlap (1-393:2-383) 10 20 30 40 50 pF1KB4 MLFDKVKAFSVQLDGATAGVEPVFSGGQAVAGRVLLELSSAARVGALRLRARGRAHVHW ..: :.:.: : .. : :...:. :::::..:. ..:: :.:. : : :.: : NP_006 MVMFKKIKSFEVVFNDP----EKVYGSGEKVAGRVIVEVCEVTRVKAVRILACGVAKVLW 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 TESRSAGSSTAYTQSYSERVEVVSHRATLLAPD--TGETTTL---PPGRHEFLFSFQLPP . :: :. .. : . .. ::: : :::. . : ...:. :.:.:: NP_006 MQ----GS-----QQCKQTSEYLRYEDTLLLEDQPTGENEMVIMRPGNKYEYKFGFELPQ 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 -TLVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEPVDINTPALLAPQAGAREKV : :::.::.: : : .:: : :: :.....: : :.. ::.::: :.:: .. .:: NP_006 GPLGTSFKGKYGCVDYWVKAFLDRPSQPTQETKKNFEVVDLVDVNTPDLMAPVSAKKEKK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB4 ARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGAR . . : ::.::.:::::. :. : . :...: .: :.:.::.: .:..: : NP_006 VSCMFIPDGRVSVSARIDRKGFCEGDEISIHADFENTCSRIVVPKAAIVARHTYLANGQT 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB4 KQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSK : ..:. :. . : : :.:..::. . :::: : .:.:.:.: . :..::..: NP_006 KVLTQKLSSVRGNHIISGTCASWRGKSLRVQKIRPSILGCNILRVEYSLLIYVSVPGSKK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB4 LLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAA ..:.::::::. ..::.::..:..: ..: .:. ::::: : .:. :. NP_006 VILDLPLVIGS--RSGLSSRTSSMASRTSSEMSWVDLNIPDTPEAPPCYMDVIP--EDHR 290 300 310 320 330 340 360 370 380 390 400 pF1KB4 LGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPNPLLGDMRPRCMTC : . :: .: : : ..:.: : ::.. ::: :.: :: NP_006 LESPTTPLLDDMDGSQDSPIFMYAPEFKFMPPPTYTEVDPCILNNNVQ 350 360 370 380 390 >>XP_016855574 (OMIM: 606599) PREDICTED: thioredoxin-int (395 aa) initn: 793 init1: 529 opt: 876 Z-score: 956.6 bits: 185.9 E(85289): 1.5e-46 Smith-Waterman score: 876; 38.4% identity (66.2% similar) in 396 aa overlap (1-390:2-380) 10 20 30 40 50 pF1KB4 MLFDKVKAFSVQLDGATAGVEPVFSGGQAVAGRVLLELSSAARVGALRLRARGRAHVHW ..: :.:.: : .. : :...:. :::::..:. ..:: :.:. : : :.: : XP_016 MVMFKKIKSFEVVFNDP----EKVYGSGEKVAGRVIVEVCEVTRVKAVRILACGVAKVLW 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 TESRSAGSSTAYTQSYSERVEVVSHRATLLAPD--TGETTTL---PPGRHEFLFSFQLPP . :: :. .. : . .. ::: : :::. . : ...:. :.:.:: XP_016 MQ----GS-----QQCKQTSEYLRYEDTLLLEDQPTGENEMVIMRPGNKYEYKFGFELPQ 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 -TLVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEPVDINTPALLAPQAGAREKV : :::.::.: : : .:: : :: :.....: : :.. ::.::: :.:: .. .:: XP_016 GPLGTSFKGKYGCVDYWVKAFLDRPSQPTQETKKNFEVVDLVDVNTPDLMAPVSAKKEKK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB4 ARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGAR . . : ::.::.:::::. :. : . :...: .: :.:.::.: .:..: : XP_016 VSCMFIPDGRVSVSARIDRKGFCEGDEISIHADFENTCSRIVVPKAAIVARHTYLANGQT 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB4 KQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSK : ..:. :. . : : :.:..::. . :::: : .:.:.:.: . :..::..: XP_016 KVLTQKLSSVRGNHIISGTCASWRGKSLRVQKIRPSILGCNILRVEYSLLIYVSVPGSKK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB4 LLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAA ..:.::::::. ..::.::..:..: ..: .:. ::::: : .:. :. XP_016 VILDLPLVIGS--RSGLSSRTSSMASRTSSEMSWVDLNIPDTPEAPPCYMDVIP--EDHR 290 300 310 320 330 340 360 370 380 390 400 pF1KB4 LGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPNPLLGDMRPRCMTC : . :: .: : : ..:.: : ::.. ::: :.: XP_016 LESPTTPLLDDMDGSQDSPIFMYAPEFKFMPPPTYTEVRIVIFTVKFVLSFL 350 360 370 380 390 >>NP_001300901 (OMIM: 606599) thioredoxin-interacting pr (336 aa) initn: 733 init1: 529 opt: 776 Z-score: 848.9 bits: 165.7 E(85289): 1.5e-40 Smith-Waterman score: 776; 39.5% identity (67.5% similar) in 329 aa overlap (73-393:5-328) 50 60 70 80 90 pF1KB4 RVGALRLRARGRAHVHWTESRSAGSSTAYTQSYSERVEVVSHRATLLAP----DTGET-- .: :.: ..: :.:.: .::. NP_001 MPPKHSLSHRC-ILSVTASLMATRFSFPSGENEM 10 20 30 100 110 120 130 140 150 pF1KB4 TTLPPG-RHEFLFSFQLPP-TLVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEP . . :: ..:. :.:.:: : :::.::.: : : .:: : :: :.....: : :.. NP_001 VIMRPGNKYEYKFGFELPQGPLGTSFKGKYGCVDYWVKAFLDRPSQPTQETKKNFEVVDL 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB4 VDINTPALLAPQAGAREKVARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRP ::.::: :.:: .. .:: . . : ::.::.:::::. :. : . :...: .: NP_001 VDVNTPDLMAPVSAKKEKKVSCMFIPDGRVSVSARIDRKGFCEGDEISIHADFENTCSRI 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB4 VLPRAAVVQTQTFMARGARKQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCR :.:.::.: .:..: : : ..:. :. . : : :.:..::. . :::: : NP_001 VVPKAAIVARHTYLANGQTKVLTQKLSSVRGNHIISGTCASWRGKSLRVQKIRPSILGCN 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB4 VLHVDYALKVCVDIPGTSKLLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPE .:.:.:.: . :..::..:..:.::::::. ..::.::..:..: ..: .:. NP_001 ILRVEYSLLIYVSVPGSKKVILDLPLVIGS--RSGLSSRTSSMASRTSSEMSWVDLNIPD 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB4 RPEAPPEYSEVVADTEEAALGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPN ::::: : .:. :. : . :: .: : : ..:.: : ::.. ::: :.: :: NP_001 TPEAPPCYMDVIP--EDHRLESPTTPLLDDMDGSQDSPIFMYAPEFKFMPPPTYTEVDPC 280 290 300 310 320 400 pF1KB4 PLLGDMRPRCMTC NP_001 ILNNNVQ 330 >>NP_001316599 (OMIM: 612464) arrestin domain-containing (194 aa) initn: 681 init1: 524 opt: 699 Z-score: 768.6 bits: 150.1 E(85289): 4.5e-36 Smith-Waterman score: 699; 54.5% identity (78.0% similar) in 191 aa overlap (215-404:2-191) 190 200 210 220 230 240 pF1KB4 SLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGARKQKRAVVASLA :.:.::. :::.:.:.: :. . .::.: NP_001 MVVPKAAIYQTQAFYAKGKMKEVKQLVANLR 10 20 30 250 260 270 280 290 300 pF1KB4 GEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSKLLLELPLVIGT :: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. :.:.::::::: NP_001 GESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMDLFLNLPLVIGT 40 50 60 70 80 90 310 320 330 340 350 360 pF1KB4 IPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAALGQSPFPLPQD :::::::::.:::.:. :. ..: .::::::::: :.:::.. :. . .: .: NP_001 IPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRRNNLAPVSACDD 100 110 120 130 140 150 370 380 390 400 pF1KB4 PDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC . .:.::.::::::::. ::::::: :::: .: :: : NP_001 FERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR 160 170 180 190 >>NP_001316601 (OMIM: 612464) arrestin domain-containing (194 aa) initn: 681 init1: 524 opt: 699 Z-score: 768.6 bits: 150.1 E(85289): 4.5e-36 Smith-Waterman score: 699; 54.5% identity (78.0% similar) in 191 aa overlap (215-404:2-191) 190 200 210 220 230 240 pF1KB4 SLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGARKQKRAVVASLA :.:.::. :::.:.:.: :. . .::.: NP_001 MVVPKAAIYQTQAFYAKGKMKEVKQLVANLR 10 20 30 250 260 270 280 290 300 pF1KB4 GEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSKLLLELPLVIGT :: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. :.:.::::::: NP_001 GESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMDLFLNLPLVIGT 40 50 60 70 80 90 310 320 330 340 350 360 pF1KB4 IPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAALGQSPFPLPQD :::::::::.:::.:. :. ..: .::::::::: :.:::.. :. . .: .: NP_001 IPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRRNNLAPVSACDD 100 110 120 130 140 150 370 380 390 400 pF1KB4 PDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC . .:.::.::::::::. ::::::: :::: .: :: : NP_001 FERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR 160 170 180 190 >>NP_001316600 (OMIM: 612464) arrestin domain-containing (194 aa) initn: 681 init1: 524 opt: 699 Z-score: 768.6 bits: 150.1 E(85289): 4.5e-36 Smith-Waterman score: 699; 54.5% identity (78.0% similar) in 191 aa overlap (215-404:2-191) 190 200 210 220 230 240 pF1KB4 SLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGARKQKRAVVASLA :.:.::. :::.:.:.: :. . .::.: NP_001 MVVPKAAIYQTQAFYAKGKMKEVKQLVANLR 10 20 30 250 260 270 280 290 300 pF1KB4 GEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSKLLLELPLVIGT :: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. :.:.::::::: NP_001 GESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMDLFLNLPLVIGT 40 50 60 70 80 90 310 320 330 340 350 360 pF1KB4 IPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAALGQSPFPLPQD :::::::::.:::.:. :. ..: .::::::::: :.:::.. :. . .: .: NP_001 IPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRRNNLAPVSACDD 100 110 120 130 140 150 370 380 390 400 pF1KB4 PDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC . .:.::.::::::::. ::::::: :::: .: :: : NP_001 FERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR 160 170 180 190 407 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 06:04:44 2016 done: Sat Nov 5 06:04:46 2016 Total Scan time: 9.880 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]