FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4571, 615 aa 1>>>pF1KB4571 615 - 615 aa - 615 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.6588+/-0.000979; mu= 13.0735+/- 0.059 mean_var=115.5567+/-22.854, 0's: 0 Z-trim(108.6): 24 B-trim: 5 in 1/50 Lambda= 0.119310 statistics sampled from 10312 (10321) to 10312 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.317), width: 16 Scan time: 3.520 The best scores are: opt bits E(32554) CCDS1545.1 LBR gene_id:3930|Hs108|chr1 ( 615) 4128 722.0 5.8e-208 CCDS41669.1 TM7SF2 gene_id:7108|Hs108|chr11 ( 418) 1676 299.8 4.8e-81 CCDS60846.1 TM7SF2 gene_id:7108|Hs108|chr11 ( 391) 551 106.1 8.9e-23 CCDS8200.1 DHCR7 gene_id:1717|Hs108|chr11 ( 475) 425 84.5 3.5e-16 >>CCDS1545.1 LBR gene_id:3930|Hs108|chr1 (615 aa) initn: 4128 init1: 4128 opt: 4128 Z-score: 3847.1 bits: 722.0 E(32554): 5.8e-208 Smith-Waterman score: 4128; 99.8% identity (100.0% similar) in 615 aa overlap (1-615:1-615) 10 20 30 40 50 60 pF1KB4 MPSRKFADGEVVRGRWPGSSLYYEVEILSHDSTSQLYTVKYKDGTELELKENDIKPLTSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 MPSRKFADGEVVRGRWPGSSLYYEVEILSHDSTSQLYTVKYKDGTELELKENDIKPLTSF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 RQRKGGSTSSSPSRRRGSRSRSRSRSPGRPPKSARRSASASHQADIKEARREVEVKLTPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 RQRKGGSTSSSPSRRRGSRSRSRSRSPGRPPKSARRSASASHQADIKEARREVEVKLTPL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 ILKPFGNSISRYNGEPEHIERNDAPHKNTQEKFNLSQESSYIATQYSLRPRREEVKLKEI :::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::: CCDS15 ILKPFGNSISRYNGEPEHIERNDAPHKNTQEKFSLSQESSYIATQYSLRPRREEVKLKEI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 DSKEEKYVAKELAVRTFEVTPIRAKDLEFGGVPGVFLIMFGLPVFLFLLLLMCKQKDPSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 DSKEEKYVAKELAVRTFEVTPIRAKDLEFGGVPGVFLIMFGLPVFLFLLLLMCKQKDPSL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 LNFPPPLPALYELWETRVFGVYLLWFLIQVLFYLLPIGKVVEGTPLIDGRRLKYRLNGFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 LNFPPPLPALYELWETRVFGVYLLWFLIQVLFYLLPIGKVVEGTPLIDGRRLKYRLNGFY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 AFILTSAVIGTSLFQGVEFHYVYSHFLQFALAATVFCVVLSVYLYMRSLKAPRNDLSPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 AFILTSAVIGTSLFQGVEFHYVYSHFLQFALAATVFCVVLSVYLYMRSLKAPRNDLSPAS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 SGNAVYDFFIGRELNPRIGTFDLKYFCELRPGLIGWVVINLVMLLAEMKIQDRAVPSLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 SGNAVYDFFIGRELNPRIGTFDLKYFCELRPGLIGWVVINLVMLLAEMKIQDRAVPSLAM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 ILVNSFQLLYVVDALWNEEALLTTMDIIHDGFGFMLAFGDLVWVPFIYSFQAFYLVSHPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 ILVNSFQLLYVVDALWNEEALLTTMDIIHDGFGFMLAFGDLVWVPFIYSFQAFYLVSHPN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 EVSWPMASLIIVLKLCGYVIFRGANSQKNAFRKNPSDPKLAHLKTIHTSTGKNLLVSGWW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 EVSWPMASLIIVLKLCGYVIFRGANSQKNAFRKNPSDPKLAHLKTIHTSTGKNLLVSGWW 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 GFVRHPNYLGDLIMALAWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKYGVAWE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS15 GFVRHPNYLGDLIMALAWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKYGVAWE 550 560 570 580 590 600 610 pF1KB4 KYCQRVPYRIFPYIY ::::::::::::::: CCDS15 KYCQRVPYRIFPYIY 610 >>CCDS41669.1 TM7SF2 gene_id:7108|Hs108|chr11 (418 aa) initn: 1419 init1: 1081 opt: 1676 Z-score: 1568.5 bits: 299.8 E(32554): 4.8e-81 Smith-Waterman score: 1676; 59.0% identity (81.0% similar) in 410 aa overlap (207-615:11-418) 180 190 200 210 220 230 pF1KB4 LKEIDSKEEKYVAKELAVRTFEVTPIRAKDLEFGGVPGVFLIMFGLPVFLFLLLLMCKQK ::::: :. ... ::. .: ::: .. CCDS41 MAPTQGPRAPLEFGGPLGAAALLLLLPATMFHLLLAARSG 10 20 30 40 240 250 260 270 280 290 pF1KB4 DPSLLNFPPPLPALYELWETRVFGVYLLWFLIQVLFYLLPIGKVVEGTPLIDGRRLKYRL ::. : ::.: :: :.. ..: :. .:. .:::: ::.:: : : ::.: . CCDS41 PARLLGPPASLPGLEVLWSPRALLLWLAWLGLQAALYLLPARKVAEGQELKDKSRLRYPI 50 60 70 80 90 100 300 310 320 330 340 350 pF1KB4 NGFYAFILTSAVIGTSLFQGVEFHYVYSHFLQFALAATVFCVVLSVYLYMRSLKAPRNDL ::: :..::. ..: .. :. . . .: .:..::. ..:..:::.. :: . : CCDS41 NGFQALVLTALLVGLGMSAGLPLGALPEMLLPLAFVATLTAFIFSLFLYMKAQVAPVSAL 110 120 130 140 150 160 360 370 380 390 400 410 pF1KB4 SPA-SSGNAVYDFFIGRELNPRIGTFDLKYFCELRPGLIGWVVINLVMLLAEMKIQDRAV .:. .::: .::::.:::::::: ::.::::::::::::::.:::..:. : .. :. CCDS41 APGGNSGNPIYDFFLGRELNPRICFFDFKYFCELRPGLIGWVLINLALLMKEAEL--RGS 170 180 190 200 210 420 430 440 450 460 470 pF1KB4 PSLAMILVNSFQLLYVVDALWNEEALLTTMDIIHDGFGFMLAFGDLVWVPFIYSFQAFYL ::::: :::.:::::: ::::.:::.:::::: ::::::::::::..:::: ::.:: .: CCDS41 PSLAMWLVNGFQLLYVGDALWHEEAVLTTMDITHDGFGFMLAFGDMAWVPFTYSLQAQFL 220 230 240 250 260 270 480 490 500 510 520 530 pF1KB4 VSHPNEVSWPMASLIIVLKLCGYVIFRGANSQKNAFRKNPSDPKLAHLKTIHTSTGKNLL . ::. .. ::::.: ... :: ::::::::::.::::::::..: :.:: :.::..:: CCDS41 LHHPQPLGLPMASVICLINATGYYIFRGANSQKNTFRKNPSDPRVAGLETISTATGRKLL 280 290 300 310 320 330 540 550 560 570 580 590 pF1KB4 VSGWWGFVRHPNYLGDLIMALAWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKY ::::::.::::::::::::::::::::: .:.:::::..::: :::::::::: .: .:: CCDS41 VSGWWGMVRHPNYLGDLIMALAWSLPCGVSHLLPYFYLLYFTALLVHREARDERQCLQKY 340 350 360 370 380 390 600 610 pF1KB4 GVAWEKYCQRVPYRIFPYIY :.::..::.::::::.:::: CCDS41 GLAWQEYCRRVPYRIMPYIY 400 410 >>CCDS60846.1 TM7SF2 gene_id:7108|Hs108|chr11 (391 aa) initn: 1255 init1: 551 opt: 551 Z-score: 522.4 bits: 106.1 E(32554): 8.9e-23 Smith-Waterman score: 1468; 54.4% identity (75.4% similar) in 410 aa overlap (207-615:11-391) 180 190 200 210 220 230 pF1KB4 LKEIDSKEEKYVAKELAVRTFEVTPIRAKDLEFGGVPGVFLIMFGLPVFLFLLLLMCKQK ::::: :. ... ::. .: ::: .. CCDS60 MAPTQGPRAPLEFGGPLGAAALLLLLPATMFHLLLAARSG 10 20 30 40 240 250 260 270 280 290 pF1KB4 DPSLLNFPPPLPALYELWETRVFGVYLLWFLIQVLFYLLPIGKVVEGTPLIDGRRLKYRL ::. : ::.: :: :.. ..: :. .:. .:::: ::.:: : : ::.: . CCDS60 PARLLGPPASLPGLEVLWSPRALLLWLAWLGLQAALYLLPARKVAEGQELKDKSRLRYPI 50 60 70 80 90 100 300 310 320 330 340 350 pF1KB4 NGFYAFILTSAVIGTSLFQGVEFHYVYSHFLQFALAATVFCVVLSVYLYMRSLKAPRNDL ::: :..::. ..: .. :. . . .: .:..::. ..:..:::.. :: . : CCDS60 NGFQALVLTALLVGLGMSAGLPLGALPEMLLPLAFVATLTAFIFSLFLYMKAQVAPVSAL 110 120 130 140 150 160 360 370 380 390 400 410 pF1KB4 SPA-SSGNAVYDFFIGRELNPRIGTFDLKYFCELRPGLIGWVVINLVMLLAEMKIQDRAV .:. .::: .::::.:::::::: ::.::::::::::::::.:::..:. : .. :. CCDS60 APGGNSGNPIYDFFLGRELNPRICFFDFKYFCELRPGLIGWVLINLALLMKEAEL--RGS 170 180 190 200 210 420 430 440 450 460 470 pF1KB4 PSLAMILVNSFQLLYVVDALWNEEALLTTMDIIHDGFGFMLAFGDLVWVPFIYSFQAFYL ::::: :::.:::::: ::::.:::.:::::: ::::::::::::..:::: ::.:: .: CCDS60 PSLAMWLVNGFQLLYVGDALWHEEAVLTTMDITHDGFGFMLAFGDMAWVPFTYSLQAQFL 220 230 240 250 260 270 480 490 500 510 520 530 pF1KB4 VSHPNEVSWPMASLIIVLKLCGYVIFRGANSQKNAFRKNPSDPKLAHLKTIHTSTGKNLL . ::. .. ::::.: : .. : :.:: :.::..:: CCDS60 LHHPQPLGLPMASVI-----C---LING-------------------LETISTATGRKLL 280 290 300 310 540 550 560 570 580 590 pF1KB4 VSGWWGFVRHPNYLGDLIMALAWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKY ::::::.::::::::::::::::::::: .:.:::::..::: :::::::::: .: .:: CCDS60 VSGWWGMVRHPNYLGDLIMALAWSLPCGVSHLLPYFYLLYFTALLVHREARDERQCLQKY 320 330 340 350 360 370 600 610 pF1KB4 GVAWEKYCQRVPYRIFPYIY :.::..::.::::::.:::: CCDS60 GLAWQEYCRRVPYRIMPYIY 380 390 >>CCDS8200.1 DHCR7 gene_id:1717|Hs108|chr11 (475 aa) initn: 881 init1: 355 opt: 425 Z-score: 404.0 bits: 84.5 E(32554): 3.5e-16 Smith-Waterman score: 911; 35.0% identity (65.0% similar) in 449 aa overlap (203-615:31-475) 180 190 200 210 220 230 pF1KB4 EEVKLKEIDSKEEKYVAKELAVRTFEVTPIRAKDLE-FGGVPGVFLIMFGLPVFLFLLLL :: ... :. . .::..:. : ... ... CCDS82 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFA-PFIVYYFIM 10 20 30 40 50 240 250 260 270 pF1KB4 MCKQKDPSL----LNFPPPLPALYELWET------RVFGVYLLWFLIQVLFY-------- : : . .: ... : ..: .. .: :: .:::.: CCDS82 ACDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCH 60 70 80 90 100 110 280 290 300 310 320 pF1KB4 -LLP--IGKVVEGTPLIDGRRLKYRLNGFYAFILTSAV--IGTSLFQGVEFHYVYSHFLQ .:: .: . ::. : ::..::. :..:: . .. :.. ...... CCDS82 KFLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIP 120 130 140 150 160 170 330 340 350 360 370 380 pF1KB4 FALAATVFCVVLSVYLYMRSLKAPRNDLSPASSGNAVYDFFIGRELNPRIGT-FDLKYFC . :... ..:.. .... : . . .:: :....: :.::::: ::.: : CCDS82 LLWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFF 180 190 200 210 220 230 390 400 410 420 430 440 pF1KB4 ELRPGLIGWVVINLVMLLAEMKIQDRAVPSLAMILVNSFQLLYVVDALWNEEALLTTMDI . :::...:..::: . . ...... . ::.::: .: .::.: .::: : :.:: CCDS82 NGRPGIVAWTLINLSFAAKQRELHSHV--TNAMVLVNVLQAIYVIDFFWNETWYLKTIDI 240 250 260 270 280 290 450 460 470 480 490 500 pF1KB4 IHDGFGFMLAFGDLVWVPFIYSFQAFYLVSHPNEVSWPMASLIIVLKLCGYVIFRGANSQ :: ::..:..:: ::.:..:..:..::: :: ..: : : ...: : :: ::: :: : CCDS82 CHDHFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQ 300 310 320 330 340 350 510 520 530 540 550 pF1KB4 KNAFRKNPS-------DPKLAHLKTIHTSTGK----NLLVSGWWGFVRHPNYLGDLIMAL :. ::.. . ::. . . .. :. .:::::.:: .:: ::.:::. .: CCDS82 KDLFRRTDGRCLIWGRKPKVIEC-SYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSL 360 370 380 390 400 410 560 570 580 590 600 610 pF1KB4 AWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKYGVAWEKYCQRVPYRIFPYIY :. : :: .:.::::::::...::.:: :::..: .::: ::.: ::::..: :. CCDS82 AYCLACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF 420 430 440 450 460 470 615 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 15:09:42 2016 done: Thu Nov 3 15:09:42 2016 Total Scan time: 3.520 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]