FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3878, 382 aa 1>>>pF1KB3878 382 - 382 aa - 382 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.1060+/-0.000996; mu= -1.8232+/- 0.061 mean_var=360.8378+/-73.198, 0's: 0 Z-trim(116.1): 112 B-trim: 56 in 1/51 Lambda= 0.067518 statistics sampled from 16550 (16660) to 16550 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.804), E-opt: 0.2 (0.512), width: 16 Scan time: 2.210 The best scores are: opt bits E(32554) CCDS1438.1 PRELP gene_id:5549|Hs108|chr1 ( 382) 2655 271.9 6.7e-73 CCDS9037.1 KERA gene_id:11081|Hs108|chr12 ( 352) 1247 134.7 1.2e-31 CCDS30976.1 FMOD gene_id:2331|Hs108|chr1 ( 376) 858 96.8 3.3e-20 CCDS6696.1 OMD gene_id:4958|Hs108|chr9 ( 421) 780 89.3 6.9e-18 CCDS9038.1 LUM gene_id:4060|Hs108|chr12 ( 338) 775 88.7 8.3e-18 >>CCDS1438.1 PRELP gene_id:5549|Hs108|chr1 (382 aa) initn: 2655 init1: 2655 opt: 2655 Z-score: 1422.2 bits: 271.9 E(32554): 6.7e-73 Smith-Waterman score: 2655; 100.0% identity (100.0% similar) in 382 aa overlap (1-382:1-382) 10 20 30 40 50 60 pF1KB3 MRSPLCWLLPLLILASVAQGQPTRRPRPGTGPGRRPRPRPRPTPSFPQPDEPAEPTDLPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MRSPLCWLLPLLILASVAQGQPTRRPRPGTGPGRRPRPRPRPTPSFPQPDEPAEPTDLPP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 PLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIPPRIHYLYLQNNFITELPVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIPPRIHYLYLQNNFITELPVE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 SFQNATGLRWINLDNNRIRKIDQRVLEKLPGLVFLYMEKNQLEEVPSALPRNLEQLRLSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SFQNATGLRWINLDNNRIRKIDQRVLEKLPGLVFLYMEKNQLEEVPSALPRNLEQLRLSQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 NHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGLKNLMQLNLAHNILRKMPPRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGLKNLMQLNLAHNILRKMPPRV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 PTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTDRGLPKNSFNISNLLVLHLSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTDRGLPKNSFNISNLLVLHLSH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 NRISSVPAINNRLEHLYLNNNSIEKINGTQICPNDLVAFHDFSSDLENVPHLRYLRLDGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NRISSVPAINNRLEHLYLNNNSIEKINGTQICPNDLVAFHDFSSDLENVPHLRYLRLDGN 310 320 330 340 350 360 370 380 pF1KB3 YLKPPIPLDLMMCFRLLQSVVI :::::::::::::::::::::: CCDS14 YLKPPIPLDLMMCFRLLQSVVI 370 380 >>CCDS9037.1 KERA gene_id:11081|Hs108|chr12 (352 aa) initn: 1419 init1: 740 opt: 1247 Z-score: 681.5 bits: 134.7 E(32554): 1.2e-31 Smith-Waterman score: 1247; 57.3% identity (84.8% similar) in 316 aa overlap (72-382:41-352) 50 60 70 80 90 100 pF1KB3 PTPSFPQPDEPAEPTDLPPPLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIP .:: ::.:::.::.::::..:.:...:.:: CCDS90 VLFITDTVWSRSVRQVYEVHDSDDWTIHDFECPMECFCPPSFPTALYCENRGLKEIPAIP 20 30 40 50 60 70 110 120 130 140 150 pF1KB3 PRIHYLYLQNNFITELPVESFQNATGLRWINLDNNRIRK--IDQRVLEKLPGLVFLYMEK :: :::::::.: .: . :.::: ::::::..:.: . :.. .: .: :.::..: CCDS90 SRIWYLYLQNNLIETIPEKPFENATQLRWINLNKNKITNYGIEKGALSQLKKLLFLFLED 80 90 100 110 120 130 160 170 180 190 200 210 pF1KB3 NQLEEVPSALPRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHG :.:::::: :::.::::.:..:..:::: :.::.:::: :::::.:.: :..:. :::.: CCDS90 NELEEVPSPLPRSLEQLQLARNKVSRIPQGTFSNLENLTLLDLQNNKLVDNAFQRDTFKG 140 150 160 170 180 190 220 230 240 250 260 270 pF1KB3 LKNLMQLNLAHNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLT ::::::::.:.: ::.::::.:. ::.::.:.:: ::..::. .:..::.:::.:::. CCDS90 LKNLMQLNMAKNALRNMPPRLPANTMQLFLDNNSIEGIPENYFNVIPKVAFLRLNHNKLS 200 210 220 230 240 250 280 290 300 310 320 330 pF1KB3 DRGLPKNSFNISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGTQICPND--LV :.:::. .:..:..: :.::::....:: :. .:.::.:..:.:...: . :::. : CCDS90 DEGLPSRGFDVSSILDLQLSHNQLTKVPRISAHLQHLHLDHNKIKSVNVSVICPSPSMLP 260 270 280 290 300 310 340 350 360 370 380 pF1KB3 AFHD-FSSDLENVPHLRYLRLDGNYLKPPIPLDLMMCFRLLQSVVI : .: :: ::::::::::: .:::::. :: ::::::.:.: CCDS90 AERDSFSYG----PHLRYLRLDGNEIKPPIPMALMTCFRLLQAVII 320 330 340 350 >>CCDS30976.1 FMOD gene_id:2331|Hs108|chr1 (376 aa) initn: 966 init1: 360 opt: 858 Z-score: 476.3 bits: 96.8 E(32554): 3.3e-20 Smith-Waterman score: 905; 40.2% identity (68.6% similar) in 388 aa overlap (7-382:3-376) 10 20 30 40 50 pF1KB3 MRSPLCW--LLPLLILASVAQGQPTRRPRPGTGPGRRPRPRPRPTPSFPQPDEPAEP--- : :: : : :..:.: :. : . : : : : :: CCDS30 MQWTSLLLLAGLFSLSQAQYEDDPHWWFHY-LRSQQSTYYDPYDPYPYETYEPYPY 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 -TDLPPPLPPGPPSIFPD---CPRECYCPPDFPSALYCDSRNLRKVPVIPPRIHYLYLQN .: : : :: :: ::.:: :::.::.:.:::.:::. .: .: :..:.:.:: CCDS30 GVDEGPAYTYGSPSP-PDPRDCPQECDCPPNFPTAMYCDNRNLKYLPFVPSRMKYVYFQN 60 70 80 90 100 110 120 130 140 150 160 pF1KB3 NFITELPVESFQNATGLRWINLDNNRIR--KIDQRVLEKLPGLVFLYMEKNQLEEVPSAL : :: . :.::::: :: : .:.: :. ..:. :: : ::...:.: ..:. : CCDS30 NQITSIQEGVFDNATGLLWIALHGNQITSDKVGRKVFSKLRHLERLYLDHNNLTRMPGPL 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 PRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGLKNLMQLNLA ::.:..:.:..:.:::.: ... :::: : ::::.... ....::..:. :.:. CCDS30 PRSLRELHLDHNQISRVPNNALEGLENLTALYLQHNEIQE---VGSSMRGLRSLILLDLS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB3 HNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTDRGLPKNSFN .: :::.: .:.:..:::.. :.. :.:..::.. :.: ..::..:.::. :: .:.:: CCDS30 YNHLRKVPDGLPSALEQLYMEHNNVYTVPDSYFRGAPKLLYVRLSHNSLTNNGLASNTFN 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB3 ISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGTQICPNDLVAFHDFSSDLENV :.:: : ::.:.....: .:. ::.:::..: :.... ...: .: :. : CCDS30 SSSLLELDLSYNQLQKIPPVNTNLENLYLQGNRINEFSISSFCT--VV-------DVVNF 300 310 320 330 340 350 360 370 380 pF1KB3 PHLRYLRLDGNYLK-PPIPLDLMMCFRLLQSVVI .:. :::::: .: .: : .:.:: . . : CCDS30 SKLQVLRLDGNEIKRSAMPADAPLCLRLASLIEI 350 360 370 >>CCDS6696.1 OMD gene_id:4958|Hs108|chr9 (421 aa) initn: 877 init1: 391 opt: 780 Z-score: 434.7 bits: 89.3 E(32554): 6.9e-18 Smith-Waterman score: 835; 43.1% identity (71.4% similar) in 311 aa overlap (73-380:62-360) 50 60 70 80 90 100 pF1KB3 TPSFPQPDEPAEPTDLPPPLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIPP : ::.:: .:::..:::.:.:. .: :: CCDS66 DQEPDDDYQTGFPFRQNVDYGVPFHQYTLGCVSECFCPTNFPSSMYCDNRKLKTIPNIPM 40 50 60 70 80 90 110 120 130 140 150 160 pF1KB3 RIHYLYLQNNFITELPVESFQNATGLRWINLDNNRIR--KIDQRVLEKLPGLVFLYMEKN .:. :::: : : . ..:: ::: :. :::..:.:. ::: :. :::.:. :..:.: CCDS66 HIQQLYLQFNEIEAVTANSFINATHLKEINLSHNKIKSQKIDYGVFAKLPNLLQLHLEHN 100 110 120 130 140 150 170 180 190 200 210 220 pF1KB3 QLEEVPSALPRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGL .::: : ::..::.: :. :.::.. .... : :: .::: .: : :...: : . CCDS66 NLEEFPFPLPKSLERLLLGYNEISKLQTNAMDGLVNLTMLDLCYNYLHDSLLKDKIFAKM 160 170 180 190 200 210 230 240 250 260 270 280 pF1KB3 KNLMQLNLAHNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTD ..:::::: : :..::: .:... : :..:.: .::. :: ..:.: .:...::: : CCDS66 EKLMQLNLCSNRLESMPPGLPSSLMYLSLENNSISSIPEKYFDKLPKLHTLRMSHNKLQD 220 230 240 250 260 270 290 300 310 320 330 pF1KB3 RGLPKNSFNISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGTQICPN-DLVAF .: : ::. :.. : ..::..... : ::::::.:: :::.: : .::. : . . CCDS66 --IPYNIFNLPNIVELSVGHNKLKQAFYIPRNLEHLYLQNNEIEKMNLTVMCPSIDPLHY 280 290 300 310 320 340 350 360 370 380 pF1KB3 HDFSSDLENVPHLRYLRLDGNYLKPPIPLDLMMCFRLLQSVVI : :: :.:.: : :: :: ...:: .... CCDS66 H----------HLTYIRVDQNKLKEPISSYIFFCFPHIHTIYYGEQRSTNGQTIQLKTQV 330 340 350 360 370 CCDS66 FRRFPDDDDESEDHDDPDNAHESPEQEGAEGHFDLHYYENQE 380 390 400 410 420 >>CCDS9038.1 LUM gene_id:4060|Hs108|chr12 (338 aa) initn: 719 init1: 344 opt: 775 Z-score: 433.2 bits: 88.7 E(32554): 8.3e-18 Smith-Waterman score: 805; 39.8% identity (72.8% similar) in 324 aa overlap (66-382:26-337) 40 50 60 70 80 90 pF1KB3 PRPRPRPTPSFPQPDEPAEPTDLPPPLPPGPPSIF----PDCPRECYCPPDFPSALYCDS : ::. :.: :: :: ..:::.::: CCDS90 MSLSAFTLFLALIGGTSGQYYDYDFPLSIYGQSSPNCAPECNCPESYPSAMYCDE 10 20 30 40 50 100 110 120 130 140 pF1KB3 RNLRKVPVIPPRIHYLYLQNNFITELPVESFQNATGLRWINLDNNRIR--KIDQRVLEKL .:..::..:: :.::::.:: : .. ..:.:.: :.:. ::.: .. :: ::. :: CCDS90 LKLKSVPMVPPGIKYLYLRNNQIDHIDEKAFENVTDLQWLILDHNLLENSKIKGRVFSKL 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB3 PGLVFLYMEKNQLEEVPSALPRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSD : :....:.: : . ::..::.:.:..:.:... : : : :: .. ::::::.. CCDS90 KQLKKLHINHNNLTESVGPLPKSLEDLQLTHNKITKL--GSFEGLVNLTFIHLQHNRLKE 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB3 GVFKPDTFHGLKNLMQLNLAHNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLA . . .:.:::.: :.:. : . ..: .:... ::::.::: .::. ::: : : CCDS90 DAVSA-AFKGLKSLEYLDLSFNQIARLPSGLPVSLLTLYLDNNKISNIPDEYFKRFNALQ 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB3 FIRLNYNKLTDRGLPKNSFNISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGT ..::..:.:.: :.: ::::.:.:. : ::.:.....:..:. ::. ::. :..::.. CCDS90 YLRLSHNELADSGIPGNSFNVSSLVELDLSYNKLKNIPTVNENLENYYLEVNQLEKFDIK 240 250 260 270 280 290 330 340 350 360 370 380 pF1KB3 QICPNDLVAFHDFSSDLENVPHLRYLRLDGNYL-KPPIPLDLMMCFRLLQSVVI ..: ... ..:. ...:::::: . . .: :.. :.:. . :.. CCDS90 SFC--KILGPLSYSK-------IKHLRLDGNRISETSLPPDMYECLRVANEVTLN 300 310 320 330 382 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 02:42:04 2016 done: Fri Nov 4 02:42:04 2016 Total Scan time: 2.210 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]