FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1439, 509 aa
1>>>pF1KSDA1439 509 - 509 aa - 509 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.6817+/-0.000996; mu= -8.6907+/- 0.060
mean_var=401.6174+/-80.506, 0's: 0 Z-trim(116.4): 22 B-trim: 0 in 0/54
Lambda= 0.063998
statistics sampled from 16987 (17003) to 16987 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.813), E-opt: 0.2 (0.522), width: 16
Scan time: 3.340
The best scores are: opt bits E(32554)
CCDS44156.1 NFIA gene_id:4774|Hs108|chr1 ( 509) 3501 337.1 2.8e-92
CCDS53322.1 NFIA gene_id:4774|Hs108|chr1 ( 554) 3501 337.1 3e-92
CCDS53321.1 NFIA gene_id:4774|Hs108|chr1 ( 501) 3436 331.1 1.8e-90
CCDS615.1 NFIA gene_id:4774|Hs108|chr1 ( 498) 3256 314.5 1.8e-85
CCDS45996.1 NFIX gene_id:4784|Hs108|chr19 ( 441) 2041 202.2 9.7e-52
CCDS59330.1 NFIC gene_id:4782|Hs108|chr19 ( 508) 1988 197.4 3.2e-50
CCDS59359.1 NFIX gene_id:4784|Hs108|chr19 ( 433) 1982 196.8 4.2e-50
CCDS45914.1 NFIC gene_id:4782|Hs108|chr19 ( 499) 1935 192.5 9.4e-49
CCDS55291.1 NFIB gene_id:4781|Hs108|chr9 ( 494) 1857 185.3 1.4e-46
CCDS6474.1 NFIB gene_id:4781|Hs108|chr9 ( 420) 1705 171.2 2e-42
CCDS12107.1 NFIC gene_id:4782|Hs108|chr19 ( 428) 1700 170.7 2.9e-42
CCDS59331.1 NFIC gene_id:4782|Hs108|chr19 ( 439) 1700 170.7 2.9e-42
CCDS55292.1 NFIB gene_id:4781|Hs108|chr9 ( 446) 1652 166.3 6.4e-41
CCDS58640.1 NFIC gene_id:4782|Hs108|chr19 ( 430) 1647 165.8 8.5e-41
>>CCDS44156.1 NFIA gene_id:4774|Hs108|chr1 (509 aa)
initn: 3501 init1: 3501 opt: 3501 Z-score: 1770.0 bits: 337.1 E(32554): 2.8e-92
Smith-Waterman score: 3501; 100.0% identity (100.0% similar) in 509 aa overlap (1-509:1-509)
10 20 30 40 50 60
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD GPNFSLSDLESSSYYSMSPGAMRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQGRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GPNFSLSDLESSSYYSMSPGAMRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQGRS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD PGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGPRAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGPRAS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD PHATPSTLHFPTSPIIQQPGPYFSHPAIRYHPQETLKEFVQLVCPDAGQQAGQVGFLNPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PHATPSTLHFPTSPIIQQPGPYFSHPAIRYHPQETLKEFVQLVCPDAGQQAGQVGFLNPN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD GSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPTYSTPST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPTYSTPST
430 440 450 460 470 480
490 500
pF1KSD SPANRFVSVGPRDPSFVNIPQQTQSWYLG
:::::::::::::::::::::::::::::
CCDS44 SPANRFVSVGPRDPSFVNIPQQTQSWYLG
490 500
>>CCDS53322.1 NFIA gene_id:4774|Hs108|chr1 (554 aa)
initn: 3501 init1: 3501 opt: 3501 Z-score: 1769.5 bits: 337.1 E(32554): 3e-92
Smith-Waterman score: 3501; 100.0% identity (100.0% similar) in 509 aa overlap (1-509:46-554)
10 20 30
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTW
::::::::::::::::::::::::::::::
CCDS53 TRWPGGCGATWQSCPSPPPRRTRIPQRPAVMYSPLCLTQDEFHPFIEALLPHVRAFAYTW
20 30 40 50 60 70
40 50 60 70 80 90
pF1KSD FNLQARKRKYFKKHEKRMSKEEERAVKDELLSEKPEVKQKWASRLLAKLRKDIRPEYRED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FNLQARKRKYFKKHEKRMSKEEERAVKDELLSEKPEVKQKWASRLLAKLRKDIRPEYRED
80 90 100 110 120 130
100 110 120 130 140 150
pF1KSD FVLTVTGKKPPCCVLSNPDQKGKMRRIDCLRQADKVWRLDLVMVILFKGIPLESTDGERL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FVLTVTGKKPPCCVLSNPDQKGKMRRIDCLRQADKVWRLDLVMVILFKGIPLESTDGERL
140 150 160 170 180 190
160 170 180 190 200 210
pF1KSD VKSPQCSNPGLCVQPHHIGVSVKELDLYLAYFVHAADSSQSESPSQPSDADIKDQPENGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VKSPQCSNPGLCVQPHHIGVSVKELDLYLAYFVHAADSSQSESPSQPSDADIKDQPENGH
200 210 220 230 240 250
220 230 240 250 260 270
pF1KSD LGFQDSFVTSGVFSVTELVRVSQTPIAAGTGPNFSLSDLESSSYYSMSPGAMRRSLPSTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LGFQDSFVTSGVFSVTELVRVSQTPIAAGTGPNFSLSDLESSSYYSMSPGAMRRSLPSTS
260 270 280 290 300 310
280 290 300 310 320 330
pF1KSD STSSTKRLKSVEDEMDSPGEEPFYTGQGRSPGSGSQSSGWHEVEPGMPSPTTLKKSEKSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 STSSTKRLKSVEDEMDSPGEEPFYTGQGRSPGSGSQSSGWHEVEPGMPSPTTLKKSEKSG
320 330 340 350 360 370
340 350 360 370 380 390
pF1KSD FSSPSPSQTSSLGTAFTQHHRPVITGPRASPHATPSTLHFPTSPIIQQPGPYFSHPAIRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FSSPSPSQTSSLGTAFTQHHRPVITGPRASPHATPSTLHFPTSPIIQQPGPYFSHPAIRY
380 390 400 410 420 430
400 410 420 430 440 450
pF1KSD HPQETLKEFVQLVCPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 HPQETLKEFVQLVCPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVP
440 450 460 470 480 490
460 470 480 490 500
pF1KSD LPVPDTKPPTTSTEGGAASPTSPTYSTPSTSPANRFVSVGPRDPSFVNIPQQTQSWYLG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LPVPDTKPPTTSTEGGAASPTSPTYSTPSTSPANRFVSVGPRDPSFVNIPQQTQSWYLG
500 510 520 530 540 550
>>CCDS53321.1 NFIA gene_id:4774|Hs108|chr1 (501 aa)
initn: 3436 init1: 3436 opt: 3436 Z-score: 1737.7 bits: 331.1 E(32554): 1.8e-90
Smith-Waterman score: 3436; 100.0% identity (100.0% similar) in 500 aa overlap (10-509:2-501)
10 20 30 40 50 60
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
10 20 30 40 50
70 80 90 100 110 120
pF1KSD LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KSD YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
180 190 200 210 220 230
250 260 270 280 290 300
pF1KSD GPNFSLSDLESSSYYSMSPGAMRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQGRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GPNFSLSDLESSSYYSMSPGAMRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQGRS
240 250 260 270 280 290
310 320 330 340 350 360
pF1KSD PGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGPRAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGPRAS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KSD PHATPSTLHFPTSPIIQQPGPYFSHPAIRYHPQETLKEFVQLVCPDAGQQAGQVGFLNPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PHATPSTLHFPTSPIIQQPGPYFSHPAIRYHPQETLKEFVQLVCPDAGQQAGQVGFLNPN
360 370 380 390 400 410
430 440 450 460 470 480
pF1KSD GSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPTYSTPST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPTYSTPST
420 430 440 450 460 470
490 500
pF1KSD SPANRFVSVGPRDPSFVNIPQQTQSWYLG
:::::::::::::::::::::::::::::
CCDS53 SPANRFVSVGPRDPSFVNIPQQTQSWYLG
480 490 500
>>CCDS615.1 NFIA gene_id:4774|Hs108|chr1 (498 aa)
initn: 3256 init1: 3256 opt: 3256 Z-score: 1647.9 bits: 314.5 E(32554): 1.8e-85
Smith-Waterman score: 3256; 96.6% identity (97.0% similar) in 494 aa overlap (1-494:1-494)
10 20 30 40 50 60
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD GPNFSLSDLESSSYYSMSPGAMRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQGRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 GPNFSLSDLESSSYYSMSPGAMRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQGRS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD PGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGPRAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGPRAS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD PHATPSTLHFPTSPIIQQPGPYFSHPAIRYHPQETLKEFVQLVCPDAGQQAGQVGFLNPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PHATPSTLHFPTSPIIQQPGPYFSHPAIRYHPQETLKEFVQLVCPDAGQQAGQVGFLNPN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD GSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPTYSTPST
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 GSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPILVPGIK
430 440 450 460 470 480
490 500
pF1KSD SPANRFVSVGPRDPSFVNIPQQTQSWYLG
:.. : ::
CCDS61 VAASHHPPDRPPDPFSTL
490
>>CCDS45996.1 NFIX gene_id:4784|Hs108|chr19 (441 aa)
initn: 1732 init1: 1361 opt: 2041 Z-score: 1042.4 bits: 202.2 E(32554): 9.7e-52
Smith-Waterman score: 2041; 70.7% identity (84.2% similar) in 450 aa overlap (1-441:1-436)
10 20 30 40 50 60
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
:::: :::::::::::::::::::::.:::::::::::::::::::::::.:::::::::
CCDS45 MYSPYCLTQDEFHPFIEALLPHVRAFSYTWFNLQARKRKYFKKHEKRMSKDEERAVKDEL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
:.::::.:::::::::::::::::::.:::::::.::::::::::::::::::.::::::
CCDS45 LGEKPEIKQKWASRLLAKLRKDIRPEFREDFVLTITGKKPPCCVLSNPDQKGKIRRIDCL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
:::::::::::::::::::::::::::::: :::::::::::::::::::..::::::::
CCDS45 RQADKVWRLDLVMVILFKGIPLESTDGERLYKSPQCSNPGLCVQPHHIGVTIKELDLYLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
::::. .:.::.: .: .::::: : ::::.::: ::::::..:::::::::::.:...
CCDS45 YFVHTPESGQSDSSNQQGDADIKPLP-NGHLSFQDCFVTSGVWNVTELVRVSQTPVATAS
190 200 210 220 230
250 260 270 280 290
pF1KSD GPNFSLSDLESSSYYSMSPGAM-RRSLPSTSSTSSTKRLKSVED-EMDSPGEEPFYTGQG
::::::.:::: :::... .. :::. : :::.::: ::..: ::.:: .. :: : :
CCDS45 GPNFSLADLESPSYYNINQVTLGRRSITSPPSTSTTKRPKSIDDSEMESPVDDVFYPGTG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD RSPGSGS-QSSGW-HEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITG
:::..:: ::::: ..:. : :..:::: : : : :: :: :::.: ::..:
CCDS45 RSPAAGSSQSSGWPNDVDAG---PASLKKSGKLDFCSALSSQGSSPRMAFTHHPLPVLAG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD PR-ASPHATPSTLHFPTSPIIQQPGPYFSHPAIRYHP---QETLKEFVQLVCPD-AGQQA
: .::.:: :.::::.. :::: .:::.::.:::: :..::::::.:: : .:: .
CCDS45 VRPGSPRATASALHFPSTSIIQQSSPYFTHPTIRYHHHHGQDSLKEFVQFVCSDGSGQAT
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD GQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPT
:: :: .. : ::: . :
CCDS45 GQ--------HSQRQA--PPLPTGLSASDPGTATF
420 430 440
>>CCDS59330.1 NFIC gene_id:4782|Hs108|chr19 (508 aa)
initn: 1657 init1: 1187 opt: 1988 Z-score: 1015.1 bits: 197.4 E(32554): 3.2e-50
Smith-Waterman score: 2040; 64.2% identity (79.6% similar) in 530 aa overlap (1-509:1-508)
10 20 30 40 50
pF1KSD MYS-PLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDE
::: :::::::::::::::::::::::::::::::::::::::::::::::.::::::::
CCDS59 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD LLSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDC
::.:::::::::::::::::::::::: ::::::..:::: : :::::::::::::::::
CCDS59 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD LRQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYL
:::::::::::::::::::::::::::::::::. ::..: ::::::::::.::::::::
CCDS59 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KSD AYFVHAADSSQSESPSQPSDADIKD-QPEN-GHLGFQDSFVTSGVFSVTELVRVSQTPIA
::::. :. :: :: .: .: .: . ::.:::::::::::::..::.::..
CCDS59 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV
190 200 210 220 230 240
240 250 260 270 280 290
pF1KSD AGTGPNFSLSDLESSSYYSMSPGA--MRRSLPSTSSTSSTKRLKS--VEDEMD-SPGEEP
.::::::::..:.. :...:.. .::.:::::: :..:: :: .:...: ::: .
CCDS59 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSS-SGSKRHKSGSMEEDVDTSPGGD-
250 260 270 280 290
300 310 320 330 340 350
pF1KSD FYTGQGRSPGSGSQSS-GWHE-VEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHH
.:: ::.: ..:: .: : .: :. ::. . .:: :.::::... : ..:::::
CCDS59 YYT----SPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRL-SSFTQHH
300 310 320 330 340 350
360 370 380 390 400
pF1KSD RPVI---TGPRASPHATPSTLHFPTSPIIQQPGP-YFSHPAIRY----HPQETLKEFVQL
:::: .: ::: . :.:::::. :. : . :: : :::: .::. ::..:.:
CCDS59 RPVIAVHSGIARSPHPS-SALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSL
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD VCPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPP--PPMARPVPLPVPDTKPPT
.: :.:: : . :::.: :. . : . :: :::: : .: : : ::: :
CCDS59 ACDPASQQPGPL-----NGSGQLKMPSHCLSAQMLAPPPPGLPRLALP-----PATKPAT
420 430 440 450 460
470 480 490 500
pF1KSD TSTEGGAASPTSPTYSTPSTSPANR-FVSVGPRDPSFVNIPQQTQSWYLG
:: ::::.:::::.:: :.:::::: ::..:::::. . :.::::::
CCDS59 TS-EGGATSPTSPSYSPPDTSPANRSFVGLGPRDPAGI---YQAQSWYLG
470 480 490 500
>>CCDS59359.1 NFIX gene_id:4784|Hs108|chr19 (433 aa)
initn: 1673 init1: 1302 opt: 1982 Z-score: 1013.0 bits: 196.8 E(32554): 4.2e-50
Smith-Waterman score: 1982; 69.8% identity (84.1% similar) in 441 aa overlap (10-441:2-428)
10 20 30 40 50 60
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
:::::::::::::::::.:::::::::::::::::::::::.:::::::::
CCDS59 MDEFHPFIEALLPHVRAFSYTWFNLQARKRKYFKKHEKRMSKDEERAVKDEL
10 20 30 40 50
70 80 90 100 110 120
pF1KSD LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
:.::::.:::::::::::::::::::.:::::::.::::::::::::::::::.::::::
CCDS59 LGEKPEIKQKWASRLLAKLRKDIRPEFREDFVLTITGKKPPCCVLSNPDQKGKIRRIDCL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
:::::::::::::::::::::::::::::: :::::::::::::::::::..::::::::
CCDS59 RQADKVWRLDLVMVILFKGIPLESTDGERLYKSPQCSNPGLCVQPHHIGVTIKELDLYLA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KSD YFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAGT
::::. .:.::.: .: .::::: : ::::.::: ::::::..:::::::::::.:...
CCDS59 YFVHTPESGQSDSSNQQGDADIKPLP-NGHLSFQDCFVTSGVWNVTELVRVSQTPVATAS
180 190 200 210 220 230
250 260 270 280 290
pF1KSD GPNFSLSDLESSSYYSMSPGAM-RRSLPSTSSTSSTKRLKSVED-EMDSPGEEPFYTGQG
::::::.:::: :::... .. :::. : :::.::: ::..: ::.:: .. :: : :
CCDS59 GPNFSLADLESPSYYNINQVTLGRRSITSPPSTSTTKRPKSIDDSEMESPVDDVFYPGTG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD RSPGSGS-QSSGW-HEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITG
:::..:: ::::: ..:. : :..:::: : : : :: :: :::.: ::..:
CCDS59 RSPAAGSSQSSGWPNDVDAG---PASLKKSGKLDFCSALSSQGSSPRMAFTHHPLPVLAG
300 310 320 330 340
360 370 380 390 400 410
pF1KSD PR-ASPHATPSTLHFPTSPIIQQPGPYFSHPAIRYHP---QETLKEFVQLVCPD-AGQQA
: .::.:: :.::::.. :::: .:::.::.:::: :..::::::.:: : .:: .
CCDS59 VRPGSPRATASALHFPSTSIIQQSSPYFTHPTIRYHHHHGQDSLKEFVQFVCSDGSGQAT
350 360 370 380 390 400
420 430 440 450 460 470
pF1KSD GQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPT
:: ... . : ::: . :
CCDS59 GQ----------HSQRQAPPLPTGLSASDPGTATF
410 420 430
>>CCDS45914.1 NFIC gene_id:4782|Hs108|chr19 (499 aa)
initn: 1607 init1: 1137 opt: 1935 Z-score: 988.7 bits: 192.5 E(32554): 9.4e-49
Smith-Waterman score: 1987; 63.7% identity (79.4% similar) in 520 aa overlap (10-509:2-499)
10 20 30 40 50 60
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDEL
:::::::::::::::::::::::::::::::::::::::::.:::::::::
CCDS45 MDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDEL
10 20 30 40 50
70 80 90 100 110 120
pF1KSD LSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDCL
:.:::::::::::::::::::::::: ::::::..:::: : ::::::::::::::::::
CCDS45 LGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDCL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD RQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYLA
::::::::::::::::::::::::::::::::. ::..: ::::::::::.:::::::::
CCDS45 RQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYLA
120 130 140 150 160 170
190 200 210 220 230
pF1KSD YFVHAADSSQSESPSQPSDADIKD-QPEN-GHLGFQDSFVTSGVFSVTELVRVSQTPIAA
:::. :. :: :: .: .: .: . ::.:::::::::::::..::.::...
CCDS45 YFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVVT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD GTGPNFSLSDLESSSYYSMSPGA--MRRSLPSTSSTSSTKRLKS--VEDEMD-SPGEEPF
::::::::..:.. :...:.. .::.::::::..: :: :: .:...: ::: . .
CCDS45 GTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGS-KRHKSGSMEEDVDTSPGGD-Y
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD YTGQGRSPGSGSQSS-GWHE-VEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHR
:: ::.: ..:: .: : .: :. ::. . .:: :.::::... : ..::::::
CCDS45 YT----SPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRL-SSFTQHHR
300 310 320 330 340
360 370 380 390 400
pF1KSD PVI---TGPRASPHATPSTLHFPTSPIIQQPGP-YFSHPAIRY----HPQETLKEFVQLV
::: .: ::: . :.:::::. :. : . :: : :::: .::. ::..:.:.
CCDS45 PVIAVHSGIARSPHPS-SALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLA
350 360 370 380 390 400
410 420 430 440 450 460
pF1KSD CPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPP--PPMARPVPLPVPDTKPPTT
: :.:: : . :::.: :. . : . :: :::: : .: : : ::: ::
CCDS45 CDPASQQPGPL-----NGSGQLKMPSHCLSAQMLAPPPPGLPRLALP-----PATKPATT
410 420 430 440 450
470 480 490 500
pF1KSD STEGGAASPTSPTYSTPSTSPANR-FVSVGPRDPSFVNIPQQTQSWYLG
: ::::.:::::.:: :.:::::: ::..:::::. . :.::::::
CCDS45 S-EGGATSPTSPSYSPPDTSPANRSFVGLGPRDPAGI---YQAQSWYLG
460 470 480 490
>>CCDS55291.1 NFIB gene_id:4781|Hs108|chr9 (494 aa)
initn: 1626 init1: 1219 opt: 1857 Z-score: 949.9 bits: 185.3 E(32554): 1.4e-46
Smith-Waterman score: 1944; 61.6% identity (77.2% similar) in 523 aa overlap (1-509:2-494)
10 20 30 40 50
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDE
::::.::::::::::::::::::::.::::::::::::::::::::::::.::::::::
CCDS55 MMYSPICLTQDEFHPFIEALLPHVRAIAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD LLSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDC
:::::::.::::::::::::::::: :::::::::::::: :::::::::::::.:::::
CCDS55 LLSEKPEIKQKWASRLLAKLRKDIRQEYREDFVLTVTGKKHPCCVLSNPDQKGKIRRIDC
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD LRQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYL
:::::::::::::::::::::::::::::::.:::.:.::.:::::::: ::::::::.:
CCDS55 LRQADKVWRLDLVMVILFKGIPLESTDGERLMKSPHCTNPALCVQPHHITVSVKELDLFL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KSD AYFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAG
::.:. ::.:: :::. . : :. : :.: .:::: ::::.:.::::::.:::. :
CCDS55 AYYVQEQDSGQSGSPSHNDPA--KNPP--GYL--EDSFVKSGVFNVSELVRVSRTPITQG
190 200 210 220 230
240 250 260 270 280 290
pF1KSD TGPNFSLSDLESSSYY-SMSPGA-MRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQ
:: :: .... :. :: .:. :. ..::: : :.. : . :....:. :: .
CCDS55 TGVNFPIGEIPSQPYYHDMNSGVNLQRSLSSPPSSKRPKTI-SIDENMEPSPTGDFYPSP
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD GRSPGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGP
. ::..::.. ::: . : ::::.:: :: ::: ::...: ..: :::.: : :
CCDS55 S-SPAAGSRT--WHERDQDMSSPTTMKKPEKPLFSSASPQDSSPRLSTFPQHHHPGIPGV
300 310 320 330 340 350
360 370 380 390 400
pF1KSD RASPHAT-----PSTLHFPTSPIIQQ-PGPYFSHPAIRY----HPQETLKEFVQLVCPDA
: .: :: : :::. :. :. :::::.::: .::.:::..: :..
CCDS55 AHSVISTRTPPPPSPLPFPTQAILPPAPSSYFSHPTIRYPPHLNPQDTLKNYVPSYDPSS
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD GQQAGQVGFLNPNGSSQ--GKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEG
: . .::::.: ::: . : ::.: : : : .::: : . :::: :::::.
CCDS55 PQTS------QPNGSGQVVGKVPGHF--TPVLAPSPHPSAVRPVTLSMTDTKPITTSTEA
420 430 440 450 460
470 480 490 500
pF1KSD GAASPTSPTYSTPSTSPANRFVSVGPRDPSFVNIPQQTQSWYLG
:.. .:: :::.:...::::::.. : ::::::
CCDS55 ---------YTASGTSQANRYVGLSPRDPSFLH---QQQSWYLG
470 480 490
>>CCDS6474.1 NFIB gene_id:4781|Hs108|chr9 (420 aa)
initn: 1507 init1: 1219 opt: 1705 Z-score: 875.0 bits: 171.2 E(32554): 2e-42
Smith-Waterman score: 1705; 65.1% identity (80.5% similar) in 421 aa overlap (1-409:2-412)
10 20 30 40 50
pF1KSD MYSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDE
::::.::::::::::::::::::::.::::::::::::::::::::::::.::::::::
CCDS64 MMYSPICLTQDEFHPFIEALLPHVRAIAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD LLSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDC
:::::::.::::::::::::::::: :::::::::::::: :::::::::::::.:::::
CCDS64 LLSEKPEIKQKWASRLLAKLRKDIRQEYREDFVLTVTGKKHPCCVLSNPDQKGKIRRIDC
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD LRQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYL
:::::::::::::::::::::::::::::::.:::.:.::.:::::::: ::::::::.:
CCDS64 LRQADKVWRLDLVMVILFKGIPLESTDGERLMKSPHCTNPALCVQPHHITVSVKELDLFL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KSD AYFVHAADSSQSESPSQPSDADIKDQPENGHLGFQDSFVTSGVFSVTELVRVSQTPIAAG
::.:. ::.:: :::. . : :. : :.: .:::: ::::.:.::::::.:::. :
CCDS64 AYYVQEQDSGQSGSPSHNDPA--KNPP--GYL--EDSFVKSGVFNVSELVRVSRTPITQG
190 200 210 220 230
240 250 260 270 280 290
pF1KSD TGPNFSLSDLESSSYY-SMSPGA-MRRSLPSTSSTSSTKRLKSVEDEMDSPGEEPFYTGQ
:: :: .... :. :: .:. :. ..::: : :.. : . :....:. :: .
CCDS64 TGVNFPIGEIPSQPYYHDMNSGVNLQRSLSSPPSSKRPKTI-SIDENMEPSPTGDFYPSP
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD GRSPGSGSQSSGWHEVEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVITGP
. ::..::.. ::: . : ::::.:: :: ::: ::...: ..: :::.: : :
CCDS64 S-SPAAGSRT--WHERDQDMSSPTTMKKPEKPLFSSASPQDSSPRLSTFPQHHHPGIPGV
300 310 320 330 340 350
360 370 380 390 400
pF1KSD RASPHAT-----PSTLHFPTSPIIQQ-PGPYFSHPAIRY----HPQETLKEFVQLVCPDA
: .: :: : :::. :. :. :::::.::: .::.:::..: :..
CCDS64 AHSVISTRTPPPPSPLPFPTQAILPPAPSSYFSHPTIRYPPHLNPQDTLKNYVPSYDPSS
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD GQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGA
:
CCDS64 PQTSQSWYLG
420
509 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:18:27 2016 done: Thu Nov 3 06:18:27 2016
Total Scan time: 3.340 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]