FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3810, 500 aa 1>>>pF1KB3810 500 - 500 aa - 500 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.2986+/-0.00119; mu= -1.0245+/- 0.069 mean_var=306.3465+/-69.252, 0's: 0 Z-trim(110.4): 783 B-trim: 0 in 0/51 Lambda= 0.073277 statistics sampled from 10701 (11606) to 10701 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.711), E-opt: 0.2 (0.357), width: 16 Scan time: 3.360 The best scores are: opt bits E(32554) CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 ( 500) 3399 373.6 2.8e-103 CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 ( 418) 2831 313.5 3e-85 CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 ( 496) 1458 168.4 1.7e-41 CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 463) 1293 150.9 2.8e-36 CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 411) 1029 122.9 6.5e-28 CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20 ( 299) 497 66.6 4.5e-11 CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20 ( 403) 497 66.7 5.5e-11 CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20 ( 422) 497 66.7 5.7e-11 CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20 ( 460) 497 66.8 6e-11 CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20 ( 573) 497 66.9 7e-11 CCDS68164.1 CTCFL gene_id:140690|Hs108|chr20 ( 627) 497 66.9 7.4e-11 CCDS13459.1 CTCFL gene_id:140690|Hs108|chr20 ( 663) 497 66.9 7.7e-11 CCDS58781.1 CTCFL gene_id:140690|Hs108|chr20 ( 665) 497 66.9 7.7e-11 CCDS58780.1 CTCFL gene_id:140690|Hs108|chr20 ( 700) 497 66.9 8e-11 >>CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 (500 aa) initn: 3399 init1: 3399 opt: 3399 Z-score: 1967.6 bits: 373.6 E(32554): 2.8e-103 Smith-Waterman score: 3399; 99.8% identity (100.0% similar) in 500 aa overlap (1-500:1-500) 10 20 30 40 50 60 pF1KB3 MATVIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MATVIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGER 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 PYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKET 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 FKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAGKSSGGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 FKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAGKSSGGV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 KEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 LKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPFTNTLQLNLYNTPFQSMQS :::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS61 LKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELLSKPFTNTLQLNLYNTPFQSMQS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 SGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 SGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESYL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPALDFSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPALDFSQ 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 LFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLHSLSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLHSLSA 430 440 450 460 470 480 490 500 pF1KB3 AFTSSLSTSTTLPRFHQAFQ :::::::::::::::::::: CCDS61 AFTSSLSTSTTLPRFHQAFQ 490 500 >>CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 (418 aa) initn: 2831 init1: 2831 opt: 2831 Z-score: 1644.0 bits: 313.5 E(32554): 3e-85 Smith-Waterman score: 2831; 99.8% identity (100.0% similar) in 418 aa overlap (83-500:1-418) 60 70 80 90 100 110 pF1KB3 SYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLH :::::::::::::::::::::::::::::: CCDS47 MATHSPEKTHKCNYCEKMFHRKDHLKNHLH 10 20 30 120 130 140 150 160 170 pF1KB3 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB3 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB3 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPFTNTLQLNLYN :::::::::::::::::::::::::::::::::::::::::::.:::::::::::::::: CCDS47 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELLSKPFTNTLQLNLYN 160 170 180 190 200 210 300 310 320 330 340 350 pF1KB3 TPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB3 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB3 TPALDFSQLFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TPALDFSQLFNFIPLNGPPYNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGL 340 350 360 370 380 390 480 490 500 pF1KB3 GSLHSLSAAFTSSLSTSTTLPRFHQAFQ :::::::::::::::::::::::::::: CCDS47 GSLHSLSAAFTSSLSTSTTLPRFHQAFQ 400 410 >>CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 (496 aa) initn: 1626 init1: 1238 opt: 1458 Z-score: 858.7 bits: 168.4 E(32554): 1.7e-41 Smith-Waterman score: 1715; 52.2% identity (75.2% similar) in 504 aa overlap (3-500:6-496) 10 20 30 40 50 pF1KB3 MATVIPGDLSEVRDTQKVPSG--KRKRG-ETKPRKNFPCQLCDKAFNSVEKLKVHSY : .: ...... ..: : :: :.. . . :.. :.. :::. :: CCDS13 MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 SHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTH . .:::.: : : :::.::::: ::::::: .: :.: ::.:::::::::.:::.:: CCDS13 PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 DPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG :::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.:. CCDS13 DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKK . .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::.:: CCDS13 RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 SHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLL-SKPFTNTLQLNLYNT ::.:::::.::::::.: ..:. .: .:.:: ::. . : :.. .: : . : ...:.. CCDS13 SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB3 PFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL . .: :.: :... .:::.::. :.. . . .: :: ..:::: .:.: : CCDS13 HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-LP- 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN : :..:.: :: :.. :: . : .: :: .. . :.:: ..:. : CCDS13 KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEALC 360 370 380 390 400 420 430 440 450 460 470 pF1KB3 TPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIG . .:::.:..:.::: :: :: ..:.: :.::: ::. .. : : :: .. .. CCDS13 AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLN 410 420 430 440 450 460 480 490 500 pF1KB3 LGSLHSLSAAFTSSLSTSTTLPRFHQAFQ .: :::: .:::.:: :::::::::::: CCDS13 FGPLHSLPPVFTSGLS-STTLPRFHQAFQ 470 480 490 >>CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 (463 aa) initn: 1221 init1: 751 opt: 1293 Z-score: 764.8 bits: 150.9 E(32554): 2.8e-36 Smith-Waterman score: 1306; 46.6% identity (68.9% similar) in 476 aa overlap (34-500:4-463) 10 20 30 40 50 60 pF1KB3 VIPGDLSEVRDTQKVPSGKRKRGETKPRKNFPCQLCDKAFNSVEKLKVHSYSHTGERPYK :::::: :.: ..::. .:.:::. ::::: CCDS52 MATFPCQLCGKTFLTLEKFTIHNYSHSRERPYK 10 20 30 70 80 90 100 110 120 pF1KB3 CIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTHDPNKETFKC :.: :: :::::.:::.::::::::.:.:.: .::: :.:::::::::.:::::: .: : CCDS52 CVQPDCGKAFVSRYKLMRHMATHSPQKSHQCAHCEKTFNRKDHLKNHLQTHDPNKMAFGC 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB3 EECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG-KSSGGVKE :::::.::: ::.:::::::::.:::::: :: . :: :::.:::.:: : .:.:: CCDS52 EECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAHAEEKPPSGTKE 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB3 KKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKKSHNQELLK :::::.::.: ::::::::::.::::: ::::::.:::::::::::::: ::.:.:::.: CCDS52 KKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRHTKKTHSQELMK 160 170 180 190 200 210 250 260 270 280 290 pF1KB3 VKTEPVDFLDPF-TCNVSVPIKDELLPVMSLPSS--DLLSKPFTNTLQLNLYNTPFQSMQ . . :.:. : : . : .: :: . : .: . :.. . .. . : :. : CCDS52 ESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHSLTLSPPEQAAQ 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB3 SSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPLKGEIESY . ...: ... : . :.: :: .::::. : :::.. ... CCDS52 PMQPLPESLASLHPSVS-PGSPPPPLPNH----KYNTTSTSYS---PLASLPLKADTKGF 280 290 300 310 320 360 370 380 390 400 410 pF1KB3 L-MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLNTPA-LD . : .: :. :. .. . :.: :. :: ..: : . . :. :: :: CCDS52 CNISLFEDLPL--QEPQSPQKLNPGFDLAKGN----AGKVNLPKELPADAVNLTIPASLD 330 340 350 360 370 420 430 440 450 460 470 pF1KB3 FSQLFNFIPLNGPP-YNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIGLGSLH .: :..: : : : .. ..:... .. : .: : : :. .:..::.: CCDS52 LSPLLGFWQLPPPATQNTFGNSTLALGPGESLPHR-LSCLGQQQQEPPLAMGTVSLGQLP 380 390 400 410 420 430 480 490 500 pF1KB3 --SLSAAFTSSLSTSTTLPRFHQAFQ . .:... . :. ::.::.::. CCDS52 LPPIPHVFSAG-TGSAILPHFHHAFR 440 450 460 >>CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 (411 aa) initn: 957 init1: 487 opt: 1029 Z-score: 614.6 bits: 122.9 E(32554): 6.5e-28 Smith-Waterman score: 1042; 44.3% identity (66.7% similar) in 427 aa overlap (83-500:1-411) 60 70 80 90 100 110 pF1KB3 SYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLH ::::::.:.:.: .::: :.:::::::::. CCDS52 MATHSPQKSHQCAHCEKTFNRKDHLKNHLQ 10 20 30 120 130 140 150 160 170 pF1KB3 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH :::::: .: ::::::.::: ::.:::::::::.:::::: :: . :: :::.:::.: CCDS52 THDPNKMAFGCEECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAH 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB3 AG-KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRH : : .:.:::::::.::.: ::::::::::.::::: ::::::.:::::::::::::: CCDS52 AEEKPPSGTKEKKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRH 100 110 120 130 140 150 240 250 260 270 280 pF1KB3 MKKSHNQELLKVKTEPVDFLDPF-TCNVSVPIKDELLPVMSLPSS--DLLSKPFTNTLQL ::.:.:::.: . . :.:. : : . : .: :: . : .: . :.. . .. CCDS52 TKKTHSQELMKESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHS 160 170 180 190 200 210 290 300 310 320 330 340 pF1KB3 NLYNTPFQSMQSSGSAHQMITTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEK . : :. : . ...: ... : . :.: :: .::::. : CCDS52 LTLSPPEQAAQPMQPLPESLASLHPSVS-PGSPPPPLPNH----KYNTTSTSYS---PLA 220 230 240 250 260 350 360 370 380 390 400 pF1KB3 EQPLKGEIESYL-MELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISI :::.. ... . : .: :. :. .. . :.: :. :: ..: : . CCDS52 SLPLKADTKGFCNISLFEDLPL--QEPQSPQKLNPGFDLAKGN----AGKVNLPKELPAD 270 280 290 300 310 410 420 430 440 450 460 pF1KB3 SDPLNTPA-LDFSQLFNFIPLNGPP-YNPLSVGSLGMSYSQEEAHSSVSQLPPQTQDLQD . :. :: ::.: :..: : : : .. ..:... .. : .: : : :. CCDS52 AVNLTIPASLDLSPLLGFWQLPPPATQNTFGNSTLALGPGESLPHR-LSCLGQQQQEPPL 320 330 340 350 360 370 470 480 490 500 pF1KB3 PANTIGLGSLH--SLSAAFTSSLSTSTTLPRFHQAFQ .:..::.: . .:... . :. ::.::.::. CCDS52 AMGTVSLGQLPLPPIPHVFSAG-TGSAILPHFHHAFR 380 390 400 410 >>CCDS68161.1 CTCFL gene_id:140690|Hs108|chr20 (299 aa) initn: 332 init1: 131 opt: 497 Z-score: 312.3 bits: 66.6 E(32554): 4.5e-11 Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:61-280) 10 20 30 40 pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN : :: ...: . .: : :..: : CCDS68 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV 40 50 60 70 80 90 50 60 70 80 90 100 pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK . ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : .. CCDS68 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS 100 110 120 130 140 110 120 130 140 150 160 pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST .: : :. : : ..: .:. : .. :. ::: ....: :. : .:. CCDS68 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER 150 160 170 180 190 200 170 180 190 200 210 220 pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF .:..: :.: . ::. .:.::. .. . :. .:::.: : : : . : CCDS68 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF 210 220 230 240 250 260 230 240 250 260 270 280 pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF .:. :. :..: :. ... CCDS68 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWVLY 270 280 290 >>CCDS58776.1 CTCFL gene_id:140690|Hs108|chr20 (403 aa) initn: 315 init1: 131 opt: 497 Z-score: 310.7 bits: 66.7 E(32554): 5.5e-11 Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:61-280) 10 20 30 40 pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN : :: ...: . .: : :..: : CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV 40 50 60 70 80 90 50 60 70 80 90 100 pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK . ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : .. CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS 100 110 120 130 140 110 120 130 140 150 160 pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST .: : :. : : ..: .:. : .. :. ::: ....: :. : .:. CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER 150 160 170 180 190 200 170 180 190 200 210 220 pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF .:..: :.: . ::. .:.::. .. . :. .:::.: : : : . : CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF 210 220 230 240 250 260 230 240 250 260 270 280 pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF .:. :. :..: :. ... CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASGKGRR 270 280 290 300 310 320 >>CCDS58777.1 CTCFL gene_id:140690|Hs108|chr20 (422 aa) initn: 332 init1: 131 opt: 497 Z-score: 310.5 bits: 66.7 E(32554): 5.7e-11 Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:118-337) 10 20 30 40 pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN : :: ...: . .: : :..: : CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV 90 100 110 120 130 140 50 60 70 80 90 100 pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK . ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : .. CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS 150 160 170 180 190 200 110 120 130 140 150 160 pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST .: : :. : : ..: .:. : .. :. ::: ....: :. : .:. CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER 210 220 230 240 250 260 170 180 190 200 210 220 pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF .:..: :.: . ::. .:.::. .. . :. .:::.: : : : . : CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF 270 280 290 300 310 230 240 250 260 270 280 pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF .:. :. :..: :. ... CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWILWVGNSEVAELGGPGSGPLLRLQS 320 330 340 350 360 370 >>CCDS68162.1 CTCFL gene_id:140690|Hs108|chr20 (460 aa) initn: 315 init1: 131 opt: 497 Z-score: 310.0 bits: 66.8 E(32554): 6e-11 Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:118-337) 10 20 30 40 pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN : :: ...: . .: : :..: : CCDS68 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV 90 100 110 120 130 140 50 60 70 80 90 100 pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK . ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : .. CCDS68 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS 150 160 170 180 190 200 110 120 130 140 150 160 pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST .: : :. : : ..: .:. : .. :. ::: ....: :. : .:. CCDS68 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER 210 220 230 240 250 260 170 180 190 200 210 220 pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF .:..: :.: . ::. .:.::. .. . :. .:::.: : : : . : CCDS68 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF 270 280 290 300 310 230 240 250 260 270 280 pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF .:. :. :..: :. ... CCDS68 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWINLHRHSEKCGSGEAKSAASGKGRR 320 330 340 350 360 370 >>CCDS58782.1 CTCFL gene_id:140690|Hs108|chr20 (573 aa) initn: 332 init1: 131 opt: 497 Z-score: 308.8 bits: 66.9 E(32554): 7e-11 Smith-Waterman score: 497; 33.6% identity (59.8% similar) in 229 aa overlap (18-241:323-542) 10 20 30 40 pF1KB3 MATVIPGDLSEVRDTQKVPSG---KRKRGETKPRKNFPCQLCDKAFN : :: ...: . .: : :..: : CCDS58 TFRTVTLLRNHVNTHTGTRPYKCNDCNMAFVTSGELVRHRRYKHTHEKPFKCSMCKYASV 300 310 320 330 340 350 50 60 70 80 90 100 pF1KB3 SVEKLKVHSYSHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRK . ::: : :::::::..: : :. : . :::.::: ::: :: ..:. :. : .. CCDS58 EASKLKRHVRSHTGERPFQCCQ--CSYASRDTYKLKRHMRTHSGEKPYECHICHTRFTQS 360 370 380 390 400 410 110 120 130 140 150 160 pF1KB3 DHLKNH-LHTHDPNKETFKCEECGKNYNTKLGFKRHL-ALHAATSGDLTCKVCLQTFEST .: : :. : : ..: .:. : .. :. ::: ....: :. : .:. CCDS58 GTMKIHILQKHGENVPKYQCPHCATIIARKSDLRVHMRNLHAYSAAELKCRYCSAVFHER 420 430 440 450 460 470 170 180 190 200 210 220 pF1KB3 GVLLEHLKSHAGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRF .:..: :.: . ::. .:.::. .. . :. .:::.: : : : . : CCDS58 YALIQHQKTHKN-------EKRFKCKHCSYACKQERHMTAHIRTHTGEKPFTCLSCNKCF 480 490 500 510 520 230 240 250 260 270 280 pF1KB3 GRKDHLTRHMKKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSDLLSKPF .:. :. :..: :. ... CCDS58 RQKQLLNAHFRKYHDANFIPTVYKCSKCGKGFSRWITSKWSGLKPQTFIT 530 540 550 560 570 500 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 13:59:03 2016 done: Thu Nov 3 13:59:03 2016 Total Scan time: 3.360 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]