Gene Elen_1172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1172
Symbol
ID	8415463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1407447
End bp	1408565
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	66%
IMG OID	645024135
Product	transcriptional regulator, XRE family
Protein accession	YP_003181531
Protein GI	257790925
COG category	[K] Transcription
COG ID	[COG1396] Predicted transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.38155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACA TTAACTTGGG AGCCGCCATC GCGCGCGAGC GCCGTGCGGC GCAGGTGACG 
CAGGGCGAGC TGGCCGCGCA CCTGGGCGTG ACGAAGGCGG CCGTGTCGAA GTGGGAGCTG 
GAGCAAAGCA TGCCCGACCT GGCTCTGCTG CCGCGCATCG CCGCCTACTT CGACCTCACG 
CTGGACGAGC TGTTCGACTA TCGGCCGCAG CTGGTGGGCG ACAATCTGCA AGGCGCCTAC 
CTGAGGCTGC TCGCGCAGTT CGACGAAGAT CCCGAAGCCG CTTTCGCGAA CGCCGAGGAC 
CTCGTCCGTT CGCACTACTC CTGCTGGCCC GCGCTGCAGC AGATGGGCAT GCTCTACGCG 
CAGCGCGCAA CCCTCGACCC CGACCGCGCC GAGCCCTTGG CCGCGCGCGC AGCCGAGCTG 
TTCGAGCGCG TCGAGCGGCA TGCCGACGAC GTGGAGCTGG TGCGCGCCGC GCGGATGATG 
CGCGCTTCCG TCATGAGCGT GCAGGGTGAC TTGGACGGAT GCATCGCCCT GTTCGAAAGC 
CTCAAGCCCG ACAGGACGAC GGCGAACATC GATCTCATGC TGGCCAGCAT GTACCAGCAG 
AGAGGCGACC TTGACGCCGG CTTGAAGCTG TTCCAAGAAT CGATGGGCTG GTGCGTGATG 
AACGCCATAA GCTGCGTCTC GGCGCAGATC CCGCTGTACG CCGACGACGC CGAGCACCTG 
GAGGCGCTCC TGCGGGCCGG CGAAGGCGTG CTTTCCGGGT TCGATTTGCA GAACCAGAGC 
CCGATGACGG TGCTCACGTT CTGCACGAAC GCATCTTCCG CGTGTTTGCA GGCGGGCGAC 
GAGGATCGAG CCGCGAGCTA TCTCGAGCGC TTTACGTCTT TGCTGGAGGA GCTTGACGCG 
CGCATGCTGG TGTACGGCCG GAACCAGAGC GCGCTGTACG ATCGGGCGCC CGAGCTTTGG 
AGCGTCGATC CCGGCCAGGA GCATATCGCG GAAACCCGGT TTGGCGCGAT CGACTTCAGG 
CGGCAGTGCG CGCAGATGGT GGCAGCGCAG CCCGTCTGGG CCGAACGTGC CGGCGATTCG 
CGTTTCAAGC CGCTGTTCGA TCGACTGGAG GCCCTATGA

Protein sequence

MDDINLGAAI ARERRAAQVT QGELAAHLGV TKAAVSKWEL EQSMPDLALL PRIAAYFDLT 
LDELFDYRPQ LVGDNLQGAY LRLLAQFDED PEAAFANAED LVRSHYSCWP ALQQMGMLYA 
QRATLDPDRA EPLAARAAEL FERVERHADD VELVRAARMM RASVMSVQGD LDGCIALFES 
LKPDRTTANI DLMLASMYQQ RGDLDAGLKL FQESMGWCVM NAISCVSAQI PLYADDAEHL 
EALLRAGEGV LSGFDLQNQS PMTVLTFCTN ASSACLQAGD EDRAASYLER FTSLLEELDA 
RMLVYGRNQS ALYDRAPELW SVDPGQEHIA ETRFGAIDFR RQCAQMVAAQ PVWAERAGDS 
RFKPLFDRLE AL