Gene Elen_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2044
Symbol
ID	8416355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2394378
End bp	2395379
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	63%
IMG OID	645025021
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_003182397
Protein GI	257791791
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACCT ACCTGGTCAC CGGCGGAGCC GGATTCATCG GAAGCAACTT CGTCCACTGG 
GTGGTGGACA ACCAGCCCGA GGTGCACGTC GTCGTCCTCG ACAAGCTCAC CTACGCCGGC 
AACAGGGAGA ACCTCGCCGG GATTCCGGAC GATCGCATGA CCTTCGTGCA CGGCGACATC 
TGCGACGAGG AGCTGCTCGA GAAGATCGTC CCCGGAATCG ACGGCATCGT GCATTTCGCC 
GCGGAGTCCC ACAACGACAA TTCCATCGCC GATCCGGAGC CGTTCGTGCG CACCAACGTG 
CACGGCACCT TCCGCTTGCT CGAGGCGGCG CGCAAGCACG ACGTGCGCTT CCATCACATC 
TCCACCGACG AGGTGTACGG CGACCTGGCG CTCGACGATC CGGCGCGCTT CACGGAGGAG 
ACGCCGTATT GCCCCTCGAG CCCGTACAGC TCCAGCAAGG CTTCATCGGA TCTGCTCGTG 
CGCGCGTGGT TCCGCACCTA CGGCGTGAGG GCGACGATCT CGAACTGCTC GAACAACTAC 
GGCCCGCGCC AGCATATCGA GAAGTTCATC CCGCGCCAGA TCACCAACGT TCTCACCGGC 
ATTCGCCCGA AGCTCTACGG CGACGGCCTG AACGTGCGCG ACTGGATACA CACCGAGGAC 
CACTCCTCGG CCGTGTGGGC GATTCTCACG AAGGGCCGCC TGGGCGAGAC GTACCTGATC 
GGGGCCGACG GCGAGAAGAA CAACATCGAC GTGCTGCACG CCATCCTCGA GAACATGGGC 
AAGGACGCGG ACGACTTCGA CTGGGTCAAA GATCGTCCCG GTCACGACCG CCGCTATGCC 
ATCGACTCCT CGAAGCTGCG TTCCGAGCTG GGATGGAAGC CCAAGCACAC CGATTTCGCC 
GAAGGGCTCA AGGCGACCAT CGACTGGTAT CGCGACAATC CCCAGTGGTG GCAGGACGCC 
AAGGAGGCCG TCGAGGCCAA GTACGCGAAG CAAGGACAGT AG

Protein sequence

METYLVTGGA GFIGSNFVHW VVDNQPEVHV VVLDKLTYAG NRENLAGIPD DRMTFVHGDI 
CDEELLEKIV PGIDGIVHFA AESHNDNSIA DPEPFVRTNV HGTFRLLEAA RKHDVRFHHI 
STDEVYGDLA LDDPARFTEE TPYCPSSPYS SSKASSDLLV RAWFRTYGVR ATISNCSNNY 
GPRQHIEKFI PRQITNVLTG IRPKLYGDGL NVRDWIHTED HSSAVWAILT KGRLGETYLI 
GADGEKNNID VLHAILENMG KDADDFDWVK DRPGHDRRYA IDSSKLRSEL GWKPKHTDFA 
EGLKATIDWY RDNPQWWQDA KEAVEAKYAK QGQ