Gene Elen_0217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0217
Symbol
ID	8414501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	300411
End bp	301382
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	69%
IMG OID	645023197
Product	MazG family protein
Protein accession	YP_003180600
Protein GI	257789994
COG category	[R] General function prediction only
COG ID	[COG3956] Protein containing tetrapyrrole methyltransferase domain and MazG-like (predicted pyrophosphatase) domain
TIGRFAM ID	[TIGR00444] MazG family protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCT CCGAACCCAC GCCGCCCATC GCATCCCCGT CTCCTGCCGC GCCCCTCGCA 
AGCCAGCTTG CGGCCAACCC CTGCAGCCAT CCGTCGTTCG ACCAGTTCGT CGCCACCATC 
GCCGCGCTGC GCGCGCCGGA CGGATGCCCG TGGGATCGCA CGCAGACGCA CCAGAGCATC 
GCGCACAACA TGATCGAAGA GGCATACGAG GCGGTGGACG CCATCGAAGC CGCCGATGTC 
GCGCACCTGC GCGAGGAGCT GGGCGACGTG CTGCTGCAGG TGGTGTTGCA AAGCCAGATA 
GCTTCCGATG CCGGCGAGTT CGACATCAAC GACGTGTGCG CCGACGTGAA CGAGAAGATG 
GTCCGCCGCC ATCCTCACGT GTTCGGCGAG GCGCAAGCCG CCAACGCCGG GGACGTGCTG 
GATCTGTGGG AACGGGTGAA GATGGCGGAG AAGGGCGCCG CCGACGAGGC GGCCGACGGT 
GCGGGCGAGC GGCGCGAAGG CCTGCTGGAC GGCGTGCCCA CCAGCTTCCC CGCGCTCATG 
CAGGCGCAGA AGATATCTCG CAAGGCCGCG GCCGCCGGGT TCGAGTGGGA CTCGCTTGAC 
GGCGTGTGGG AGAAAGTGCG CGAGGAAATC GCCGAGCTGC AAGAAGCCTA CGCCGTCGCG 
CCCAAGGCGG CGAACGGCAA GGTGGACGCC GCGGCCGCTT CCGCAGGCGC GGCCGTCGAC 
CCCGCCGCGG CCGAGGCGGC CGTCGCCGCC GTCGAGGACG AGCTCGGCGA CGTGCTGTTC 
TCGCTGGTGA ACGTGGGCCG CCGCATGGGC GTGGACGCAG AAGGTGCGCT GCGCTCCACC 
TGCCGCAAGT TCCGCGACCG ATGGGCCTGG ATGGAGCAAG CCGCCTGGCA GCAGGGTCGA 
ACCATCGAAG ACCTCTCCAG CGAAGAGCGC GAAACCCTGT GGAACGAGGC GAAGAAGCGC 
GAGCGATCGT AG

Protein sequence

MTASEPTPPI ASPSPAAPLA SQLAANPCSH PSFDQFVATI AALRAPDGCP WDRTQTHQSI 
AHNMIEEAYE AVDAIEAADV AHLREELGDV LLQVVLQSQI ASDAGEFDIN DVCADVNEKM 
VRRHPHVFGE AQAANAGDVL DLWERVKMAE KGAADEAADG AGERREGLLD GVPTSFPALM 
QAQKISRKAA AAGFEWDSLD GVWEKVREEI AELQEAYAVA PKAANGKVDA AAASAGAAVD 
PAAAEAAVAA VEDELGDVLF SLVNVGRRMG VDAEGALRST CRKFRDRWAW MEQAAWQQGR 
TIEDLSSEER ETLWNEAKKR ERS