Gene Elen_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2010
Symbol
ID	8416321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2355956
End bp	2357104
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID	645024987
Product	glutamate 5-kinase
Protein accession	YP_003182363
Protein GI	257791757
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0263] Glutamate 5-kinase
TIGRFAM ID	[TIGR01027] glutamate 5-kinase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00026672
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000000000000558815
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGCCGG CTGGATGCGC GCATGCCGCC GATCATGGCA AGCGCCTCGT GATAAAAATC 
GGGTCGTCCA CGCTCACCAC GTCGGAGAGC AAGATCGACT ACGCCTACCT CGCGGAGGTG 
ACCGACCAGG TCGCGCGCGT GCGCGCCGCC GGTTGGCGCC CCATCGTCGT CACCTCGGCC 
GCTATCGCCT GCGGCCTCGA GCGCTTAAGC ATCGAGAAGC GCCCGCACGA CATGCCCAGC 
CTGCAGGCGG CCGCCTCGGT GGGGCAGAGC GCGCTTTCCA CGGCGTACGC CGAGGCGTTC 
GCGCGCCACG GCATCGTGAC GTCCACGGTG CTGCTGACGC GCCGCGACAC GGCCGACCGC 
CGGGCGTACC TGCACGCGCG CGACACGTTC GACCGCCTGC TGGAGCTGGG GGTGGTGCCC 
ATCGTGAACG AGAACGACAC CATCTCGGTC GAGCAGATCC GCTTCGGCGA CAACGATACG 
CTGGCAGCGC TCGTGGCATG CCTCGTGGAA GCCGACCTCA TGGTCATCCT CTCGGACATC 
GAGGGGCTCT ACGATGCCAA CCCGCATCAC CATCCCGACG CGAACCTCAT CGGCCGCGTT 
GAGGCCATTG GCCCCGAGAT CATGGCCGTG GCGGGCGAAG CCGGCACCAC GGTGGGCTCG 
GGCGGCATGA TCACGAAGAT CAAGGCCGCG CGCGTGCTCA TGGTGGCCGG CATCCCGCTC 
GTGGTGTGCG ACGGTCATCG TGCGGAGGCC ATCGTGGACG CGGCGGCGGG CGAGGACGTG 
GGCACACTGT TCGTGGCTGC GAAGAAGCCG CACGAGATCA CGCCCAAGAA GCTGTGGATC 
GCGCTCGGCG ATGCCGCGCG CGGCGCGCTC GCTGTGGACG ACGGCGCGAA GGCGGCGCTC 
ATCGAGCGCG GCAGCTCGCT TCTGTCGGTG GGCGTGCGCT CGGTGGAAGG GCGCTTCGAG 
GCGAACGACA TCGTCGACAT CAAGGATGCG ACGGGGCATC TGTTCGCGCG CGGCAAGGTG 
GCGTTCGCTA GCGACGAGGC GGCGTTGGCC ATCGGGCGCA CCCGCGCGGA GCTGCAGGCG 
AACCGCCTGC TGGCAAGCTT GGCCGACAAG CCGCTCGTCC ATCGCGACGA GTTGGTCGTC 
TTCGAATAG

Protein sequence

MKPAGCAHAA DHGKRLVIKI GSSTLTTSES KIDYAYLAEV TDQVARVRAA GWRPIVVTSA 
AIACGLERLS IEKRPHDMPS LQAAASVGQS ALSTAYAEAF ARHGIVTSTV LLTRRDTADR 
RAYLHARDTF DRLLELGVVP IVNENDTISV EQIRFGDNDT LAALVACLVE ADLMVILSDI 
EGLYDANPHH HPDANLIGRV EAIGPEIMAV AGEAGTTVGS GGMITKIKAA RVLMVAGIPL 
VVCDGHRAEA IVDAAAGEDV GTLFVAAKKP HEITPKKLWI ALGDAARGAL AVDDGAKAAL 
IERGSSLLSV GVRSVEGRFE ANDIVDIKDA TGHLFARGKV AFASDEAALA IGRTRAELQA 
NRLLASLADK PLVHRDELVV FE