Gene Emin_1093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1093
Symbol
ID	6263264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1187346
End bp	1188614
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	45%
IMG OID	642611573
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_001875982
Protein GI	187251500
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.666843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	102
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAGGT TTACTATTAA AGGGCCGGTA AAATTACAAG GTGAGGTTGA GATAAGCGGC 
TCTAAAAACG CGGCTTTGCC TATACTTATG GCTACTCTTT TAACTGACGA AAAATGCGTC 
CTTAACCGTG TTCCGAATCT GCGTGACATA AGAACAACTT TTAAACTTTT AGAAGTGCTT 
GGCAAAAAAG TGGAATATAA TAACGGTACG GCGGTAATTA CAAAAAATAA AGAATTAAAT 
TCCATTCTTC CCTATGAACT TGTTAAACAA ATGAGGGCCA GTTTTTGGGT GGCGGGGCCT 
TTGCTGGCCA GGTTAAAACA CACACAAATA CCGCTGCCGG GCGGCTGCGC CATAGGAGTA 
CGCCCAGTGG ATATCCATTT ACAGGGGTTT AAAAAATTCG GCGCAGCTGA GTCAACCAAA 
AAAGGCGATG TGGTTATAAG CGCGGACGAA CTTAAACCCG CTAAAATAGT TTTAAGATTC 
CCCAGCGTGG GCGCCACAAT AAATATTATG ATGTGCGCCA GTTTGATACC GGGCAAAACA 
ATAATTGAAA ACGCCGCTAA AGAACCCGAA GTGGAGGACC TTATCTGCGC TTTAAAAACA 
ATGGGCGCGC AAATAAGCAT TGATTCCAAA GGTCGCATTA TTGTTGAAGG TAAAAAAACT 
TTAGGCTCAA TGACGCATAC CGTAGTGGCC GACCGTATTG AGACAGGTAC ATTTATTCTT 
GCGGCCGCCG CCACAAAAGG AGACGTTGTT ATAAAAAACT GCGTGCCCGA GCATAACGAC 
ATTTTGCTTG AAAACTTAAA AGACGCGGGT TTTGGCGTAA GCGTGGGGCA GGGGCGCATT 
CACATAACAG CGCCTTCTAA CGGCAAAATA AAACCCGTTG GAATAAGGAC AATGCCTTAC 
CCCGGTTTCG CTACTGATTT GCAGGCCCCT TATATGGTGC TTTTATGTGT TGCCGACGGC 
GGAAGCGATA TAACGGAAGA TATTTTTGAA AACCGTTATA TGCACGCGCC GGAACTGGTG 
CGCATGGGGG CGGATATTAC AATAGAAAAG ACAATGGCTA AAGTTAAAGG GGTTAAAGAA 
CTTTCCGGCG CCAATGTAAT GGCTTCCGAT TTGCGGGGCG GGGCGGCTTT GGTAATAGCC 
GCGCTTTGCG CCGCGGGAGA TACGGTTATT GACCGTGTGT ATCACATAGA CCGCGGGTAT 
GAAAACATTG AAGCTAAATT TGCCGCTTTA GGTGCTAAAA TAGTGCGGGA TAATCCTTTA 
AAAGACTGA

Protein sequence

MDRFTIKGPV KLQGEVEISG SKNAALPILM ATLLTDEKCV LNRVPNLRDI RTTFKLLEVL 
GKKVEYNNGT AVITKNKELN SILPYELVKQ MRASFWVAGP LLARLKHTQI PLPGGCAIGV 
RPVDIHLQGF KKFGAAESTK KGDVVISADE LKPAKIVLRF PSVGATINIM MCASLIPGKT 
IIENAAKEPE VEDLICALKT MGAQISIDSK GRIIVEGKKT LGSMTHTVVA DRIETGTFIL 
AAAATKGDVV IKNCVPEHND ILLENLKDAG FGVSVGQGRI HITAPSNGKI KPVGIRTMPY 
PGFATDLQAP YMVLLCVADG GSDITEDIFE NRYMHAPELV RMGADITIEK TMAKVKGVKE 
LSGANVMASD LRGGAALVIA ALCAAGDTVI DRVYHIDRGY ENIEAKFAAL GAKIVRDNPL 
KD