Gene Emin_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0501
Symbol
ID	6262659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	549751
End bp	550656
Gene Length	906 bp
Protein Length	301 aa
Translation table	11
GC content	39%
IMG OID	642610971
Product	4-diphosphocytidyl-2C-methyl-D-erythritol kinase
Protein accession	YP_001875394
Protein GI	187250912
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000076215
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAAG CTTCCTTAAA GATATTCTGT CCCGCTAAAA TAAATTTATT TTTAGAGATA 
GTTTCCAAAC TGCCTAACGG TTACCATGAA CTGCAAACAA TTTTTGCAAA GTTAGATTTT 
GGGGATAATA TTTTACTAAC CCTTTCTCCG TCAGATAAGA CGGAAATCAA CCTTAAAATA 
ACAGGCCCCT ACGGGCATGC CATAACGGCC GACGCGGATA ACCTTGTTTA TAAGGCGGCT 
CAGCGTTTTT TTGAATTTAC AGGCATAAGC GCCAAATGCG ATATATCGCT TGAAAAAAAT 
ATTCCGACAG GCGCGGGGTT GGGGGGCGGC TCTTCGGATG CAGGATGCCT CCTTCGCACT 
TTTTGCAACC ATTATAAGAC AGATTTTACA ATGCTTGTTC CTTTGGCTGC TAAACTCGGC 
GCGGACGTAG CGTTGTTTCT ATATGACGAA CCTGTTTTAA AAGGAGAAGG CATAGGTGAA 
AAACTTACGC CTTTAAAAAT TAAAGACGCA CTGCCTTATG TGGTGTTGTC TTACCCAGAT 
ACGCACATAT CTACTAAAGA TGTTTTTGAT AGGCTGAAGG TTGGAAGTAA AGAAGAAATA 
TTGACAAACT TGGCTAAGCT TGATAAAATT ATAGCTGGTC TTACAGAAGG AAGTGCGTGG 
GAAAAATACA TATATAACAG ATTAGAAGAT TATGTATTAC CTTTCAGTAA GCCTGTTTTG 
GAGTTAAAGA AGTTAATGCA AACCCTAGGA GCCAAAAATA TTATGATGTC CGGTTCCGGT 
TCAACAGTTT TTAGTTTATT TGATAGTTCC AGTGATGCCT GTGCATTTGC TGAAAAATTA 
ATAAATCGGG GTTGTGTTGC AGTAAAAACG CAACTTTGGA GGGGTTTGTA TAATGAAAAT 
TACTGA

Protein sequence

MNEASLKIFC PAKINLFLEI VSKLPNGYHE LQTIFAKLDF GDNILLTLSP SDKTEINLKI 
TGPYGHAITA DADNLVYKAA QRFFEFTGIS AKCDISLEKN IPTGAGLGGG SSDAGCLLRT 
FCNHYKTDFT MLVPLAAKLG ADVALFLYDE PVLKGEGIGE KLTPLKIKDA LPYVVLSYPD 
THISTKDVFD RLKVGSKEEI LTNLAKLDKI IAGLTEGSAW EKYIYNRLED YVLPFSKPVL 
ELKKLMQTLG AKNIMMSGSG STVFSLFDSS SDACAFAEKL INRGCVAVKT QLWRGLYNEN 
Y