Gene Namu_4555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4555
Symbol
ID	8450183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5069740
End bp	5070693
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	77%
IMG OID	645043596
Product	4-diphosphocytidyl-2C-methyl-D-erythritolkinase
Protein accession	YP_003203823
Protein GI	258654667
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCCT CGAACTCCGG CCCGACGGCG CTTGCGCCCG CGGGTCCGTC GGTGCGGGTC 
CGGGCGCCGG CCAAGATCAA CCTGTACCTG GCCGTCGGTG ACGTGCGCGA GGACGGCTAC 
CACGATCTGG TGACCGTGTT CCAGGCCGTT GACCTGGCCG ACGAGCTCAC CGTGCGACCG 
GCCCGCCGGT CCGCGGTGCG CACCACGCCG CCGGACGGCG TGCCGGTGGG GGCCAAGAAC 
CTGGCCGGGG TCGCGGCCCG GCTGCTGGCC ACCCGCACCA AGTCCGGTGG CCCGGTGGCC 
ATCGACATCG CCAAGCAGAT CCCGGTGGCC GGCGGGATGG CCGGCGGCAG CGCCGATGCC 
GCGGCCGCGC TGGTTGGCTG CGCCGCCCTG TGGGAGCTGC GGGTGCAGCG GCAGGAATTG 
ATCGAGATCG GCCGGGAGAT CGGGGCCGAC GTGCCGTTCG CGCTCGCCGG CGGCACCGCG 
CTGGGCACCG GGCGGGGCGA TCTGCTGTCC CCGGTGATGA CCCGGGCCCG GCTGCACTGG 
GTGCTGGCCA TCGCCGATCA CGGCCTGTCC ACCCCGGCCG TGTTCGCCGA GCTGGACCGG 
CTGCGGGCCC AGGGCGGCGG GCCCCCACCG GTGCGCCCGG TGGACACCAT GCTGGCCGCC 
CTGACCAGCG GCGAGCCGGC CAAGATCGCC GCCGCGTTGG GCAACGACCT GCAGGCCGCC 
GCGATCTCAC TGGCCCCCGG GTTGCGCCGC ACCCTGCGGG CGGGGGAGCA GGCGGGCGCG 
CTGGGCGGGC TGGTCTCCGG ATCGGGGCCG ACCGTCGCCC TGCTGTGCGC CGACGCGGAA 
TCGGCCGGCG CGGTGGCCGC CGAACTGGCC GGGTCCGGAA CCTGCCGATC CGTGCGGGTG 
GCCGCCGGCC CAGCCCCGGG GGCCCGGGTC CTGCCCAACG GAGGGACCGG CTGA

Protein sequence

MMASNSGPTA LAPAGPSVRV RAPAKINLYL AVGDVREDGY HDLVTVFQAV DLADELTVRP 
ARRSAVRTTP PDGVPVGAKN LAGVAARLLA TRTKSGGPVA IDIAKQIPVA GGMAGGSADA 
AAALVGCAAL WELRVQRQEL IEIGREIGAD VPFALAGGTA LGTGRGDLLS PVMTRARLHW 
VLAIADHGLS TPAVFAELDR LRAQGGGPPP VRPVDTMLAA LTSGEPAKIA AALGNDLQAA 
AISLAPGLRR TLRAGEQAGA LGGLVSGSGP TVALLCADAE SAGAVAAELA GSGTCRSVRV 
AAGPAPGARV LPNGGTG