Gene Shel_00140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shel_00140
Symbol
ID	8393906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Slackia heliotrinireducens DSM 20476
Kingdom	Bacteria
Replicon accession	NC_013165
Strand	+
Start bp	21130
End bp	22116
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	62%
IMG OID	644984789
Product	4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
Protein accession	YP_003142439
Protein GI	257062767
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCACG TGCGCGTGTT CTCGCCGGCC AAGGTGAATC TGCATCTTGA TATCAGCGAG 
CGCCGGCCGG ACGGCTACCA TGGGGCTTAT TCCATCATGC ATGCGCTGTC GATGCACGAC 
ATGCTGACCA TGCGCCGTGA GTTTGCGGCG CCGGGCTCGG GCTTGGTTGT GGATGTGCAT 
TGCGCCACCC ATGGCGATAT TGCTGAGCTG AACATTCCCG CAGAATCGAA CATCGCTTAC 
AAGGCCGTCG TCCGTCTTGC CGAGGCTCTT GGACGGACTG GGGATGATTC CGTTCTGATA 
GGTATCGACA AGAACATTCC CCATGCGGCG GGGCTAGGCG GCGGTTCGTC AAACGCCGCT 
GCAGCGCTGC TGGGTGCCTG TGCGCTATGG GATATAGACT TGGCCGACAC TGGTGTTCGC 
GCGATCGTGG AGCAGGTGGC ATCAGGATTG GGTGCCGACG TGCCTTTCTT CCTGCACGGC 
GGGTGCGTGG CCCTTACCGA TAAGGGCGAC ATATACGAGC GTGACCTGGT GCCTAGCAAA 
CGCAACGTGG TCATTGTGCG GCCTGAGGAG GGTGTTTCCA CCGGCGCTGC CTATGCGGCA 
TTCGACGCGA ATCCGCCTCT GTCCAGCGAC GAGGTCAAAG CGGACGCCCG TGCGGCTGAA 
TCCGCCGACG ACCTGCATCT TTTCAACAAC CTGGCTCCCG CTTCCGAAGG CCTGCTGCCG 
GTTCTGACCG ATATTCGCGA GTGGTTGTCG GGCCATGCGG GCGTAGCGCA TGATGCAACC 
ACAGGTGCGC CCCAGGTCCT TCTGTGCGGC AGTGGTTCGT CCACCTTCGC CATCTGCGAC 
GACTTCGATG CGGCCTACAA GCTTGTGGGT GACGCTCGAT TGAACGGCTG GTGGGCCCGC 
AGCTGCAATT TCACCAGCGC AGGAGCGCGC GTGCTGCCCA CGGCGGGTCA GGCCACCAAC 
CTTGGTGCCG TGCAAAAGTC CTGGTAG

Protein sequence

MNHVRVFSPA KVNLHLDISE RRPDGYHGAY SIMHALSMHD MLTMRREFAA PGSGLVVDVH 
CATHGDIAEL NIPAESNIAY KAVVRLAEAL GRTGDDSVLI GIDKNIPHAA GLGGGSSNAA 
AALLGACALW DIDLADTGVR AIVEQVASGL GADVPFFLHG GCVALTDKGD IYERDLVPSK 
RNVVIVRPEE GVSTGAAYAA FDANPPLSSD EVKADARAAE SADDLHLFNN LAPASEGLLP 
VLTDIREWLS GHAGVAHDAT TGAPQVLLCG SGSSTFAICD DFDAAYKLVG DARLNGWWAR 
SCNFTSAGAR VLPTAGQATN LGAVQKSW