Gene Dret_0538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0538
Symbol
ID	8418346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	647671
End bp	648882
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	61%
IMG OID	645037102
Product	2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase
Protein accession	YP_003197413
Protein GI	258404671
COG category	[I] Lipid transport and metabolism
COG ID	[COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00151] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCT GGACCATCAT CCTCGCCGGC GGTAGCGGCT CACGCCTCGC CGAAGCCACA 
AGCGGGGTCA AGAAACAATT CCTGCACTAT CTTGGCCGGC CGCTATTGTG GCACAGTGCC 
GCCACGTTTG CCGCCATGCC AAGCATCGAA GGCATTGTCA TGGTTGCTCC GGCAGAGGAA 
TTGGAAACCG CGCGCGCGCT GTTCAACGAG TGTGCGGCCC AATCGCCCCT GGGAGTCCCG 
GTGCGGTGGA CCGTTGGCGG CAGACGCCGC CAGGATTCCT CGGCCCAGGG GCTGGCTTCC 
CTGCCGGCCG AGTGCCGCCG CGTCCTGATC CACGACGCTG CCCGCCCCTT TGTCAGTGCC 
CCCCTCACGC AACGCGTCCT GGACGCCTTG GAATGTTTTG ACGGTGTCGT GCCCGGGATT 
CCAGTCACCG ACACCATCAA ACAGGCCCAA CAAGACTTGG TCAGCACCAC CCTCCCTCGC 
CATGAACTCT TTGCAATTCA AACCCCTCAG GGGTTTCGCA CCGCTGCGCT TGACCAGGCC 
CACAAAACAG TCGCTGACCA CGGCATTGAC GTTACCGATG ACGCCTCCAT GCTCGAGTAT 
AGCGGCGGTC GTGTCGGGGT CGTTGCCGGA GAGCGGAGCA ATTGCAAAAT CACCACCGCC 
GAGGACTTGC GTATGTTGAC CGCTTCTCCT TCGACCCGGA TCCCGTGCAC CGGTTGGGGC 
TACGATGTAC ACCGCTACGG AGCGGGCAGG CCCATGAAAC TCGGCGGGAT CCCGATCACC 
AATGGCCCGG AGATCATCGC CCATTCCGAC GGCGACGTCC TGCTCCACGC TCTGATGGAT 
GCCCTGCTTG GATGTTTGGG GGCCGGAGAT ATTGGCGAAC ATTTTCCCGA CACGGACCCC 
CGGTGGGACA ACGCCAACAG CAGTGCCCTG CTTACCGACG TTTTGGACTG GTGCCGTTTC 
AACGGACTCA TCCTGCGGCA CGTCGATATG ACTGTGGTTT GTCAAACCCC GAAACTGCAA 
CCCTGGAAAC ACCAGATCCG AAAAACCGTG GCCGCGCTCC TCGGTCTGGC TGAACACCAT 
TGCAATCTGA AGGCGACTAC TGAAGAAGGG CTCGGATTTA CTGGACACAA AGAAGGCATC 
AAAGCGATCG TCCTGGTGAC AGGAGAACGG GAAACCCCGA CCCACGAATC CACTTTTCCA 
GAGTCCCGGT AA

Protein sequence

MSTWTIILAG GSGSRLAEAT SGVKKQFLHY LGRPLLWHSA ATFAAMPSIE GIVMVAPAEE 
LETARALFNE CAAQSPLGVP VRWTVGGRRR QDSSAQGLAS LPAECRRVLI HDAARPFVSA 
PLTQRVLDAL ECFDGVVPGI PVTDTIKQAQ QDLVSTTLPR HELFAIQTPQ GFRTAALDQA 
HKTVADHGID VTDDASMLEY SGGRVGVVAG ERSNCKITTA EDLRMLTASP STRIPCTGWG 
YDVHRYGAGR PMKLGGIPIT NGPEIIAHSD GDVLLHALMD ALLGCLGAGD IGEHFPDTDP 
RWDNANSSAL LTDVLDWCRF NGLILRHVDM TVVCQTPKLQ PWKHQIRKTV AALLGLAEHH 
CNLKATTEEG LGFTGHKEGI KAIVLVTGER ETPTHESTFP ESR