Gene Rsph17029_4078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4078
Symbol
ID	4894996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009040
Strand	-
Start bp	15740
End bp	16780
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	640110480
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001041792
Protein GI	126464816
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	92
Plasmid unclonability p-value	0.29374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	0.0761668
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGA TCGTGACCGG AGGAGCGGGC TTCATCGGCT CGGCCGTGGT GCGCAAGGCG 
GTGGCCGACG GCCACCATGT CGTCAATCTC GACTGCCTGA CCTATGCCGC CTGCCTCGAC 
AATCTTGCAA GCGTCGCGGG CGCGCCGAAC TATGTCTTCG AGAAGGCCGA CATCCGCGAT 
GCGGAGGCCA TGGCGCGGGT CTTCGCCACC CACCGGCCCG ATGCGGTGAT GCATCTGGCA 
GCAGAAAGCC ATGTCGACCG TTCGATCGAC GGGCCGGGCG CCTTCATCGA CACCAATGTC 
CGCGGCACCT ATGTGCTCCT CGAGGCCGCC CGCGCCTACT GGGTGGGGCA GGGGAGGCCG 
GAGGGCTTCC GCTTCCACCA TATCTCGACC GACGAGGTCT TCGGCACGCT GGGCGAGACC 
GGGCAGTTCA CCGAAGAGAC GCCTTACGCG CCGAACTCGC CCTATTCGGC CTCGAAGGCC 
GCCTCCGACC ATCTGGTGCG CGCCTGGGGC GAGACCTACG GGCTGCCCTA TGTGCTGACC 
AACTGCTCGA ACAATTACGG GCCGTTCCAT TTCCCGGAAA AACTCATTCC GGTGGTGATC 
CTGAAGGCGC TCGCGGGCGC CCCGATCCCG GTCTACGGCA AGGGCGAGAA TGTCCGCGAC 
TGGCTCTATG TCGAGGATCA TGCCGACGCG CTGCTGACCG TGCTGGCCAG AGGTGAGAAC 
CACCGCAGCT ACAATATCGG CGGCGAGAAC GAGGCGAAGA ACATCGACAT CGTCCGCAAG 
ATCTGCGCGA TCCTCGATGC GCGGCGCCCC AAAGCCACGC CCTATGCCGA TCAGATCGCC 
TTCGTGACCG ACCGTCCGGG CCACGACCTG CGCTATGCGA TCGACCCCAC GCGCATCCGC 
ACCGAACTGG GCTGGCGGCC CTCGGTCACG CTCGACGAGG GGCTCGAGCG CACCGTCGAC 
TGGTATCTGG CCAACGAGCC CTGGTGGCGC GCGCTGCAGG ACCGCGCCGG GGTGGGCGAG 
CGGCTGGGAG TGAAGGCATG A

Protein sequence

MKLIVTGGAG FIGSAVVRKA VADGHHVVNL DCLTYAACLD NLASVAGAPN YVFEKADIRD 
AEAMARVFAT HRPDAVMHLA AESHVDRSID GPGAFIDTNV RGTYVLLEAA RAYWVGQGRP 
EGFRFHHIST DEVFGTLGET GQFTEETPYA PNSPYSASKA ASDHLVRAWG ETYGLPYVLT 
NCSNNYGPFH FPEKLIPVVI LKALAGAPIP VYGKGENVRD WLYVEDHADA LLTVLARGEN 
HRSYNIGGEN EAKNIDIVRK ICAILDARRP KATPYADQIA FVTDRPGHDL RYAIDPTRIR 
TELGWRPSVT LDEGLERTVD WYLANEPWWR ALQDRAGVGE RLGVKA