Gene Rsph17029_3681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3681
Symbol
ID	4898508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	785939
End bp	786970
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	640114289
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001045543
Protein GI	126464430
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0230856
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.593918
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGAAC ACAAGCGCAT TCTGGTGACG GGCGGTCTCG GCTTCCTCGG CTCCTTCCTG 
TGCGAGAGCC TGCTTGCGGA CGGCCACGAG GTCATCTGCG TCGACAGCTT CCAGACCGGC 
TCCCGCGAGA ATGTGGCCCA TCTCCGGGAC CATCCCAACT TCGAGATCAT GCGGCATGAC 
GTGACCGTGC CGCTGCATGT CGAGGCCGAC GAGATCTTCA ACCTCGCCTG CCCGGCCTCG 
CCGATCCACT ATCAGGTCGA TCCGGTGAAG ACGGTGAAGA CCAGCGTCAT GGGGGCGATC 
AACCTGCTCG ACCTCGCGCG GCGCACCAAG TCGAAGATCT TTCAGGCCTC GACCTCCGAG 
GTCTACGGCG ATCCGAAGGT CCATCCCCAG CCCGAGGGCT ACTGGGGCCA TGTGAACCCC 
AACGGCCCGC GCTCCTGCTA CGACGAGGGC AAGCGCTGCG CCGAGACCCT GTTCTTCGAC 
TATCACCGCC AATATGGCGT CAACATCCGC ATCGCCCGGA TCTTCAACAC CTACGGGCCG 
CGGATGCACC CGAACGACGG GCGGGTGGTC TCGAACTTCA TCGTTCAGGC GCTGAGCGGC 
AAGCCGATCA CCATCTACGG CGACGGCACG CAGACCCGCT CCTTCTGCTA CGTCACCGAC 
CTGATCCGGG GCTTCCGCGC CCTGATGGAC GCGCCGGACG GGATCGAGCT GCCGGTGAAC 
CTCGGCAACC CGGGCGAGTT CACCATGCTC GAGCTGGCGA CGCTGGTGAT CGAGCTGACC 
GGCTCGCGCT CCAAGGTCGT GCATCTGCCG CTGCCGAAGG ACGATCCCAC CCAGCGCAAA 
CCCGACATCA CCCGCGCCAC CGAGACGCTC GGCTGGAAGC CCGAGATCCC GCTGTTCGAC 
GGCCTGCAGC GCACGATCGC CCATTTCGAT CAGCTGCTGA GCCGGACGCA GAAGCGGGCC 
GTCCCCGAGA TGTCGATGGC GATGGTCGCG AACGGTCTCG CCCGCAACGG CGCCTCCGAA 
GCGCTGCGCT GA

Protein sequence

MHEHKRILVT GGLGFLGSFL CESLLADGHE VICVDSFQTG SRENVAHLRD HPNFEIMRHD 
VTVPLHVEAD EIFNLACPAS PIHYQVDPVK TVKTSVMGAI NLLDLARRTK SKIFQASTSE 
VYGDPKVHPQ PEGYWGHVNP NGPRSCYDEG KRCAETLFFD YHRQYGVNIR IARIFNTYGP 
RMHPNDGRVV SNFIVQALSG KPITIYGDGT QTRSFCYVTD LIRGFRALMD APDGIELPVN 
LGNPGEFTML ELATLVIELT GSRSKVVHLP LPKDDPTQRK PDITRATETL GWKPEIPLFD 
GLQRTIAHFD QLLSRTQKRA VPEMSMAMVA NGLARNGASE ALR