Gene Rsph17029_1794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1794
Symbol
ID	4896379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1891725
End bp	1892762
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	640112388
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001043673
Protein GI	126462559
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.381286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGAA GCCTTATTCC GGTCGATGTG ACCGGTCATG ATTCTTTTAT GCCTCGTTTC 
CATCGCCGGA AGGTCATTCT CGTCACGGGA GGAGCCGGAT TTGTGGGCTC TCATCTTTGC 
GAGCGGCTGA TTGCCGAAGG TCATTCCGTC GTCTGTCTCG ATAATCTTCT GACCGGCCGC 
AAAGAGAATG TCGCTGGGCT GCTCGGCCAT CCCCAATTCC GCTTTCTCGA GCAGGACATC 
CTGAGCCGGA TCGACTGGCA GGGGCCGCTG GACGAGATCT ACAACCTTGC CTGCGCGGCC 
TCTCCGCCGC TCTACCAGCG CGACCCGATC CATACGTTCC GCACCTGCAC CGAGGGCGTG 
CTGAACCTGC TCGCGCTGGC GCGGGCCACG GGCGCGCGCA TCCTGCAGGC CTCGACCTCC 
GAGGTCTATG GCGATCCCGA GATCTCGCCC CAGCACGAGG GCTACCGCGG CTGCGTCAAT 
ACGGTGGGTC CGCGGGCCTG CTACGACGAG GGCAAGCGCG CGGCCGAGAC GCTGTTCTGG 
GAGTTCGGGG CCCATCAGGG CCTCGAGGTG CGGATCGCGC GGATCTTCAA CACCTACGGG 
CCGCGGATGA GCCCCGAGGA CGGCCGCGTT GTCTCGAACT TCATCGTCCA GGCGCTGACC 
CGCAGCGACA TCACCCTCTA TGGCGACGGG ATGCAGACGC GCTCCTTCTG CTATGTGGAC 
GATCTGGTGA CCGGGCTGAT GGCGCTGATG GCGTCGGAGG TGAGCGAACC GGTCAACCTC 
GGCAATCCGG GCGAATTCAC CATGCGGGAG CTGGCCGAGA TGGTGCTGGC TCAGACCGGC 
TCTTCCTCGC GGCTGGTTCA TCGGCCGCTG CCGGTGGACG ATCCGCGCCA GCGCCGGCCC 
GACATCGCGC AGGCCGCGCG GCTTCTCGGC TGGGCGCCGA CGGTGCCGCT GGCCGAAGGC 
ATCGCCCGGA CCATCCGGCA TTTCGCGGGC GAACCTCAGG TCGTCCGGGC GCGCGAGGCT 
CTGCTGGTCC ATGCCTGA

Protein sequence

MDGSLIPVDV TGHDSFMPRF HRRKVILVTG GAGFVGSHLC ERLIAEGHSV VCLDNLLTGR 
KENVAGLLGH PQFRFLEQDI LSRIDWQGPL DEIYNLACAA SPPLYQRDPI HTFRTCTEGV 
LNLLALARAT GARILQASTS EVYGDPEISP QHEGYRGCVN TVGPRACYDE GKRAAETLFW 
EFGAHQGLEV RIARIFNTYG PRMSPEDGRV VSNFIVQALT RSDITLYGDG MQTRSFCYVD 
DLVTGLMALM ASEVSEPVNL GNPGEFTMRE LAEMVLAQTG SSSRLVHRPL PVDDPRQRRP 
DIAQAARLLG WAPTVPLAEG IARTIRHFAG EPQVVRAREA LLVHA