Gene Rsph17029_1399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1399
Symbol
ID	4897873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1452863
End bp	1454119
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	66%
IMG OID	640111986
Product	putative glucose/sorbosone dehydrogenase
Protein accession	YP_001043281
Protein GI	126462167
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGAC TGATGACGTC CCTCGCGGCC CTTTCCCTGA CCGCGGGACT GGCCCATGCG 
CAAGCGGCGG ATGTGCCCGA CAATCTCGAG AAACTGTCGA ATTTCCAGAG CACCGGCGCC 
ACCGACTTCA CCTTCGTCGA GCAGGGCGGA GACTTCGCCG ACGGCATCAA GCGCAATCTC 
GAGCGGATCA AGCTGCCGCA GGGCTTCCGC ATCGGCCTCT ATGCCGTGGT CCCCGATGCG 
CGCCACATGG CGGTGGGGCC GCAGGGCATC GTGACCTTCG TGGGCACGCG CAAGGACAAG 
GTCTGGGCCG TCACCGACCG CAACAAGGAC CGCGTGGCCG ATGAGGTGAA GGATTTCGCC 
CCCTCGCTGC GCTTCACCAT CCCGAACGGC CCCTGCTTCT CGAAGGACGG CTTCCTCTAT 
ATCGCCGAGC AGAACCGCGT GCTTCTCTTT CCCGCTGCCG AGTTCTTCTA TGAATCGGGC 
GATGTGGCGG CCTTCAACCT CGTGAAGCAG GGCGAGCTGA TCCCGGTCGA GGAGGAGAGC 
TTCAACCACA CCGCCCGCGT CTGCGACATC GGCCCGGACG GCATGATCTA CATCACGCTC 
GGTCAGCCCT TCAACGTGCC CGCGCCCGAG AAGCGCGAGC TCTACGACAA GTGGGGCATC 
GGCGGCATCG TGCGGATGAA CACCGACGGC ACCGGGCGCG AGGTCTTCGC CCGCGGCATC 
CGCAACTCGG TCGGCATGGA CATCGACCCC GAGACCGGCA ACGTCTGGTT CACCGACAAT 
CAGGTGGACG GGATGGGCGA CGACATTCCG CCGGGCGAGA TCAACCGCGC CACGGAGCCG 
GGCCAGAACT TCGGCTTCCC CTGGTATGGC GGCGGCAGCA TCCGCACCAA CGAATACAAG 
GACGAGGAGC CGCCCGCCGA TGCCGTGATG CCCGTGGTCG AGATGGACGC CCATGCGGCC 
GATCTCGGGA TGATGTTCTA CACGGGCTCG ATGTTCCCCG AGGAATATCG CGGCGCCATC 
TTCTCGGCGC AGCACGGCTC GTGGAACCGC ACCACCCCCG TGGGCGCGCG CGTCATGGTC 
ACGACCGTCG CCGAGGACGG CACCGCCACG ACGAAGCCCT TCGCCGAGGG CTGGATCGAC 
GAGAACGGGG AGTATCTCGG CCGGCCCGTC GATGTGGCGC AGCTCCGCGA CGGCTCGATC 
CTCGTCTCGG ACGATCTCGT GGGCGCGATC TACCGCATCT GGTATCAGCC GGAATGA

Protein sequence

MKRLMTSLAA LSLTAGLAHA QAADVPDNLE KLSNFQSTGA TDFTFVEQGG DFADGIKRNL 
ERIKLPQGFR IGLYAVVPDA RHMAVGPQGI VTFVGTRKDK VWAVTDRNKD RVADEVKDFA 
PSLRFTIPNG PCFSKDGFLY IAEQNRVLLF PAAEFFYESG DVAAFNLVKQ GELIPVEEES 
FNHTARVCDI GPDGMIYITL GQPFNVPAPE KRELYDKWGI GGIVRMNTDG TGREVFARGI 
RNSVGMDIDP ETGNVWFTDN QVDGMGDDIP PGEINRATEP GQNFGFPWYG GGSIRTNEYK 
DEEPPADAVM PVVEMDAHAA DLGMMFYTGS MFPEEYRGAI FSAQHGSWNR TTPVGARVMV 
TTVAEDGTAT TKPFAEGWID ENGEYLGRPV DVAQLRDGSI LVSDDLVGAI YRIWYQPE