Gene Rcas_0163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0163
Symbol
ID	5537624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	198519
End bp	199694
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	58%
IMG OID	640892327
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001430315
Protein GI	156740186
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCGAC ATTTGTTGTG GATGATGCTG TTTCTGACGA TTGCCGCGAC GGCATTGCCT 
GGAGGGAGCG CCACATATGC CGCGCCCGGC TACGAAATCC AGGTGGTGAA GACCGGTCTC 
GATCGACCGT GGAGTATCAA TTTTGCGCCT GATGGGCGGC TATTCTTTAC TGCGCGCAAC 
AGTGGTCGCC TGTATGCCCT GAATACCGCA ACCGGCAATG TACAGACGTT CAGTGGTCTG 
CCGCCTGCCC GATTTCGCGC CGAGCAAGAA GCCGGCATGA TGGGAATGGC GCTCGACCCC 
GATTTTGCGA CAAACGGCTG GGCGTATATC TGCTACAGCT TCTTCGATAA CGACGGCAAT 
CGTCGGAACC GCCTCTCGCG GTTCACGGTC AATCCGGTAT CTGGCGCCGT TTCTGGAGAG 
CGCGTCCTGA TTGAGACGAT GGTTGGCGCA CTCTACCACA ATGGCTGTCG CGTGATCGTC 
TCGCCTGATA ACCGGTATCT GTTCGTATCG ATGGGCGATG CCACCGTTCC ATCACTCGCG 
CAGGATCTCG ACAGCACCGG CGGCAAGACC TTCCGCATCT TCAAAGACGG CAGCATTCCA 
ACTGATAACC CCTTTTACGA CAACGGTCGG ATACCGCGTT CACTGATCTG GACGTATGGG 
CACCGCAACC ATCAGGGGCT GGCATTCCAC CCGACGACCG GCGACCTCTG GAGCACCGAG 
CACGGACCGG AGATCATGGA CGAACTCAAC GTCCTGATCG CCGGGCGCAA CTACGGCTGG 
GGTTGGGGGA GCGGACCGCA TTATTGCCTG GGAACGGTCA ACTGCGGCAG TGTGCCCGAT 
TTCATGCCGC CGGTTGCAGT GTTTAACCCT GAAAGAACGG TTGCCACGTC CGACATGGTT 
TTCTACACAG GCAGCGCATT CCCTGAATGG TCTGGCGATC TCTTCTTCGT CACGTTGAAA 
ACCGGCAGGC TCTACCGCCT GAAGATCGAC AATCGCACGA TTGTCGAGCA GGAGATTCTG 
ATCGATGGTA CGTATGGTCG CCTGCGCGAT GTGACCGTTG GACCGGATGG GTTTCTGTAT 
ATATCCACCG ACGAGACAAG TGCGCAATTG CTGCGCATCC GTCCGACCAT CGAGCGCCCT 
TATCGCGTCC AACTGCCACT CGTTATGCGG GGGTAG

Protein sequence

MPRHLLWMML FLTIAATALP GGSATYAAPG YEIQVVKTGL DRPWSINFAP DGRLFFTARN 
SGRLYALNTA TGNVQTFSGL PPARFRAEQE AGMMGMALDP DFATNGWAYI CYSFFDNDGN 
RRNRLSRFTV NPVSGAVSGE RVLIETMVGA LYHNGCRVIV SPDNRYLFVS MGDATVPSLA 
QDLDSTGGKT FRIFKDGSIP TDNPFYDNGR IPRSLIWTYG HRNHQGLAFH PTTGDLWSTE 
HGPEIMDELN VLIAGRNYGW GWGSGPHYCL GTVNCGSVPD FMPPVAVFNP ERTVATSDMV 
FYTGSAFPEW SGDLFFVTLK TGRLYRLKID NRTIVEQEIL IDGTYGRLRD VTVGPDGFLY 
ISTDETSAQL LRIRPTIERP YRVQLPLVMR G