Gene Rcas_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0203
Symbol
ID	5537664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	249681
End bp	250685
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	58%
IMG OID	640892366
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001430354
Protein GI	156740225
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.387989
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGGAA CAAACGACTA TACCCATGCG TATAGCGGCG CGCGCGTGCT CATTACAGGC 
GGAATGGGGT TCATCGGTTC GAATCTGGCG CATCGCCTGG TGGAACTCGA TGCGCAGGTG 
ACTCTGGTCG ACTCACTCAT CCCGATCTAC GGCGGCAATC AGCGCAACAT CGCCGGCATC 
GAGCATCGGG TGCGCGTCAA CATCGCCGAT GTGCGCGACG AGTATTCGAT GAACTATCTG 
GTGCAAGGGC AGGATTACCT CTTCAATCTT GCCGGTCAGA CGTCGCACCT GGACTCGATG 
ACCGACCCCT ATACCGATCT TGAGATCAAC TGCCGCGCGC AGTTGTCGAT CCTCGAAGCC 
TGTCGCAAGC ACAATCCCAA CCTGAAACTG GTGTACGCTT CGACGCGCCA GATCTATGGC 
AAGCCGGATT ATCTGCCGGT CGATGAGCGC CACCTGCTCC ATCCGGTCGA TGTCAATGGC 
GTCAACAAAA TGGCCGGCGA GTGGTACCAT ATTCTCTACA ATAACGTCTA TAGCATTCGC 
GCATGCGCCC TGCGCCTGAC GAACACCTAT GGTCCGCGCA TGCGCGTCAA AGATGCGCGA 
CAAACGTTTC TCGGCATCTG GATCAAGCGC CTGATTGACG AAGAGCCGAT CCAGGTCTTC 
GGCGACGGGT CGCAGATCCG CGACTTCAAC TACGTTGATG ATGTGGTCGA AGCGATGCTG 
CTGGCAGGCG CATCGCCTGC GGCGGATGGC GGCATCTTCA ATCTGGGCAG CGACGAAACG 
ATCAACCTGC GCGACCTGGC GGCATTGCTG GTCGAAATTA ATGGCGGCGG CAGTTTTGAA 
ATTGTGCCTT TCCCACCAGA CCGCAAAGTC ATCGACATCG GCGATTATTA CGCCGATTAC 
CGCATGATCC AGGGGCGGCT CGGCTGGCGC CCCAAAGTGT CGTTGCGCGA GGGATTGCGC 
CGTACTCTCG AGTTCTATCG GCGTGAGCGC GAGTATTACT GGTAG

Protein sequence

MPGTNDYTHA YSGARVLITG GMGFIGSNLA HRLVELDAQV TLVDSLIPIY GGNQRNIAGI 
EHRVRVNIAD VRDEYSMNYL VQGQDYLFNL AGQTSHLDSM TDPYTDLEIN CRAQLSILEA 
CRKHNPNLKL VYASTRQIYG KPDYLPVDER HLLHPVDVNG VNKMAGEWYH ILYNNVYSIR 
ACALRLTNTY GPRMRVKDAR QTFLGIWIKR LIDEEPIQVF GDGSQIRDFN YVDDVVEAML 
LAGASPAADG GIFNLGSDET INLRDLAALL VEINGGGSFE IVPFPPDRKV IDIGDYYADY 
RMIQGRLGWR PKVSLREGLR RTLEFYRRER EYYW