Gene Rcas_3154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3154
Symbol
ID	5540652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4094845
End bp	4095897
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	59%
IMG OID	640895275
Product	aldose 1-epimerase
Protein accession	YP_001433226
Protein GI	156743097
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATCA TTTGCGAGTC CTTTGGCGCT ATCGACGGTC AGACGGTCGA TCGTTTCACG 
CTGAGCAGCG ACTCCGGCAT CGAAGCGCAG ATCATCACGT ATGGCGGCGC GCTCGTGTCG 
CTCCGCGCTC CGGATCGTCA TGGTCAACAG GGAGACGTCG TCGTCGGTTT CGATACCCTG 
ACCCCCTACC TGAACAATCC GGCATATATC GGCAGCCTGA TCGGTCGTTT CGCAAACCGG 
ATCGCCAATG GCGCCTTCTC GCTTGGCGGC ACGACGTATC ACTTGGCGCG CAACCATGGC 
GGGCATCACC TCCACGGCGG TCTCACCGGC TTCGATAAAG TCATCTGGCG GGCACGCCCC 
ATTTCCGACG CCGCTGAACC AGCACTGGAA CTGACATACT TCAGCCGCGA CGGAGACGAA 
GGGTATCCGG GTAATCTGAA CGTCACCGTA ACGTACATGC TGACTGGTGA TGGCGCGCTG 
CGCATCGATT ATCTTGCGAC GACCGACCGC GCCACGGTGG TCAATCTGAC GCACCATGCG 
TATTTCAATC TGAGCGGCAG CGGAAATATT CTGCGCCATG AGTTGCAGTT GTTCGCCGAT 
CATTTTTTGC CCGTTGACGC ATCGCTGATC CCAACCGGCG AGATTCGCGC CGTGCATGGC 
ACGGTGATGG ATTTCACCAC GCCAACCCCA ATCGGCGCTC GCATCCCCCA TGATGATGAG 
CAGATTCGCC ATGCTCTTGG CGGGTATGAT CACACATGGA TCATCGACGG CGCCGCTGGC 
GCGTTGCGCC GCGCTGCGCG CCTCGTCGAT CCGGCGAGCG GTCGCGTGCT CGATGTGCTG 
ACCACGCATC CCGGTATTCA CCTGTATACC GGCAATTCCC TCGATGGAAC ACTGGTTGCG 
CGCAATGGAC ACGTGTTGAC CAAACATGCC GCCCTCTGCC TGGAAACCCA GCACTTCCCC 
GATTCGCCGA ACCATCCGCA GTTTCCTTCG ACAATCCTCA AGCCTGGCGA GACGTACCGC 
CATATAACGG TCTTTCGCCT GTCGGTGGAA TAA

Protein sequence

MSIICESFGA IDGQTVDRFT LSSDSGIEAQ IITYGGALVS LRAPDRHGQQ GDVVVGFDTL 
TPYLNNPAYI GSLIGRFANR IANGAFSLGG TTYHLARNHG GHHLHGGLTG FDKVIWRARP 
ISDAAEPALE LTYFSRDGDE GYPGNLNVTV TYMLTGDGAL RIDYLATTDR ATVVNLTHHA 
YFNLSGSGNI LRHELQLFAD HFLPVDASLI PTGEIRAVHG TVMDFTTPTP IGARIPHDDE 
QIRHALGGYD HTWIIDGAAG ALRRAARLVD PASGRVLDVL TTHPGIHLYT GNSLDGTLVA 
RNGHVLTKHA ALCLETQHFP DSPNHPQFPS TILKPGETYR HITVFRLSVE