Gene Rcas_2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2117
Symbol
ID	5539597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2720149
End bp	2721390
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	58%
IMG OID	640894251
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001432220
Protein GI	156742091
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.457647
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGATCAA CGGTCATTAC CGCAGTCCAT GCCCGTGATG TTCGCTTTCC CTTAAAGCCG 
GGCGAGGGAG TGGACGCCAT CCATACCAAC CCGCAGTACG CCTACGCAGT CACGCTGCTC 
GCCACAAATA CATCCCTGCG CGGCACGGGG CTGGCCTTCA CGCTTGGCGC CGGCACCGAA 
CTGGTCTGCG ATGCTATCCG CATGCTGGCG CAGCCGCTGG AGGGACGCGA GATCGAAGAG 
TTGATGGCCG ATTTCGGTCG TCTCACTCGT CAGATCGCCG ATCATCCACA GATGCGCTGG 
CTTGGTCCCC ATAAAGGCGT TGTGCATCTG GCGCTTGCCT CGCTGACGAA TGCCTGTTTT 
GATTTATGGG CTAAAGCGCG CGGCGTGCCG CTCTGGAAAC TGTTGCTCGA TTTGACGCCA 
GAAGCGATCA TGGCGCTTCT TGACCTGAGT TACCTGGAAG ATGTCCTCAC CCCGTCTGAG 
GCGATCAATA TGCTGTATCG TGAAATGACT CACCGCAACG AACGCGCAGC AATTCTGACG 
CAGGGATATC CCGGCTATGA CACCTCGGTC GGCTGGTTTC ATTACGATGA TCGGCAACTG 
ATCGAAAATG CGCGGCGTGC TGCGGATGCC GGTTTTTCGG CTATGAAACT GAAGGTCGGC 
TCACCCGACC CAGCCCATGA TATTCGTCGG GCGCTACTGG TCCGCGAGAC GGTAGGACGC 
GACGTGCGCA TCATGCTGGA CGCCAACCAG CAATGGACGT TGCCGATGGC GCTGCACGCC 
TGTCAGGAAC TTGCATCGAT GCAACCATAC TGGATCGAGG AGCCGACCCA TCCCGATGAT 
GTGATCGGAC ACCAAACGCT TGCGCGATCA ATTGCGCCGC TTCGGCTGGC AGTCGGCGAA 
CACCTTCCCA ATCGAGTGGT CTTCAAAAAC TATATGCAGG CCAATGCTGC TCATTTCATT 
CAAGCAGACT GCACGCGCGT CGGCGGGGTT AGCGAGTTCA TCACGGTGAG TCTGCTCGCC 
AGGCGCTTCA ACCTGCCGGT AGCGCCACAC GTCGGGGATA TGGGACAAAT TCATCAGCAC 
CTGACACTCT TCAACCGGAT TGCGCTGGGA CACGAGACCG TCTTTCTTGA GTATATCCCG 
CACCTGCGCG ATCGCTTCCG CTACCCGGCA CAGGTTGAAG ATGGCGTCTA TCGCACACCA 
CAGGAGCCAG GCAGCAGCGC CGATTTAATC GATTGCACCT GA

Protein sequence

MRSTVITAVH ARDVRFPLKP GEGVDAIHTN PQYAYAVTLL ATNTSLRGTG LAFTLGAGTE 
LVCDAIRMLA QPLEGREIEE LMADFGRLTR QIADHPQMRW LGPHKGVVHL ALASLTNACF 
DLWAKARGVP LWKLLLDLTP EAIMALLDLS YLEDVLTPSE AINMLYREMT HRNERAAILT 
QGYPGYDTSV GWFHYDDRQL IENARRAADA GFSAMKLKVG SPDPAHDIRR ALLVRETVGR 
DVRIMLDANQ QWTLPMALHA CQELASMQPY WIEEPTHPDD VIGHQTLARS IAPLRLAVGE 
HLPNRVVFKN YMQANAAHFI QADCTRVGGV SEFITVSLLA RRFNLPVAPH VGDMGQIHQH 
LTLFNRIALG HETVFLEYIP HLRDRFRYPA QVEDGVYRTP QEPGSSADLI DCT