Gene Rcas_2553 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2553
Symbol
ID	5540035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3293036
End bp	3294340
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	59%
IMG OID	640894682
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001432649
Protein GI	156742520
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00423764
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.461549
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATCA CCATCACCCG CGCCGAAGCG CGCGACGTTC GCTTCCCCAC TTCCCGCACT 
CTCGATGGAT CGGACGCCAT GAACCCCGAC CCCGACTACT CGGCGGCATA TGTGATTCTC 
CACACAAACG TCCCTGGTCT GACGGGGCAC GGGCTGACCT TTACCATCGG GCGTGGCAAT 
GAATTGTGCG TCGCCGCATG TCAGGTTTTG CTGCCGATGG TGGTGAACCG TTCCCTTGAG 
TCAATCACTG CTGACATGGG CGCGTTCTGG CATATGATCA CCGGCGACAG CCAGTTGCGC 
TGGATCGGAC CGGAGAAGGG CGTGATTCAT CTGGCGACTG CCGCCGTGGT CAATGCGGTT 
TGGGACCTGT GGGCAAAGGT TGAGCAAAAA CCGCTCTGGA AGTTGTTGAG CGATATGTCG 
CCGGAAGAAC TGGTGCGCTG CATCGATTTT CGCTACATTT CCGATGCGCT GACGCCTGAT 
GAGGCGCGTG ACATTCTGCG CCGCCAGGAG GCGACGCGCG CCAAACGCGA GGCGGAAATG 
CGCACGCACG GGTTTCCTGC CTATACGACA TCGGCGGGTT GGATCGGGTA TTCCGACGAC 
AAAGTGCGCC GGTTGTGCCG GGAAGCGATC GATGCCGGGT TCCAGCACAT CAAAATGAAG 
GTTGGACGTG ATCTCGATGC CGACCGGCGC CGCGCCCGGT TGATCCGCGA GATCATTGGA 
CCGGATCGCA AATTAATGGC AGATGCCAAC CAGGTGTGGG ATGTGCCGCA GGCGATTGCC 
TGGATGCGCG ACCTTGCAGA ATTCGACCTC TGGTGGATCG AGGAGCCAAC CAGCCCCGAC 
GATATTCTGG GTCATGCGGC GATTGCCCGC GCTGTGGCGC CGGTTGGCGT GGCAACCGGC 
GAGCATGTCC AGAACCGCAT TGTCTTCAAA CAACTGTTGC AGATGAATGC CATCAATTTC 
TGTCAGATCG ATGCCTGCCG CCTCGGCGGG GTCAACGAGG TGTTGGCGGT TATCCTGATG 
GCCGCAAAGT TTGGCGTACC GGTCTGCCCG CATGCTGGCG GTGTCGGGTT GTGCGAGTAT 
GTCCAACATC TGTCGATCTG GGATTACATC TGCGTTTCCG CATCGCTGGA GAATCGTGTG 
ATTGAATACG TCGATCATCT GCACGAGCAC TTTCTCGATC CGGTTGTCAT CCGCAATGCT 
CGCTACATGC CGCCGCAGAC GCCAGGATAC AGCATCGAAA TGAAACCGGA GTCGCTGGCA 
ATGTATGAGT ATCCTCATGG TGCGGCATGG AGCAATCTCG GTTAA

Protein sequence

MAITITRAEA RDVRFPTSRT LDGSDAMNPD PDYSAAYVIL HTNVPGLTGH GLTFTIGRGN 
ELCVAACQVL LPMVVNRSLE SITADMGAFW HMITGDSQLR WIGPEKGVIH LATAAVVNAV 
WDLWAKVEQK PLWKLLSDMS PEELVRCIDF RYISDALTPD EARDILRRQE ATRAKREAEM 
RTHGFPAYTT SAGWIGYSDD KVRRLCREAI DAGFQHIKMK VGRDLDADRR RARLIREIIG 
PDRKLMADAN QVWDVPQAIA WMRDLAEFDL WWIEEPTSPD DILGHAAIAR AVAPVGVATG 
EHVQNRIVFK QLLQMNAINF CQIDACRLGG VNEVLAVILM AAKFGVPVCP HAGGVGLCEY 
VQHLSIWDYI CVSASLENRV IEYVDHLHEH FLDPVVIRNA RYMPPQTPGY SIEMKPESLA 
MYEYPHGAAW SNLG