Gene Rsph17029_4153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4153
Symbol
ID	4894951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009040
Strand	-
Start bp	90401
End bp	91582
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	69%
IMG OID	640110544
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001041856
Protein GI	126464880
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	124
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	99
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCCA CCGCCTTCGC CCCGCGCAGC CTTGCGCCGG CCCGCATCAC TGCCGTGCGC 
GTCGCCCCCC TGCTGGGCGA GAGTCCGCAG GGCGGGTGGA GCCATGAGAT CAAGGCGGAC 
GACAGCGTGC ATGCGCTGAT CGCACTGCAC ACGGATGCCG GCATCTCGGG CTATGGCAGC 
GTCTTCACCA ACGGTGCGCT GGTACAGGCG GCGGCGGATG TTCTGACACC GCTGCTGCTG 
GGCGAGAATG CGCTGGAACC CGACCGCATC GCCGAGAAAC TGCACCAGAA CACCTTCTGG 
ATGGGGCGCG GTGGCTCGAT CACCCACACG ATCAGCGGCA TCGATATCGC CATGTGGGAC 
ATCCTTGGCC AGGCCACCGG CCTGTCGGTG GGGCGGCTCC TGGGCGGGCG GCACCGCGAC 
CGGGTGCAGC CCTACTGCTC GCTGCTGATG GACATGCCCG AGCGGATGGA AGCGGTGATC 
GCCCCGCACC GCGCGGCGGG GTTCCGCGCC TTCAAGATCG GCTGGGGGCC GTTCGGCCGG 
CGCGGCGATG CCGGGCTCGA CCGCGCCATC ATCGACGCGG CCCGCACCGC GGTCGGGGCG 
GATGCCCAGC TTCTTGTCGA TGCCGGGGCC TCGGATGCCT ATTGGCCGAA CGGTCTGAAA 
TGGGCGATGA ACACCGCCGC CATGCTGGCC GACTACGATG TCGGCTGGTT CGAGGAAGCG 
CTGCCGCCCG ATGCGATCGA GGATTTCATC GCCTTGCGTC GTATGAGCCC GGTGCCGATC 
GCCGGCGGCG AGGTGCTGAC GCGGCGCCAG AGCTTTGCCC CCTGGCTGGT GCGCGGCGCC 
TTCGACATCG TGCAGCCCGA TGTGACCAAG GTCGGCGGCA TCAGCGAGCA GCGCCGCATC 
GCCTGGATGG CGCGCGATTT CGGCATCCGC TACGTGGGCC ACGGCTGGAA CACCGCCTTC 
GGTCTGGCGG CCGATCTGCA GCTGGCCGCC GCCATGCCCG ACTGCACGCT GGTCGAATAT 
ATCGGCGGCT CGGCCTATGT CGACCGGCTG ACCACACGCC CCTTCGTCCT CGATGCCGAG 
GGCATGCTGG CGATCCCCGA TCTGCCCGGC CTCGGCGTCA GCCCCGATCC GGCATTGCTG 
GCGCGCTATA CGCCCGACCC GGAGAAATTC TTCAGCGCCT GA

Protein sequence

MTSTAFAPRS LAPARITAVR VAPLLGESPQ GGWSHEIKAD DSVHALIALH TDAGISGYGS 
VFTNGALVQA AADVLTPLLL GENALEPDRI AEKLHQNTFW MGRGGSITHT ISGIDIAMWD 
ILGQATGLSV GRLLGGRHRD RVQPYCSLLM DMPERMEAVI APHRAAGFRA FKIGWGPFGR 
RGDAGLDRAI IDAARTAVGA DAQLLVDAGA SDAYWPNGLK WAMNTAAMLA DYDVGWFEEA 
LPPDAIEDFI ALRRMSPVPI AGGEVLTRRQ SFAPWLVRGA FDIVQPDVTK VGGISEQRRI 
AWMARDFGIR YVGHGWNTAF GLAADLQLAA AMPDCTLVEY IGGSAYVDRL TTRPFVLDAE 
GMLAIPDLPG LGVSPDPALL ARYTPDPEKF FSA