Gene RPC_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1451
Symbol
ID	3973429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	1577784
End bp	1578779
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	69%
IMG OID	637924566
Product	mandelate racemase/muconate lactonizing enzyme
Protein accession	YP_531332
Protein GI	90422962
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.470419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCCA GCAAATTATC GCGACTGATC GCACGGATCG AAAGATGGCC GATTGCGGGC 
GCTTTCACGA TTAGTCGCGG TTCGAAGACC GAGGCGGTGG TGGTGGTGGC GGAGATCAGC 
CGTGGCGGCT ACGTCGGGCG GGGTGAATGC GTACCTTACG CGCGCTATGG CGAGACTCCA 
GATGCGACAT TGGCGATGAT TGAGGCGTTA GCAGGGCCGC TTGGCCGCGG AATGGATCGC 
CAGGCGCTGC AGGCTGCGCT GCCCGCCGGC GCCGCCCGCA ACGCGCTGGA CTGCGCGCTG 
CTCGATCTCG AGGCCAAGAG CAGCGGCGGC CGGGTCTGGG ATCTGCTCGG CCGTGCCGCG 
CCGCGCCCCT GCACCACCGC CTATACGATT TCGCTGGGAA CGCCCGAGGC GATGGCCGCC 
GCGGCCGCCA AGGCTGCCGG GCGGCCGCTG TTGAAGGTCA AGCTCGGCGG CACCGAGGAC 
GGAGCCAGGA TCGCGGCGGT GCGCCGGGCG GCGCCGGAAT CCGAATTGAT CGTCGATGCC 
AACGAGGCCT GGACCGCGGA CAACCTCGAA CAGAATCTGG CCGAATGCGC CGAGGTCGGC 
GTCACCCTGG TGGAGCAGCC GCTGCCCGCC GACAACGACG CGGCGCTGGC CCGGATCCGC 
CGGCCGATGG CGGTCTGCGC CGACGAGAGC GTGCATGATC TGGCGTCGCT CGAGGGTTTG 
CGCGAGCGCT ATGACGCCAT CAACATCAAG CTCGACAAGG CCGGCGGATT GACCGAGGCG 
ATAGCGATGG CCGACGCGGC GCGGGCGCAG GGCTTGGAGA TCATGGTCGG CTGCATGGTG 
GCGACCTCGC TTGCGATGGC GCCGGCGATG CTGCTGGCGC AGCAGGCCCG CTTCGTCGAC 
CTCGACGGCC CACTGCTGCT GGCCGGCGAC CGTGACGACG GGCTGCGCTA CGACGGCAGC 
ACGGTCTATC CGCCGGACCC GGAGCTTTGG GGCTGA

Protein sequence

MTSSKLSRLI ARIERWPIAG AFTISRGSKT EAVVVVAEIS RGGYVGRGEC VPYARYGETP 
DATLAMIEAL AGPLGRGMDR QALQAALPAG AARNALDCAL LDLEAKSSGG RVWDLLGRAA 
PRPCTTAYTI SLGTPEAMAA AAAKAAGRPL LKVKLGGTED GARIAAVRRA APESELIVDA 
NEAWTADNLE QNLAECAEVG VTLVEQPLPA DNDAALARIR RPMAVCADES VHDLASLEGL 
RERYDAINIK LDKAGGLTEA IAMADAARAQ GLEIMVGCMV ATSLAMAPAM LLAQQARFVD 
LDGPLLLAGD RDDGLRYDGS TVYPPDPELW G