Gene Caci_5041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5041
Symbol
ID	8336395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5781965
End bp	5783074
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	71%
IMG OID	644958140
Product	Mandelate racemase/muconate lactonizing protein
Protein accession	YP_003115742
Protein GI	256394178
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR01928] o-succinylbenzoic acid (OSB) synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTCG AGCGCGTCGA ACTGCGCCGG ATCGGCATCC CCCTGGCCAC GCCCTTCCGG 
ACCTCGCTGG GCCTTGAGCT GGACCGCGAC ATCCTGATCC TGCGTGCCGA CACCTCCGAG 
GGACCGGGCT GGGGCGAGTG CGTCGCCATG CCGGAGCCCG GATACTCCGA GGAGTACCTC 
GACGGCGCCG CGCACGTCAT CCAGCGCTTT CTCCTGCCGG CGGTGGCAGC ACTCGACGAC 
CTCACGCCGG CCCGCGCGGC TGCCGCGATG GCGGCGTTCC CCGGCAACCC CATGGCCAAG 
GCGACGGTCG AGATGGCGGT CATGGACGCC TGGCTCCGCG CGCGCCGAAG CTCCTACGCC 
GACCATCTCG GCGCGGTGCG CTCAACCGTG GAAAGCGGGG TGTCGGTCGG CATCGCCGAT 
ACGATCGATC AACTCCTCGC CGAGGTCTCA GGCTACGTGG ATCAGGGGTA CCGCCGCATC 
AAGCTGAAGA TCGAGCCGGG CTGGGACCTC GAACCGGTCC GAGCGATCCG CGAGCGCTTC 
CCCGACATCG CGCTCCAAGC CGACGCCAAC GCCGCCTACA CCTTCGCCGA TGCCCGCCAC 
CTGGCCGCCC TGGACGCGTT CGACCTGGTG ATGCTCGAGC AGCCGCTGGG CACCGCGGAC 
GTGCGCGACC ACGCCGCGCT GGCGCGCATG CTACGCACCC CGATCTGCCT GGACGAGTCC 
ATCACGTCCG CGCGCAGCGC CGCCGACGCC ATCGCGCTGG GCGCGTGCGC GATCGTCAAC 
ATCAAGGCGG GCCGGGTCGG CGGCTACCTG GAAGCGCGGC GGATCCACGA CGTCTGCGCC 
GCGCACAGCG TGCCGGTGTG GTGCGGCGGG ATGCTGGAAA CCGGGCTCGG GCAGGCTGCC 
AACCTGGCGC TCGCGGCGTT GCCGGGCTTC ACGATGCCCG CCGACATCGC GCCGTCCGCG 
CGCTACTTCG CCACCGACGT CACGGCGCCG ATCACGATGA GCGAGGGCCG GATCGCGGTT 
CCGGACGGAC CGGGTCTGGG GCTGGACCCG ATCCCGGAGA TCCTCGAGGG CTACACGACC 
GACGTCGTCA CCATCACCCG GTTCGGCTGA

Protein sequence

MKLERVELRR IGIPLATPFR TSLGLELDRD ILILRADTSE GPGWGECVAM PEPGYSEEYL 
DGAAHVIQRF LLPAVAALDD LTPARAAAAM AAFPGNPMAK ATVEMAVMDA WLRARRSSYA 
DHLGAVRSTV ESGVSVGIAD TIDQLLAEVS GYVDQGYRRI KLKIEPGWDL EPVRAIRERF 
PDIALQADAN AAYTFADARH LAALDAFDLV MLEQPLGTAD VRDHAALARM LRTPICLDES 
ITSARSAADA IALGACAIVN IKAGRVGGYL EARRIHDVCA AHSVPVWCGG MLETGLGQAA 
NLALAALPGF TMPADIAPSA RYFATDVTAP ITMSEGRIAV PDGPGLGLDP IPEILEGYTT 
DVVTITRFG