Gene Arth_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0234
Symbol
ID	4447325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	246708
End bp	248054
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	67%
IMG OID	639688030
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_829735
Protein GI	116668802
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTCCA TCACATCCAT CACCACGCAG GACGTCCGGT TTCCCACGTC CCTGGAACTC 
GATGGGTCCG ACGCAGTCAA TGTTGACCCC GACTACTCCG CCGCCTACGT CGTCATCCGC 
ACCGATGCGG GCGATGAAGG CCACGGCTTT GTGTTCAGCT GCGGCCGCGG CAGCGAAATC 
CTCACGGCGG CCATCAACTC CTACGCGGAG CTGCTGCGGG GCCGGGACAT CGAGGAACTG 
ATCTACGACC TCGGGAGCGC CTCCAAGCGC CTCATCCACG ACTCGCAGCT CCGCTGGCTC 
GGCCCGGAGA AAGGTGTCAC CCAGATGGCG GCCGGCGCGC TGGTCAGCGC GCTCTGGGAC 
ATCCGCGCCC GCCGCGAAAA CAAGCCGCTC TGGCTGCTCC TGAGCGAAAT GTCCCCGGAA 
GAGATCGTTG ACGTCGTCGA CTTCACCCAC ATCCGTGACG CCCTGAATCC GCAGCAAGCC 
CTGGACATCC TGCGCGCAGG CCAGGACGGC AAGGCGGCCC GCATCGCAAG CCTCAGGGCG 
GACGGCTACC CCGCCTACAC CACGTCGCCG GGCTGGCTGG GCTACAGCGA CGAGAAGCTG 
GTCCGGCTCA GCAAGGAGGC CGCCGCAGCG GGCTTCTCCA TGATCAAGCT CAAGGTCGGC 
GGCGACCTCG CCGACGATCG CCGCCGCATG GCCCTCGCCC GGCAGGCCGT GGGCAACCTG 
CCCATCGCCA TCGACGCCAA CCAGCGCTGG GAAGTGTCCG AGGCGATTGA ATGGGTCAAC 
CAGCTGGCCG AGTTCAATCC CTACTGGATC GAAGAGCCCA CCAGCACCGA TGACATCCTG 
GGCCATGCGG ACATCCGGAA GGGAGTAGCC CCGGTCCGCG TCGCCACAGG CGAGGCGGTA 
GCCAGCCGTA TTGTGTTCAA GCAGCTGCTT CAGGCAGGGG CCATCGACGT CCTGCAGCTG 
GATTCCACCC GGGTGGGCGG CGTCAACGAG AACATCGCCA ACCTGCTGCT GGCCGCCAAG 
TTCGGCGTCC CGGTCTGCCC GCATGCCGGA GGCGTTGGCC TGTGCGAGCT GGTCCAGCAC 
TTCTCCTTCT TCGACTACGC CGCCATCACC GGCAGCCAGG ACGGCCGCAT GATCGAATAC 
GTGGACCACC TGCACGAACA CTTCGCCGAA CCGGTGCGGA TCGTTGGCGG ACGCTATGCC 
GCCCCGGAAC GCCCGGGCAC CGGCGCCGAG ATGCTCAGTG CCTCACGGAC GCGCTGGGAA 
TTCCCCTCCG GCGCAGGGTG GCTTGAAGTG GGCAACCGCG CCGCCGTCAC CGGTGCGAGC 
CTTGCACCTG CCGGAGCCGG CCGATGA

Protein sequence

MPSITSITTQ DVRFPTSLEL DGSDAVNVDP DYSAAYVVIR TDAGDEGHGF VFSCGRGSEI 
LTAAINSYAE LLRGRDIEEL IYDLGSASKR LIHDSQLRWL GPEKGVTQMA AGALVSALWD 
IRARRENKPL WLLLSEMSPE EIVDVVDFTH IRDALNPQQA LDILRAGQDG KAARIASLRA 
DGYPAYTTSP GWLGYSDEKL VRLSKEAAAA GFSMIKLKVG GDLADDRRRM ALARQAVGNL 
PIAIDANQRW EVSEAIEWVN QLAEFNPYWI EEPTSTDDIL GHADIRKGVA PVRVATGEAV 
ASRIVFKQLL QAGAIDVLQL DSTRVGGVNE NIANLLLAAK FGVPVCPHAG GVGLCELVQH 
FSFFDYAAIT GSQDGRMIEY VDHLHEHFAE PVRIVGGRYA APERPGTGAE MLSASRTRWE 
FPSGAGWLEV GNRAAVTGAS LAPAGAGR