Gene BURPS1106A_A2566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2566
Symbol	catB
ID	4903647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2521118
End bp	2522251
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	72%
IMG OID	640145669
Product	muconate cycloisomerase
Protein accession	YP_001076596
Protein GI	126457415
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR02534] muconate and chloromuconate cycloisomerases

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGCAA CAGGCATCAC GATCGACCGG ATCGACACGC TGCTCGTCGA CGTGCCGACA 
GTCCGGCCGC ACAAGCTTTC GGTGGCGACG ATGAACTGCC AGACGCTCGT GCTCGTGCGC 
GTCCGATGCT CGGACGGTAT CGAGGGCGTC GGCGAAGGCA CGACGATCGG CGGTCTCGCG 
TACGGCGAAG AAAGCCCCGA GAGCATCAAG ACGAACATCG ACGCCTATTT CGCGCCGATG 
CTGCGAGGCG CGGACGCGAG CCGCCCGGGC GCCGCGATGG CGCGCGTGCG CAAGCTGCTC 
CAGGGCAACC GCTTCGCGAA GTGCGCGCTC GAGACCGCGC TGTTCGACGC GCACGCGCGC 
CGGCTCGGCG TGCCGCTGTC CGAATTGCTC GGCGGCAGGA CGACCGACGC GCTCGACGTC 
GCGTGGACGC TCGCGAGCGG CGACACCGCG CGCGACATCG CGGAGGCTGA GGCGATGCTC 
GAAGCGCGCC GCCATCGCGC GTTCAAGCTG AAGATCGGCG CGCGCGCGGT GGCCGACGAC 
GTCGCGCATG TCGTCGCGAT CAAGCGCGCG CTCGGCGAGC GCGGCGACGT GCGCGTCGAC 
GTGAACCAGG CATGGACCGA AAGCGAGGCC GTGTGGGCCG GCGCGCGGCT CGCGGACGCG 
GGCGTGAGCC TCGTCGAGCA GCCGATCGCC GCGGCCAATC GCGCGGGCCT GAAGCGCCTC 
ACCGCGCTCG CGCACATCCC GATCATGGCC GACGAGGCGC TGCACGGCCC CGTCGACGCA 
TTCGCGCTCG CGCGCGAGCG CGCGGCCGAC GTGTTCGCGG TGAAGATCGC ACAATCGGGC 
GGCCTGCAGG GCGCGGCCGC CGTCGCGGCG ATCGCCGCCG CGGCCGGCAT CGAACTGTAC 
GGCGGCACGA TGCTCGAAGG CGCGGCCGGC ACGATCGCGT CCGCGCAACT GTTCAGCACG 
TTCGGCGCGC TCGAGTGGGG CACCGAGCTG TTCGGCCCGC TGCTGCTGAC CGAGGAGATC 
CTCGTCGAGC CGCTGCGCTA CGAGGATTTC AAGCTGCACC TGCCGAGCGC CCCCGGCCTC 
GGCATCGCTT TCGACTGGGC CCGTATCGAG CGGATGCAAC GCCGGGCCCG CTGA

Protein sequence

MIATGITIDR IDTLLVDVPT VRPHKLSVAT MNCQTLVLVR VRCSDGIEGV GEGTTIGGLA 
YGEESPESIK TNIDAYFAPM LRGADASRPG AAMARVRKLL QGNRFAKCAL ETALFDAHAR 
RLGVPLSELL GGRTTDALDV AWTLASGDTA RDIAEAEAML EARRHRAFKL KIGARAVADD 
VAHVVAIKRA LGERGDVRVD VNQAWTESEA VWAGARLADA GVSLVEQPIA AANRAGLKRL 
TALAHIPIMA DEALHGPVDA FALARERAAD VFAVKIAQSG GLQGAAAVAA IAAAAGIELY 
GGTMLEGAAG TIASAQLFST FGALEWGTEL FGPLLLTEEI LVEPLRYEDF KLHLPSAPGL 
GIAFDWARIE RMQRRAR