Gene BURPS1106A_A2581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2581
Symbol	benA
ID	4904300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2534768
End bp	2536135
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	67%
IMG OID	640145684
Product	benzoate 1,2 dioxygenase, alpha subunit
Protein accession	YP_001076611
Protein GI	126455683
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID	[TIGR03229] benzoate 1,2-dioxygenase, large subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCCGA TCGACCCGGA CCGCCGTGCG ACGCCGCGCC CCATCGACGA TTTCCTCGTC 
GAAGACAAGG CGCGCGGCGA CTACCGGCTG CACCGCAGCG CGTTCACCGA CGAAATGCTG 
TTCGAGCTCG AGATGAAGCA CATCTTCGAA GGCAACTGGA TCTATCTCGC GCACGAGAGC 
CAGCTCCCGA ACGCGAACGA TTACTACACG ACCACGATCG GCCGCCAGCC GATCGTGATC 
GCGCGCAACC GCCACGGCGA GCTGAACGCG TTCGTCAACG CCTGCACGCA CCGCGGCGCG 
ATGCTGTGCC GCCACAAGCG CGGCAACCGC GCGAGCTACA CGTGCCCGTT CCACGGCTGG 
ACGTTCAGCA ACGGCGGCAA GCTGCTCAAA GTAAAGGACC CCGAAGGAGC CGGCTACCCG 
GACTGCTTCA ACCGCGACGG CTCGCACGAT CTGAAGAAAG TCGCGCGCTT CGAGAACTAT 
CGCGGCTTCC TGTTCGGCAG CCTGAACCCC GAAGTCGAGC CGCTCGCCGC GCATCTCGGC 
GATGCCGCGC GCATCATCGA CATGATCGTC GATCAGTCGG CGGACGGCCT CGAGGTGCTG 
CGCGGCTCGT CGACGTACAC GTACGAAGGC AACTGGAAGC TCACCGCCGA GAACGGCGCG 
GACGGCTACC ACGTATCGGC CGTTCACTGG AACTACGCGG CGACCGTCAA CCACCGCAAG 
ACCGACGCGC AGCACGAAGA CACGATCCGC GCGATGGACG CGGGCAACTG GGGCCGGCAG 
GGCGGCGGCT TCTACGCGTT CGATCACGGC CACATGCTGC TGTGGACGCG CTGGGCGAAC 
CCGGAGGACC GGCCGAACTT CGATCGCCGC GACGAATTCG CCGCGCGCTG CGGCGGCGAC 
GTCGCCGACT GGATGATCCG GAACTCGCGC AACCTGTGCC TGTACCCGAA CGTCTATCTG 
ATGGACCAGT TCGGCTCGCA GATCCGCGTG CTGCGCCCGC TCGCCGTCGA TCGCACCGAG 
GTCACGATCT ACTGCATCGC GCCGAAGGGC GAGGCGCCCG ACGCGCGCGC GCGGCGCATC 
CGCCAGTACG AGGATTTCTT CAACGCGAGC GGAATGGCGA CGCCCGACGA TCTCGAGGAA 
TTCCGCGCGT GCCAGCAGGG CTACGCGGGC CGCGCGGTCG AATGGAACGA CATGTGCCGC 
GGCGCCTCGC ACTGGATCGA GGGCCCCGAC GAAGCGGCGC GCCGGATCGG CATCCGCCCG 
CTGATGAGCG GCGTGAAGAC CGAAGACGAA GGGCTGTACA CGGTCCAGCA CCGCTACTGG 
ATCGCGACGA TGAAGCAGGC GCTCGCCGCC GAAAGGAGCG GCGCATGA

Protein sequence

MIPIDPDRRA TPRPIDDFLV EDKARGDYRL HRSAFTDEML FELEMKHIFE GNWIYLAHES 
QLPNANDYYT TTIGRQPIVI ARNRHGELNA FVNACTHRGA MLCRHKRGNR ASYTCPFHGW 
TFSNGGKLLK VKDPEGAGYP DCFNRDGSHD LKKVARFENY RGFLFGSLNP EVEPLAAHLG 
DAARIIDMIV DQSADGLEVL RGSSTYTYEG NWKLTAENGA DGYHVSAVHW NYAATVNHRK 
TDAQHEDTIR AMDAGNWGRQ GGGFYAFDHG HMLLWTRWAN PEDRPNFDRR DEFAARCGGD 
VADWMIRNSR NLCLYPNVYL MDQFGSQIRV LRPLAVDRTE VTIYCIAPKG EAPDARARRI 
RQYEDFFNAS GMATPDDLEE FRACQQGYAG RAVEWNDMCR GASHWIEGPD EAARRIGIRP 
LMSGVKTEDE GLYTVQHRYW IATMKQALAA ERSGA