Gene BMAA1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA1103
Symbol
ID	3086934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	-
Start bp	1149975
End bp	1151030
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	72%
IMG OID	637565004
Product	LysR family transcriptional regulator
Protein accession	YP_105766
Protein GI	53716728
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.130627
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCGAT TTCAGGAAAT GCAGGTTTTC GTGCGGATCG CCGAGCGGCA GAGCTTCAGC 
CGGGCGTCGG ACGATCTGCG GATTCCGCGC GCGACCGTGA CCAACCTGAT GAAGCGCATG 
GAGGCGCGGC TCGGCGCGCG GCTGCTCGAA CGGACGACGC GCACCGTGTG CCTCACGCAG 
GACGGCGAAG CCTACTACCG GCGCTGCGTG CGGCTGATCG CCGATCTGGA GGAGGCCGAG 
GGCGCGTTTC GCGCCGCGGC GCCGCGGGGG CTGCTGCGCG TGAACCTGCA GGGCACGCTC 
GCGCGCTATT TCGTCGTGCC CGCGCTGCCG GATTTTCTCG CGCGCTATCC GGGGATCCGG 
CTGCACATCG GCGAGGACGA CCGCTTCGTC GATCTGGTGC GCGAGGGCGT CGATTGCGTG 
CTGCGCTCGG GCAACCTGCA GGATTCGTCG ATGGTCGGGC GGCGGGTCGC GCAGCTCGAG 
CAGGTGACGG TCGCGAGCCC CGGCTATCTC GCGCGGCACG GCGAGCCGGC CGAGCTCGCC 
GCGCTGGCCG CGCATCGCGC GGTCGACTAC GTGTCGAGCG CGACGGGCAA GCCGATGCCG 
CTCGAATTCA CCGTCGACGG GCGCGTGACC GAGGTGCGGC TCGACGCGGC GATTTCCGTC 
GCGGGCGTCG AGCTCTACAC GGGCGCGGCC GTCGCGGGGC TCGGCATCGT GCAGGTGCCG 
CGCTACCGGA TCGCCGACGA ACTGGCCGAC GGACGCCTGA GGATCGTGCT CGGCGCGTAT 
CCGCCGCCGC CGATGCCCGT CAGCGTGCTG TATCCGCACA GCCGGCAGTT GTCGTCGCGC 
GTGCGGGCGT TCGCGCAGTG GCTGCGGGAG CGGTTCGACG CGGCGCAGGC GGGGCGGGCG 
ACGGCGCGTG CGGCGCGCCG GGCTCTTCGG GTTCCGCCGC GCGCGCGCCG TCGCCGGCTC 
GGTCGGAACC GGCGAAAGCG TTGCTATCGC GGCGGCCGCG TCGCTAGATT CGTCTTCGTT 
GTCGCGAACA CGCCCGATGC GGGGGGCACG CGATGA

Protein sequence

MDRFQEMQVF VRIAERQSFS RASDDLRIPR ATVTNLMKRM EARLGARLLE RTTRTVCLTQ 
DGEAYYRRCV RLIADLEEAE GAFRAAAPRG LLRVNLQGTL ARYFVVPALP DFLARYPGIR 
LHIGEDDRFV DLVREGVDCV LRSGNLQDSS MVGRRVAQLE QVTVASPGYL ARHGEPAELA 
ALAAHRAVDY VSSATGKPMP LEFTVDGRVT EVRLDAAISV AGVELYTGAA VAGLGIVQVP 
RYRIADELAD GRLRIVLGAY PPPPMPVSVL YPHSRQLSSR VRAFAQWLRE RFDAAQAGRA 
TARAARRALR VPPRARRRRL GRNRRKRCYR GGRVARFVFV VANTPDAGGT R