Gene BMAA2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA2022
Symbol
ID	3087561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	+
Start bp	2209220
End bp	2210878
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	69%
IMG OID	637565887
Product	putative cholesterol oxidase
Protein accession	YP_106538
Protein GI	53715937
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGC AGTCCTACGA TTACGACTAC GTCGTGGTCG GCTCCGGCTT CGGCGGCAGC 
GTCTCGGCGC TGCGTCTGTC CGAGAAAGGC TATCGTGTGC TCGTGATCGA GCAGGGCCGT 
CGCTGGACGC CCGAGAACCT GCCGGAAAGC ACGTGGAACC TGTCGCGCTG GCAATGGCGC 
CCCGCGCTCG GGCTGCACGG CTTCTTCAGC ATGCGCTTTT TCAGGCACGT CGTCGTGCTG 
CACGGCAATG CGGTGGGCGG CGGCTCGATC ACGTACGCGA ACACGCTGCT CGTGCCGCCC 
AACAAGGTCT GGCGCGAGGG CACATGGGCC GGCCTCGAGG ACTGGGAACG CGTGATGCCC 
GCGCACTACG CCACCGCGAA GCGCATGCTC GGCGTCGTCA CGAACCGGCG AATGGATGCG 
GCCGACTTCC GGCTGAAGGA CATGGCGAAG CTGATCGGCG TCGAGAAGAG CTTCTATCCG 
ACCGAGGTCG GCGTGTTCTT CGGCGACGAC GCCGACGCGC CCGGCACGCG CTACGCCGAT 
CCGTACTTCG GCGGCGCGGG CCCGGAGCGC ACGTCGTGCA TCGGCTGCGG CGGCTGCATG 
GTCGGCTGCC GCCACGGCGC GAAGAACACG CTCGACCGCA ATTACCTGTA TCTCGCCGAG 
CGCCTCGGCG CGCAGGTGCG CGAGCAGACG AAGGTCGTCG ACGTGCGCCC GCTCGACGCG 
CGCGCCGACG GCGCGGCGGG CTACGCGGTC GAAGCGGTGT CGCTCGCGGC GGGCGCGCGC 
GGCGCGAAAA GCCGCCTCAC GTGCCGCGGC GTCGTGTTCG CCGCATCCTC GCTCGGCACG 
CAGGATCTGC TGATGCGCCT GAAGGAAAAG GGCTCGCTGC CCCGGCTATC GGACGCGCTC 
GGCAAGCGCG TGCGCACGAA CGCCGAATCG CTGATCGGCG TGCGCTTTCC GAAATCGCGC 
GTCGATCTGT CGAAGGGCGT GGCGATCGGC TCGGGCATCT ACATCGACGA GCACACGCAC 
ATCGAGGCCA CCCGCTATCC TTCGGGCTCC GACACGATGG GGCTGCTCAC GACCGTGCTC 
ACGCGCGGCG CGCCGGGCGG TTTGCGTGTG CTCGTGTGGC TCGGCGCGCT CGCGAAGCTC 
GTTCTCACGC GACCGCTGAG CGCGTGGCGG ATGATCGACC CGCGCGGCTT CGCGCGCGAG 
ACGATGATCT TCCTCTGCAT GCAGACGCTC GAAGGACACC TGACGATGCG CCTGAAGCGC 
CGCTGGTTCT GGCCGTTCTC GAAGCAGCTC GCGACCTCCG GCGCGAAGAT CCCCGCCTAC 
ATTCCGGCCG CGAACGACTT CGCGCAGAAG GCCGCGCGCG CGCTCGGCGG CGTGCCGATG 
ACCTCGCTCA CCGAGATCCT GCTGAACGTG CCGATGACCG CGCATTGCAT GGGCGGCGCG 
GCGATGGCGC GCGACGCGCG CGACGGCGTG TGCGACGGCC GCAGCCGCGT GTTCGGCTAT 
CGGAACATGT ACGTCTGCGA CGGCTCGGTG CTCGGCGCGA ACCTCGGCGT CAACCCGAGC 
CTCACGATCA CGGCGCTCGC CGAGCATGCG ATGAGCCACG TGCCCGCCGC GCGCGAGCAG 
CGGTGGGACA GTACCGCGGA GACGCCTGTC GCGGCATGA

Protein sequence

MKQQSYDYDY VVVGSGFGGS VSALRLSEKG YRVLVIEQGR RWTPENLPES TWNLSRWQWR 
PALGLHGFFS MRFFRHVVVL HGNAVGGGSI TYANTLLVPP NKVWREGTWA GLEDWERVMP 
AHYATAKRML GVVTNRRMDA ADFRLKDMAK LIGVEKSFYP TEVGVFFGDD ADAPGTRYAD 
PYFGGAGPER TSCIGCGGCM VGCRHGAKNT LDRNYLYLAE RLGAQVREQT KVVDVRPLDA 
RADGAAGYAV EAVSLAAGAR GAKSRLTCRG VVFAASSLGT QDLLMRLKEK GSLPRLSDAL 
GKRVRTNAES LIGVRFPKSR VDLSKGVAIG SGIYIDEHTH IEATRYPSGS DTMGLLTTVL 
TRGAPGGLRV LVWLGALAKL VLTRPLSAWR MIDPRGFARE TMIFLCMQTL EGHLTMRLKR 
RWFWPFSKQL ATSGAKIPAY IPAANDFAQK AARALGGVPM TSLTEILLNV PMTAHCMGGA 
AMARDARDGV CDGRSRVFGY RNMYVCDGSV LGANLGVNPS LTITALAEHA MSHVPAAREQ 
RWDSTAETPV AA