Gene BMAA0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA0749
Symbol
ID	3085921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	-
Start bp	768235
End bp	769356
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	64%
IMG OID	637564659
Product	hemagglutinin domain-containing protein
Protein accession	YP_105472
Protein GI	53717377
COG category	[U] Intracellular trafficking, secretion, and vesicular transport [W] Extracellular structures
COG ID	[COG5295] Autotransporter adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTTCTAT ACATCCGTAT GAAATATCAC CGTTTTCCCC GCTCTCATGC TCAACAAGAC 
ACCGGGCGAG CCGCATCGAC CGTTCCATTT CAGCGCTTCG CGCATCTACT ATGTTCGTCC 
ATCGCTCCGC TGGCCCTCGG CTTTTCCACG GATGCGCTCG CTATCGGACA GGCTGAAAGT 
ACGGCGTTTA ACGCGGTGAT CGATCAGATA AAAAAAGGTG ACTTTAAGTT GAAACCAGTT 
GGGGACCGCA CGCTACCAAA CAAAGTCCCG CCACCGCCAC CGCCGCCACC GCCACCGCCA 
CCGCCACCGC CACCGCCGCC GTCGCCACCG CCGCCGTCGC CACCGCCGCC GTCGCCACCG 
CCGCCGTCGC CACCGCCGCC GTCGCCACCG CCGCCGACGA CGACGCCACC GACGACGACG 
ACGCCGACAC CATCGATGCA CCCGATACAG CCGACACAAC TGCCGTCGAT TCCTAACGCG 
ACACCAACCT CAGGATCCGC GACAAACGTC ACCATCAACT TCAATTCGAC CGGTGCCTCA 
GCAATGGGCA CGAACTCTAT CGCCCTTGAC TTCCATGCAC GCGCTAAGGA CAGCGATTCG 
CTCGCGAGCG GACGGCTCGC TCATGCGAGC GGCCCCCGGT CAACCGCGAT CGGTGCCGAA 
GCAAATGCGT CCGGTCAAAA CACTGTCGCG CTCGGCGCTG GCTCCATAGC GGATCGTAAC 
AACACGGTAT CCGTCGGTCG TCACGGTGAC GAACGACAAA TAGTGCACGT CGCAGCCGGC 
ACGCAAGCCA CCGATGCCGT GAATGTCGGT CAGTTGAACC TCGCAATGTC GAACGCCAAC 
GCGTACACGA ACCAGCGCAT CGGCGATCTT CAGCAGAGCA TCACCGACAC CGCGCGCGAC 
GCGTATTCCG GCGTCGCCGC CGCGACCGCG CTGACGATGA TTCCCGATGT CGACCGCGAC 
AAGAGGGTGT CGATCGGCGT CGGCGGCGCG GTCTACAAGG GCCATCGCGC CGTCGCGCTC 
GGCGGCACCG CGCGCATCAA CGAAAACCTC AAGGTGCGGG CGGGCGTCGC GATGAGCGCG 
GGCGGCAATG CCGTGGGCAT CGGCATGAGC TGGCAATGGT AA

Protein sequence

MVLYIRMKYH RFPRSHAQQD TGRAASTVPF QRFAHLLCSS IAPLALGFST DALAIGQAES 
TAFNAVIDQI KKGDFKLKPV GDRTLPNKVP PPPPPPPPPP PPPPPPPSPP PPSPPPPSPP 
PPSPPPPSPP PPTTTPPTTT TPTPSMHPIQ PTQLPSIPNA TPTSGSATNV TINFNSTGAS 
AMGTNSIALD FHARAKDSDS LASGRLAHAS GPRSTAIGAE ANASGQNTVA LGAGSIADRN 
NTVSVGRHGD ERQIVHVAAG TQATDAVNVG QLNLAMSNAN AYTNQRIGDL QQSITDTARD 
AYSGVAAATA LTMIPDVDRD KRVSIGVGGA VYKGHRAVAL GGTARINENL KVRAGVAMSA 
GGNAVGIGMS WQW