Gene BMAA2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA2004
Symbol
ID	3087289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	-
Start bp	2194001
End bp	2195197
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	70%
IMG OID	637565869
Product	hypothetical protein
Protein accession	YP_106523
Protein GI	53716072
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGCCG TGGTCGCCGG CGCGCTCGTG ATGAGCGCGG CAATGGGCGT GCGGCAAACC 
TTCGGCCTTT TCATCGGGCC ATTCTCGTTC GACCACGGTT TGCCGGTGAC GACGATCGCG 
TTCGCGATCG CGCTGCACAA CCTCGTCTGG GGCGCCGCGC AGCCGTTCGC CGGCGCGGCC 
GCCGACCGCT ACGGCGCCGG GCCGCTCGTC GCGATCGGCG CGGTCGTGTT CGCGCTCGGC 
CTCGCGATCG CCGCGGTCGT GCCGACGGGC CCGATGCTCG TGCTCGGCAT AGGCGTGCTC 
GTCGGCATCG GGATCAGCTG CACGAGTTTC GGCGTGGTGC TGACCGCGGT CGGCCGCGGC 
GCGCCTGCCG AGAAGCGCAG CATGGCGATG GGCATCGCGA GCGCGGGCGG CTCGCTCGGC 
CAGGTGGCGC TCGTGCCGAT CGCGCAGTGG TTCACGTCGC ATTCGGGCAC GATGGTGTCG 
CTGTTCGTGC TGGCCGGCTG CATGATCGCG ATCGCGCCGC TCGGCGTGCT GCTCGACAAG 
AACACGCGCG GCAGCCACGT GGTCGCGCAC GAGACGGCGA CGATATCGCT GAAGGAGACG 
CTGTCGTACG CGGTGCGGCA TCGCGGCTAT TGCCTGCTGA CGCTCGGCTT CTTCACCTGC 
GGGTTCCAGC TCGCGTTCAT CGGCACGCAC TTGCCGAACT ATCTGCTGCT CTGCCACATG 
CCGGCCGGGC TCGGCGCGAC CGCGCTCGCG CTGATCGGCC TGTTCAACAT GGCGGGCAGC 
TGGGCGTGCG GCTGGCTCGG CGGGCGCTAC CGGCAGCAGC ACGTGCTCGG CTGGCTGTAC 
CTGATTCGCG GCGCGGCGAT CGCGCTGTTC TTCCTCGGGC CGAAGTCGAA TGCGTCGGTC 
GTCGTCTTCG CGGCGATCAT GGGGCTCACG TGGCTCGGCA CCGTGCCGCT CACGAGCGGG 
CTCGTCGCGA AGGTGTTCGG CACGCGGCAT CTGGGCACGC TGTTCGGCGT GTGCTTCCTG 
AGCCATCAGG TCGGCTCGTT CCTCGGCTCG TGGCTCGGCG GCTACGTGTT CGACGCGACG 
GGATCGTACT CGCTGATCTG GGGCGCGACG GCGCTCGCCG GGCTGTTCGC GGCACTGCTG 
CATTTCCCGA TCAACGACGC GCCCGCGCAT GGCGGCGCGG CCGTCGCGCG GGCTTGA

Protein sequence

MIAVVAGALV MSAAMGVRQT FGLFIGPFSF DHGLPVTTIA FAIALHNLVW GAAQPFAGAA 
ADRYGAGPLV AIGAVVFALG LAIAAVVPTG PMLVLGIGVL VGIGISCTSF GVVLTAVGRG 
APAEKRSMAM GIASAGGSLG QVALVPIAQW FTSHSGTMVS LFVLAGCMIA IAPLGVLLDK 
NTRGSHVVAH ETATISLKET LSYAVRHRGY CLLTLGFFTC GFQLAFIGTH LPNYLLLCHM 
PAGLGATALA LIGLFNMAGS WACGWLGGRY RQQHVLGWLY LIRGAAIALF FLGPKSNASV 
VVFAAIMGLT WLGTVPLTSG LVAKVFGTRH LGTLFGVCFL SHQVGSFLGS WLGGYVFDAT 
GSYSLIWGAT ALAGLFAALL HFPINDAPAH GGAAVARA