Gene BMA10229_A2547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2547
Symbol
ID	4793240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	2591737
End bp	2592894
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001028505
Protein GI	124385756
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTTT TCCAGTCCGA CATGAGTTCC GCTTCCGCCC CGCGCATCGT TCTCGTCTGC 
AATACCGCCT GGGCGATCTA TACGTACCGG CAAGGCCTGC TTCGCATGCT GATCGCGCGC 
GGCGCGCAGG TGACCGTGCT CGCGCCGCGC GACCGCACCG TCGAGCCGCT CGTGCGCATG 
GGCTGCCGCT ACGCGGAGCT GCCCGTCGCC TCGAAAGGCA CGAGCCCGCG CGAGGACCTG 
CGCACGCTCA TCGCGCTGTA TCGGCACTAC CGCGCGATCC GGCCCGACCT CGTGTTCCAT 
TACACGATCA AGCCGAACAT CTACGGCTCG ATCGCCGCGT GGCTCGCGCG CGTGCCGTCG 
ATCGCGGTGA CGACGGGCCT CGGCTACGTG TTCATCCAGC AGAGCCACGC CGCACGCGTC 
GCGAAGCAGC TGTACCGCTT CGCGTTGCGC TTTCCGCGCG AGGTCTGGTT CCTGAACCGC 
GACGATCTGC ACACGTTCAC GCACGAGCAG CTCCTCGCGC ATCCGGCGCG CGCGCGCCTG 
CTGCACGGCG AGGGCGTCGA CCTCGAGCAG TTCGCGCTCG CGCCGCTGCC CGCGCGCGAC 
ACGTTCACCT TCGTGCTGAT CGGCCGGCTG CTGTGGGACA AGGGCGTGCG CGAATACGTC 
GATGCGGCGC GCATGCTGCG CGCGCGCTAT CCGCACGCGC GCTTCGCGCT GCTCGGCCCC 
GTCGGCGTCG ACAATCCGAG CGCGATCTCG CAGGCCGACG TCGACGCGTG GGTGCGCGAA 
GGCGTGATCG ATTACCTCGG CGAGGCGCAC GACGTACGGC CGCACATCGC CCGCGCCGAT 
TGCGTCGTGC TGCCGTCCTA TCGCGAGGGC GTGCCGCGCA CGCTGATGGA GGCCTCCGCG 
ATGGGCCGGC CGATCGTCGC GACCGACGTG CCGGGCTGCC GCGACGTCGT CGCCGACGGC 
AGCACGGGGC TGCTGTGCGC CGCGCGCGAC AGCGCGAGCC TCGCCGCGCA GCTCGCGCGG 
ATGCTCGACA TGAGCGCGGC CGAGCGGCGC GCGATGGGCG AGCGCGGCCG GAGAAAGATC 
GTCGCGGAAT TCGACGAGGC GAAGGTCGTC GAGCGTTATC ATCAGACCAT TTCGGCCCTG 
ACGGGCATCA CACTTTGA

Protein sequence

MIFFQSDMSS ASAPRIVLVC NTAWAIYTYR QGLLRMLIAR GAQVTVLAPR DRTVEPLVRM 
GCRYAELPVA SKGTSPREDL RTLIALYRHY RAIRPDLVFH YTIKPNIYGS IAAWLARVPS 
IAVTTGLGYV FIQQSHAARV AKQLYRFALR FPREVWFLNR DDLHTFTHEQ LLAHPARARL 
LHGEGVDLEQ FALAPLPARD TFTFVLIGRL LWDKGVREYV DAARMLRARY PHARFALLGP 
VGVDNPSAIS QADVDAWVRE GVIDYLGEAH DVRPHIARAD CVVLPSYREG VPRTLMEASA 
MGRPIVATDV PGCRDVVADG STGLLCAARD SASLAAQLAR MLDMSAAERR AMGERGRRKI 
VAEFDEAKVV ERYHQTISAL TGITL