Gene BMA10229_A2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2551
Symbol	waaC
ID	4793462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	+
Start bp	2596777
End bp	2597844
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	71%
IMG OID
Product	heptosyltransferase I
Protein accession	YP_001028509
Protein GI	124386486
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCGGCCG CCCGGCGCGA TAAAATCCGT CCTTTCGGTC TGTGCCGGCC ACCGCCGGCC 
CTTTTTTTCA GCGTGCAAAA AATTCTGATC GTGCGCGTGT CGTCGCTCGG CGATGTCGTG 
CATAACATGC CGGTGATCGC CGATATCCGC CGGCGTCACC CCGATGCGCA GATCGACTGG 
CTCGTCGAGG AAGGCTTCGC CGATCTCGTG CGGCTCGTCG ACGGTGTGCG CGACGTGCTG 
CCGTTCTCGC TGCGGCGCTG GCGCAAGCGC TTGAGCGCGT CGCAAACGTG GCGCGAGATC 
CGCGCGTTCC GGCGGCGCCT CGCCGAGGAG CGCTACGACC TCGTGATCGA CTGCCAGGGG 
CTCATCAAGA CCGCGTGGGT CGCGAGCTGG GCGCGCGGGC CGCTTGTCGG CCTCGGCAAC 
CGCACCGACG GCGCCGGCTA CGAGTGGCCG GTGCGTTTCT TCTACGACAG GCGGGTGCCG 
ATCGCGCCGC GCACGCACGT CGTCGAGCGC TCGCGGCAGC TCGTCGCGGC GGCGCTGGGA 
GACCCCGCGC CGGCGCCCGG CGATCCGATC GATTTCGGCC TCGACACGCA TGGCGCGGCG 
CGCGCGCTCG CGGCGCTCGA TTTGAATCTG CCGGTGCCCT ACGTGGTATT CGTGCACGCG 
ACCTCGCGCG CCGACAAGCA GTGGCCCGAC GAAGCGTGGA CCGGCCTCGG CGAGGCGCTC 
GTGCGGCGCG GCGCGTCGCT CGTGCTGCCG TGGGGCAGCG ACGCCGAGCG CGCGACGAGC 
GAGCGCCTCG CGAAGGCGTT CGGCGCGGCG GCGATCGTGC CGCCGAAGCT GTCGCTGCCC 
GTGGTCGTCG GCCTCGTCGA CGGCGCGGCG GCGACGGTCG GCGTCGATAC CGGCCTCGTC 
CACATCGCGG CGGCGCTTAA GCGTCCGACC GTCGAACTGT ACAATTTCGC GACAGCCTGG 
CGCACGGGCG GCTACTGGTC GCCCAACGTC GTCAATCTCG GCACCGCCGG CGCGCCGCCG 
TCCCTTTCGC AGGCGAAGGA CGCACTCGCG TCGTTCGGCC TCTTGTAA

Protein sequence

MSAARRDKIR PFGLCRPPPA LFFSVQKILI VRVSSLGDVV HNMPVIADIR RRHPDAQIDW 
LVEEGFADLV RLVDGVRDVL PFSLRRWRKR LSASQTWREI RAFRRRLAEE RYDLVIDCQG 
LIKTAWVASW ARGPLVGLGN RTDGAGYEWP VRFFYDRRVP IAPRTHVVER SRQLVAAALG 
DPAPAPGDPI DFGLDTHGAA RALAALDLNL PVPYVVFVHA TSRADKQWPD EAWTGLGEAL 
VRRGASLVLP WGSDAERATS ERLAKAFGAA AIVPPKLSLP VVVGLVDGAA ATVGVDTGLV 
HIAAALKRPT VELYNFATAW RTGGYWSPNV VNLGTAGAPP SLSQAKDALA SFGLL