Gene BMA10229_A2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2036
Symbol
ID	4793776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	2063054
End bp	2064244
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_001028000
Protein GI	124384864
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGA AAGCTCACGA ACCCGCTAGT TTACCCGTTC CCGGCCCCGA CGCGCTCGCG 
CAGTCCGACG CGCTCGCCGC GTCGCTGCGC GCCGAAATCG CCGCGGCGGG CGGATGGATC 
CCGTTTTCCC GCTACATGGA GCGCGTGCTG TATGCGCCGG GCCTGGGTTA CTACAGCGGC 
GGCGCGCAGA AATTCGGCCG GCGCGGCGAC GACGGCAGCG ATTTCGTGAC CGCGCCCGAG 
CTGTCGCCGC TCTTCGCGCA GACGCTCGCG CGCCCCGTCG CGCAGGCGCT CGCCGCGAGC 
GGCACGCGGC GGGTGATGGA ATTCGGCGCG GGCACGGGCC AGCTCGCGGC GGGGCTGCTG 
AACGCGCTCG CCGCGCTCGG CGTCGAGCTC GACGAATATG CGATCGTCGA TTTGTCCGGC 
GAGCTGCGCG CGCGCCAGCG CGAGACGCTC GACGAACAGG CGTCCGGCGC CGCCGCGCGC 
GTGCGCTGGC TCGACGCGCT GCCCGAGCGC TTCGAGGGCG TGATCGTCGG CAACGAAGTG 
CTCGACGCGA TGCCGGTGCA ACTCGTCGCG AAGCATGCGC ACGGCTGGTG CGAGCGCGGC 
GTGTCGCTCG GCGATGCGGG CGCGTTCGCG TTCGCCGATC GGCCGCTCGC GCGCGCCGAG 
GACGCGGCGC GGCTCGCGGC GCTCGACGCC GACGAAGGTT ACGTGACCGA GACGCACGAC 
GCGGCGGCGG CGTTCGTCGG CACGGTCTGC GCGATGCTCG CGCGCGGCGC CGCGTTGTTC 
ATCGACTACG GTTTTCCGCG CCACGAGTAC TATCACCGGC AGCGCGCGCA GGGCACGCTG 
ATGTGCCATT ACCGGCACCG CGCGCACGGC GATCCGTTCG TCTATCCGGG GCTGCAGGAC 
ATCACCGCGC ACGTCGAATT CAGCGCCGTC TACGAGGCGG GCGTCGGCGC GGGCGCTGAG 
CTGCTCGGCT ACACGTCGCA GGCGCGCTTT CTGCTGAACG CGGGCATCAC CGACGTGCTC 
GCCGAGATCG ACCCGTCCGA CGCGCAACGC TTCCTGCCCG CCGCGAACGC GGTGCAGAAG 
CTGATTTCCG AGGCGGAGAT GGGCGAGCTC TTCAAGGTGA TCGCGTTCTC GCGCGGCATC 
GACGGCACGC TCGACGCGTT CGCGCGCGGC GATCGTTCGC ACACGCTGTA G

Protein sequence

MNPKAHEPAS LPVPGPDALA QSDALAASLR AEIAAAGGWI PFSRYMERVL YAPGLGYYSG 
GAQKFGRRGD DGSDFVTAPE LSPLFAQTLA RPVAQALAAS GTRRVMEFGA GTGQLAAGLL 
NALAALGVEL DEYAIVDLSG ELRARQRETL DEQASGAAAR VRWLDALPER FEGVIVGNEV 
LDAMPVQLVA KHAHGWCERG VSLGDAGAFA FADRPLARAE DAARLAALDA DEGYVTETHD 
AAAAFVGTVC AMLARGAALF IDYGFPRHEY YHRQRAQGTL MCHYRHRAHG DPFVYPGLQD 
ITAHVEFSAV YEAGVGAGAE LLGYTSQARF LLNAGITDVL AEIDPSDAQR FLPAANAVQK 
LISEAEMGEL FKVIAFSRGI DGTLDAFARG DRSHTL