Gene BMA10229_A2601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2601
Symbol	hemL
ID	4792201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	2641034
End bp	2642317
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	71%
IMG OID
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_001028558
Protein GI	124384030
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAACA ATCAAACTCT CTTCGAACGC GCCCAGCGAA CCATCCCGGG CGGCGTCAAT 
TCGCCGGTGC GGGCGTTCCG TTCGGTCGGC GGCACGCCGC GCTTCGTCGC GCGTGCGCAG 
GGCGCGTACT TCTGGGACGC GGACGGCAAG CGCTACATCG ACTACATCGG CTCGTGGGGG 
CCGATGATCG TCGGCCACGT GCACCCGGAC GTGCTCGCGG CCGTGCAGCG CGTGCTCGCC 
GACGGCTTCT CGTTCGGCGC GCCCACCGAA GCCGAAATCG AGATCGCCGA GGAGATCTGC 
AAGCTCGTGC CGTCGATCGA GCAGGTGCGG ATGGTGTCGA GCGGCACCGA AGCGACGATG 
AGCGCGCTGC GCCTCGCGCG CGGCTTCACC GGCCGCAGCC GGATCGTCAA GTTCGAGGGC 
TGCTATCACG GCCATGCGGA CAGCCTGCTC GTGAAGGCGG GCTCGGGCCT GCTCACGTTC 
GGCAATCCGA CCTCGGCGGG CGTGCCGGCC GACGTCGCGA AGCACACGAC CGTGCTCGAG 
TACAACAACG TCGCGGCGCT CGAGGAAGCA TTCGCCGCGT TCGGCGGCGA GATCGCCGCG 
GTGATCGTCG AGCCCGTCGC GGGCAACATG AACCTCGTGC GCGGCACGCC GGAGTTCCTG 
AACGCGCTGC GCGCGCTCAC CGCGAAGCAC GGCGCCGTGC TGATCTTCGA CGAAGTGATG 
TGCGGCTTTC GCGTCGCGCT CGGCGGCGCG CAGCAGCACT ACGGGATCAC GCCGGATCTG 
ACCTGCCTCG GCAAGGTGAT CGGCGGCGGC ATGCCGGCCG CCGCGTTCGG CGGCCGCGGC 
GACATCATGT CGCACCTCGC GCCGCTCGGC GACGTCTATC AGGCGGGCAC CCTGTCGGGC 
AACCCGGTCG CGGTCGCGGC GGGCCTCGCG ACGCTGCGGC TGATCCAGGC GCCGGGCTTT 
CACGATGCGC TCGCCGACAA GACCCGGCGG CTCGCCGACG GCCTCGCGGC CGAGGCGCGC 
GCGGCGGGCG TGCCGTTCTC GGCCGACGCG ATCGGCGGGA TGTTCGGCCT CTACTTCACC 
GAGCAGGTGC CCGCGAGCTT CGCCGACGTG ACGAAGAGCG ACATCGAGCG CTTCAACCGC 
TTCTTCCATC TGATGCTCGA CGCCGGCGTG TACTTCGCGC CCTCCGCGTA CGAAGCGGGC 
TTCGTGTCGA GCGCGCACGA CGACGCGACG CTCGACGCGA CGCTCGACGC CGCCCGCCGC 
GCGTTCGCCG CGCTGCGTGC CTGA

Protein sequence

MSNNQTLFER AQRTIPGGVN SPVRAFRSVG GTPRFVARAQ GAYFWDADGK RYIDYIGSWG 
PMIVGHVHPD VLAAVQRVLA DGFSFGAPTE AEIEIAEEIC KLVPSIEQVR MVSSGTEATM 
SALRLARGFT GRSRIVKFEG CYHGHADSLL VKAGSGLLTF GNPTSAGVPA DVAKHTTVLE 
YNNVAALEEA FAAFGGEIAA VIVEPVAGNM NLVRGTPEFL NALRALTAKH GAVLIFDEVM 
CGFRVALGGA QQHYGITPDL TCLGKVIGGG MPAAAFGGRG DIMSHLAPLG DVYQAGTLSG 
NPVAVAAGLA TLRLIQAPGF HDALADKTRR LADGLAAEAR AAGVPFSADA IGGMFGLYFT 
EQVPASFADV TKSDIERFNR FFHLMLDAGV YFAPSAYEAG FVSSAHDDAT LDATLDAARR 
AFAALRA