Gene BMA10247_A1910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10247_A1910
Symbol	trpE
ID	4891286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10247
Kingdom	Bacteria
Replicon accession	NC_009079
Strand	+
Start bp	1841859
End bp	1843427
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	66%
IMG OID	640148175
Product	anthranilate synthase component I
Protein accession	YP_001079087
Protein GI	126445607
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGCGGG CGCGAGCGCA GCGCCACGCG AAACCCGGCG CGCCGCGCCG ATCGTCCCGA 
CGACAGGACC GGAACATGAC TGAACTCGAA TTCCAATCGC TTGCCAACGA GGGCTACAAC 
CGCATTCCGC TCATCGCCGA AGCGCTGGCC GACCTCGAAA CGCCGCTTTC ACTGTATCTG 
AAGCTCGCGC AGCCCGAACG CGGCGGCGCC AACTCGTTCC TGCTCGAATC GGTGGTGGGC 
GGCGAGCGCT TCGGACGCTA TTCGTTCATC GGCCTGCCCG CGCATACGCT GGTGCGCACG 
AAGAACGGCG TGTCGGAGGT CGTGACGGAC GGCCAGGTCA CCGAGACCCA CGACGGCGAC 
CCGTTCGCGT TCATCGCGAC ATTCCAGAGC CGCTTCAAGG TCGCGCAGCG CCCCGGCCTG 
CCGCGCTTCT GCGGCGGCCT CGCCGGCTAT TTCGGCTACG ACGCGGTGCG CTACATCGAG 
AAGAAGCTCG CGCACACCGC GCCGCGCGAC GATCTCGGCC TGCCCGACAT CCAGTTGCTG 
CTGACCGAGG AAGTCGCCGT GATCGACAAC CTCGCCGGCA AGCTCTACCT GATCGTCTAT 
GCCGATCCGA CGAAGCCCGA GGCGTACACG AAAGCCAAGC AACGGCTGCG CGAGCTCAAG 
CAGCGGCTGC GCGCGAGCGT CGTGCCGCCC GTCACGTCGG CGAGCGTGCG CACCGAGATA 
TATCGCGAAT TCAAGAAGGA TGACTATCTG GCCGCCGTGC GCACGGCGAA GGAATACATC 
GCGGCGGGCG AGCTGATGCA GATCCAGGTC GGCCAGCGCC TGACGAAGCC GTATCGCGAC 
AATCCGCTGT CGCTGTACCG CGCGCTGCGC TCGCTGAACC CGTCGCCATA CATGTATTAC 
TACAATTTCG GCGAATTCCA TGTCGTCGGC GCTTCGCCGG AGATTCTCGT GCGTCAGGAG 
AAGCGCGGCG ACGACCAGAT CGTGACGATC CGCCCGCTTG CCGGCACGCG GCCGCGCGGC 
AACACGCCCG AGCGCGACGC CGAGCTCGCG ACCGAACTGC TCAACGACCC GAAGGAAATC 
GCCGAGCACG TGATGCTGAT CGACCTCGCG CGCAACGACG TCGGCCGCAT CGCGGAAATC 
GGCTCGGTCC ACGTGACCGA CAAGATGGTG ATCGAGAAAT ACTCGCACGT GCAGCACATC 
GTGAGTTCGG TCGAGGGCAA GCTGAAGCCC GGCGTGACGA ACTATGACGT GCTGCGCGCG 
ACGTTCCCGG CGGGCACGCT GTCCGGCGCG CCGAAAGTCC GCGCGATGGA GCTGATCGAC 
GAGCTCGAGC CGATCAAGCG CGGGCTGTAC GGCGGCGCGG TCGGCTACCT GTCGTTCTCG 
GGCGAGATGG ATCTCGCGAT CGCGATCCGC ACGGGCCTCA TCCACAACGG CAATCTGTAC 
GTGCAGGCGG CGGCGGGCAT CGTCGCCGAC TCGGTGCCCG AATCCGAATG GCAGGAGACC 
GAGAACAAGG CGCGCGCGGT GCTGCGCGCG GCCGAACAGG TACAAGACGG CCTCGATTCC 
GATTTCTGA

Protein sequence

MLRARAQRHA KPGAPRRSSR RQDRNMTELE FQSLANEGYN RIPLIAEALA DLETPLSLYL 
KLAQPERGGA NSFLLESVVG GERFGRYSFI GLPAHTLVRT KNGVSEVVTD GQVTETHDGD 
PFAFIATFQS RFKVAQRPGL PRFCGGLAGY FGYDAVRYIE KKLAHTAPRD DLGLPDIQLL 
LTEEVAVIDN LAGKLYLIVY ADPTKPEAYT KAKQRLRELK QRLRASVVPP VTSASVRTEI 
YREFKKDDYL AAVRTAKEYI AAGELMQIQV GQRLTKPYRD NPLSLYRALR SLNPSPYMYY 
YNFGEFHVVG ASPEILVRQE KRGDDQIVTI RPLAGTRPRG NTPERDAELA TELLNDPKEI 
AEHVMLIDLA RNDVGRIAEI GSVHVTDKMV IEKYSHVQHI VSSVEGKLKP GVTNYDVLRA 
TFPAGTLSGA PKVRAMELID ELEPIKRGLY GGAVGYLSFS GEMDLAIAIR TGLIHNGNLY 
VQAAAGIVAD SVPESEWQET ENKARAVLRA AEQVQDGLDS DF