Gene BURPS1106A_0734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0734
Symbol	aroA
ID	4899309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	713213
End bp	714568
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	67%
IMG OID	640133964
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001065016
Protein GI	126453471
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCA GCGATCGCCT CCAGCCGTCG TTCGTCGAAG TGAAGAACAC CTCGACGCTC 
AGCGGCACCA TCGATCTTCC CGCGTCGAAG AGCTCGTCGA CGCGCGCGCT CCTCACCGCG 
GCGCTCACGC CCGGCATCAG CACGATCCGC AACGTCGCGA CGGGCTTCAA CTCGAACGCG 
ATGAAGCACA ACTGCGAGCG GCTCGGCGCG TCGTTCTCGA GCGAGGGCGA CACGACGGTC 
GTCAAGGGCG TCGACGTGAT GCACGTCGAT CGCGAGATCG TCTTCGACCC GGGCAACTCC 
GGCGTCGTGC TGCGCCTGCT GATGGGCGTC GCCGGCTACC TGCCGGACAC CCGGTTCGTC 
ACGCAATACC GCTATTCGCT CGGCGTGCGC TCGCAGGCGG AGATGGTCGC CGCGCTGCGC 
CGGCTGAACG TCGAATGCGA AGCGGTCGGC CCCGAGGCGC GGCTGCCGAT CAGCATGCGC 
TCGACGCGCG CGCTCGGCAA GCACACCGAA GTGTCGTGCA AGAAGAGCTC GCAGTTCCTG 
AGCGGCCTGC TCTATCTCGG CGCGATCGGC GAGCGCGATC TCGAGATCGA CGTGGTCGAT 
CACATCACCG CGCCGTCGAT GGTGCATACG ACGATCAACA ATCTCGCGCA CGCGGGCGTC 
GCCGTCGAAT ACGACGCGGC CTTTCGCCGC TTCTTCGTGC CGGGGCGCGA TCGCTTCAAG 
CCGTCCGAGT TCACGGTCGG CGCCGATCCG GCGAGCACGG CCGCGATCCT CGCGCTGTGC 
GGCTCGCTCG CGTCGGACGT CACGCTCAAC GGCTTCTTCG AGGAAGAGCT CGGCAGCGGC 
GCGGTGATCC GCTATCTGAC CGATACCGGC ACGCTGATCG ACGAGTTGCC CGGCAACCGC 
ATCCGCATCC GGGGCGGCGC ATCGATCCGC GCGCAGGATT TCGACGGCTC GCTCGCGCCG 
GACGCGGTGC CCGCGCTCGC CGGCCGCGCG GCGTTCGCCG AAGGCACGAG CACGTTCTAC 
AACATCGAGC ATATCCGCTA CAAGGAATCG GACCGCATCT CGGATTTCCG CCGCGAACTC 
GACAAGCTCG GCGTGCGCTC CGAAGAAAAG CTCGATCAGT TGATCATCCA CGGCAATCCG 
CGCGGCTACC GCGGCGGCGC GGTCGTCGAC GGCCACTACG ATCACGGGCT CATCATGGCG 
CTCACGACGA TCGGCCTGCA CTGCGAGCAT CCGGTGCTGA TCAAGGAGCC GCATCACGTC 
GGGCAGACGT ATCCCGATTA CTTCGCCGAC ATCGGCTCGA TCGGCGCGAA CGTCGACGAG 
CTGATCTACC CGAACGTCGC CGCGGCGCGC GCATGA

Protein sequence

MTTSDRLQPS FVEVKNTSTL SGTIDLPASK SSSTRALLTA ALTPGISTIR NVATGFNSNA 
MKHNCERLGA SFSSEGDTTV VKGVDVMHVD REIVFDPGNS GVVLRLLMGV AGYLPDTRFV 
TQYRYSLGVR SQAEMVAALR RLNVECEAVG PEARLPISMR STRALGKHTE VSCKKSSQFL 
SGLLYLGAIG ERDLEIDVVD HITAPSMVHT TINNLAHAGV AVEYDAAFRR FFVPGRDRFK 
PSEFTVGADP ASTAAILALC GSLASDVTLN GFFEEELGSG AVIRYLTDTG TLIDELPGNR 
IRIRGGASIR AQDFDGSLAP DAVPALAGRA AFAEGTSTFY NIEHIRYKES DRISDFRREL 
DKLGVRSEEK LDQLIIHGNP RGYRGGAVVD GHYDHGLIMA LTTIGLHCEH PVLIKEPHHV 
GQTYPDYFAD IGSIGANVDE LIYPNVAAAR A