Gene BMASAVP1_A1481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1481
Symbol	aroC
ID	4681488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	1452373
End bp	1453482
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	71%
IMG OID	639845751
Product	chorismate synthase
Protein accession	YP_992812
Protein GI	162139484
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.470447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGGCA ACACCCTCGG CACGCTTTTC ACTGTCACGA CCTTCGGCGA ATCGCACGGC 
CCCGCGATCG GCTGCGTGAT CGACGGCTGC CCGCCGGGCA TGGCGCTCAC GGAAGCCGAC 
GTCCAGCTCG AGCTCGACCG CCGCAAGCCC GGCACGTCGC GCCACGTCAC GCAGCGTCAG 
GAGCCCGACC AGGTCGAGAT CCTGTCCGGC GTGTTCGAGG GCGTGACGAC CGGCGCGCCG 
ATCGCGCTCC TGATCCGCAA CACCGACCAG CGCAGCAAGG ACTACGGCAA CATCGCCGAG 
ACGTTCCGCC CGGGCCATGC CGATTACACC TACTGGCAGA AGTACGGCGT GCGCGACTAT 
CGCGGCGGCG GCCGCTCGTC CGCGCGGCTG ACGGCGCCCG TCGTCGGCGC CGGCGCGATC 
GCGAAGAAGT GGCTGCGCGA GCGCTTCGGC GTCGAGGTGC GCGGCTACAT GAGCGCGCTC 
GGCGAAATCG AGATCCCGTT CGTCGACTGG TCGCACGTGC GCGAGAACCC GTTCTTCGCG 
CCGAACGCCG ACATCGTGCC GCAACTCGAG GACTACATGG ACGCGCTGCG CAAGGACGGC 
GATTCGATCG GCGCGCGCAT CGATGTCGTC GCGTCGGGCG TGCCGGTCGG CTGGGGCGAG 
CCGCTGTTCG ACCGGCTCGA CGCCGACATC GCGCACGCGA TGATGGGGAT CAACGCGGTG 
AAGGGCGTCG AGATCGGCGC GGGTTTCGCG AGCGTCGCGC AGCGCGGTTC GGTGCACGGC 
GACGAGCTGA CGCCGGACGG CTTCGTCGGC AATCACGCGG GCGGCGTGCT CGGCGGCATC 
TCGACGGGGC AGGACATCAC GGTGTCGATC GCGATCAAGC CGACGTCGAG CATTCGCACG 
CCGCGCCGCT CGATCACGCG GGCGGGCGAA CCCGCCGTCG TCGAGACGTT CGGCCGCCAC 
GACCCGTGCG TCGGGATTCG CGCGACGCCG ATCGCCGAAT CGATGCTCGC GCTCGTGCTG 
ATCGATCACG CGCTGCGGCA CCGCGCGCAG TGCGGCGACG TGTCGAGCGC GACGCCGAGG 
ATCGCCGCGC GCGCGCCGGA CGCGCAATGA

Protein sequence

MSGNTLGTLF TVTTFGESHG PAIGCVIDGC PPGMALTEAD VQLELDRRKP GTSRHVTQRQ 
EPDQVEILSG VFEGVTTGAP IALLIRNTDQ RSKDYGNIAE TFRPGHADYT YWQKYGVRDY 
RGGGRSSARL TAPVVGAGAI AKKWLRERFG VEVRGYMSAL GEIEIPFVDW SHVRENPFFA 
PNADIVPQLE DYMDALRKDG DSIGARIDVV ASGVPVGWGE PLFDRLDADI AHAMMGINAV 
KGVEIGAGFA SVAQRGSVHG DELTPDGFVG NHAGGVLGGI STGQDITVSI AIKPTSSIRT 
PRRSITRAGE PAVVETFGRH DPCVGIRATP IAESMLALVL IDHALRHRAQ CGDVSSATPR 
IAARAPDAQ