Gene BURPS668_0801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0801
Symbol
ID	4884016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	781759
End bp	783105
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	64%
IMG OID	640126729
Product	5-enolpyruvylshikimate-3-phosphate synthase
Protein accession	YP_001057853
Protein GI	126440409
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACCTGC GTGTCGAACC GATTAAGTCG TTGGGGCGGA CAATGAGGGT TCCCGCCTCG 
AAGCCGGAAA CGCAGCGCGC GATCGTCGCC GCGAGCCTTG CCCATGGCAC CTCGATCGTG 
CGCAACGATC TGCGGTGCAT CGAAACGGAA ACGATGAAGG CCGCCTGCCG CAAGCTCGGC 
GCGACGATCG ACGAAACCGC CGATCAGTTG ACGATCACCG GCACCGGCGG CCGCTTCAGC 
ACCGACGTTC ACGTCATCGA CGCAAAAGGC TCCGGGCTCG TGTTCCGGAC GATGATGGCG 
TTGAGCAGCA TGCGCGGCAT TCCGACGATT CTCACCGGCG ACGCCACGCT GCGCCGGCGC 
GTGATGAAGC CGCTGTTCGA CGCCCTTCAT GCGCTCGGCG CGAACTTCAG CTATCTCGGC 
GACGACGGCA AGGCGCCGGT GATCAACTGG GGCAAAGCGC TCGACGGCTC GCATTGCACG 
CTGGCGGGCG ACATCAGCTC GCAGTTCGTC ACCGCGCTGC TGATGGCGGC TCCGCTCGGC 
CAGCGCAGCG TCGACATCCG GCTCACGCCG CCCGTGCTGT CCCAGTCGTA TATCGATCAA 
ACGCTCGAGT TCATGCGGCG CGCCGGAATC GACGTGCAGG CGAGCCCGGA CTACACCGCA 
TACCGCGCGT CGCCGGGCGA GTATCAGGCG TTCGACACGC ACATCAATGC GGACTTCACT 
TCGCTCTCCT ACCTTCTGAT GGCCTGCGCG CTCTTTCCGG GTACCTATCG GATCGCCGGC 
ATTCAGGAGA GGACGTTACA GGGAGAGAAG CTCTTCGTCG ATGTCGTCGA GGCGCTCGGC 
GTTCGGCTGC GCTATGCGCC GGGGCACGTG CTCGAAGTGG ACAGTTCCAA CGCAGGGCTC 
GACGGCAATT TCGAGTTCGA CGTCAGCAGC GGTCCCAATA TCATTCCGAC GCTCGTCGCA 
CTGAGTCTGT TCGTCAAGGG CAAGCTGACG GTGCGGGGCG GCTCGGTCAC GCGCTTTCAC 
AAATCGTCGC GCATCGAATC GATGGTGGGA GAAGTCCGCA AGCTGGGCGC GGATATCGAG 
ATCATCCGCC ATCCGGACGG CCATCCGGAC GGTTTCGTCA CGCGCGGCAG GGATCGTTAC 
GCGGGCGGCG TGACGCTCAG CAGCAACGGC GACCACCGCA ACTTCATGTC GCTTTTCGTC 
GCCGCGCTGC GCTTCGACAA CGCATGCAGC CTCGACGGAT ACGCCGACGT ATCGTGCTCG 
TTTCCGGACT TCATCGACCA ATTCCGCGCG CTCGGCGTGG AAAGTCTCGC CGCGGCCCAC 
TACTACGTCG CCGCCGCGGA CGACTGA

Protein sequence

MYLRVEPIKS LGRTMRVPAS KPETQRAIVA ASLAHGTSIV RNDLRCIETE TMKAACRKLG 
ATIDETADQL TITGTGGRFS TDVHVIDAKG SGLVFRTMMA LSSMRGIPTI LTGDATLRRR 
VMKPLFDALH ALGANFSYLG DDGKAPVINW GKALDGSHCT LAGDISSQFV TALLMAAPLG 
QRSVDIRLTP PVLSQSYIDQ TLEFMRRAGI DVQASPDYTA YRASPGEYQA FDTHINADFT 
SLSYLLMACA LFPGTYRIAG IQERTLQGEK LFVDVVEALG VRLRYAPGHV LEVDSSNAGL 
DGNFEFDVSS GPNIIPTLVA LSLFVKGKLT VRGGSVTRFH KSSRIESMVG EVRKLGADIE 
IIRHPDGHPD GFVTRGRDRY AGGVTLSSNG DHRNFMSLFV AALRFDNACS LDGYADVSCS 
FPDFIDQFRA LGVESLAAAH YYVAAADD