Gene BURPS1710b_2997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2997
Symbol	pheA
ID	3690076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	3302183
End bp	3303265
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	68%
IMG OID	637729453
Product	chorismate mutase/prephenate dehydratase
Protein accession	YP_334376
Protein GI	76809940
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.379619
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGACG AACTCAATTC CCGCCTGAAG CCTCTGCGCG AGCGCATCGA CGCGATCGAC 
ACGCAACTGA TCGCGCTGCT GAATCAGCGC GCGGCGGTCG CGCTCGAGGT CGGCGAGGTC 
AAGAAGCACT TCAACGCGCC CGTGTTCCGG CCGGAGCGCG AGCAGCAGGT GATCGCGCGC 
TTGCAGGACA TGAGCGCCGG GCCGCTCGCG AGCGAGCACA TCAGCGCGAT CTGGCGCGAG 
ATCATGGCGG CGAGCCGCGA TCTCGAGCAG ACGATACACG TCGCGTTCCT CGGGCCCGTC 
GGCACCTATA GCGAACAGGC GATGTTCGAC TACTTCGGCC AATCGATCGA GGGGCTGCCT 
TGCCCGTCGA TCGACGAGGT GTTCCGCTCG GTCGAGGCGG GCGCCGCGAC GTTCGGCGTC 
GTGCCGGTCG AGAATTCGTC GGAAGGCGCG GTGTCGCGCA CGCTCGATCT GCTGCTGCAT 
ACGCAGCTTC TGATCGGCGG CGAGCTGTCG CTGCCGATTC ATCACAATCT GCTCACGCAA 
ACAGGCAAGC TCGACGGCGT GAAGCGCGTG TGCGCGCATG CGCAGGCGCT CGCGCAGTGC 
CAGCAATGGC TCGCGTCGAA CGCGCCGCAT CTCGAGCGGC AGGCGGTCGC GAGCAACGCG 
GAAGCCGCGC GGCTCGCGGC CGACGACGCG ACGGTCGCCG CGATCGCGGG CGACCGCGCG 
GCGACGCACT ACGGGCTGCA GATCGCCTAT GCGCTGATCC AGGACGATCC GCACAACCGC 
ACGCGCTTCG CGGTGATCGG CCAGGAGCCG GCGGGGCCGA GCGGGCATGA CCAGACCTCG 
CTCATCGTGT CGGTGAAGAA CGAGCCGGGC GCGGTGTTCA AGCTGCTCGA GCCGCTTGCG 
CGGCACGGCG TGTCGATGAC GCGCTTCGAG TCGCGCCCGG CGCGGGTCGG CACGTGGGAG 
TATTACTTCT ACATCGACAT CGAAGGGCAT CGCGACGACG CCGCTGTCCA GGGTGCGCTC 
GCGGAGCTTG GCAGGAAGGC GGCTTTTCTG AAGATTCTCG GTTCGTATCC GCGCGCGCGG 
TGA

Protein sequence

MDDELNSRLK PLRERIDAID TQLIALLNQR AAVALEVGEV KKHFNAPVFR PEREQQVIAR 
LQDMSAGPLA SEHISAIWRE IMAASRDLEQ TIHVAFLGPV GTYSEQAMFD YFGQSIEGLP 
CPSIDEVFRS VEAGAATFGV VPVENSSEGA VSRTLDLLLH TQLLIGGELS LPIHHNLLTQ 
TGKLDGVKRV CAHAQALAQC QQWLASNAPH LERQAVASNA EAARLAADDA TVAAIAGDRA 
ATHYGLQIAY ALIQDDPHNR TRFAVIGQEP AGPSGHDQTS LIVSVKNEPG AVFKLLEPLA 
RHGVSMTRFE SRPARVGTWE YYFYIDIEGH RDDAAVQGAL AELGRKAAFL KILGSYPRAR