Gene BURPS668_A3097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3097
Symbol	tyrB
ID	4888353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2935446
End bp	2936663
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	70%
IMG OID	640133033
Product	aromatic amino acid aminotransferase
Protein accession	YP_001064088
Protein GI	126444155
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1448] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGAAC ATCTTCCCGC CCATCCCGGC GACCCGATCC TGTCGCTGTT CCAGGCGTTT 
CAGCGCGATC CCGAGCCGCG CAAGGTCAAT CTGAGCATCG GCCTTTACTA CGACGAAAAC 
GGCGCCGTGC CGGTGCTCGA CAGCGTGCGC GCGGCGGCGG CGCGGCTGGC CGCGCGGGAC 
GACGCCCACA CGTATCTGCC GATGGAAGGC ATGGCCGACT ACCGGCGCGC GCTGCAGGCG 
CTCGTGTTCG GCGCGAACAG CGCCGCGCTG CGCGAACAGC GGATCGCGAC CGTGCAGACG 
GTAGGCGGCT CCGGCGCGCT GCGCCTCGGC GCGGATCTGC TCAAGCGCTA TTTCCCCGAC 
AGCGCGATCT GGATCGGCGA TCCGACGTGG GACAACCACC GCGTGCTGTT CGCCGCGGCG 
GGACTCGACG TGCATACGTA TCCGTATTAC GACGCGGCGA CGAACGGCGT GCGCTTCGAC 
GCGATGATGG CGACGCTCGA CACGCTGCCC GCGCGCGCGA TCGTGCTGCT GCAGCCGTGC 
TGCCACAACC CGACGGGCAT CGATCTGTCG CGCGGGCAGT GGCGCGAGAT CGCCGCGCTG 
TGCGAGCGGC GCGCGCTGAT TGCGTTTCTC GACATCGCGT ATCAGGGCTT CGGCGACGGC 
CTCGACGACG ACGCGTGGCC GATCCGCGCG ATGGCCGATG CGGGGCTGCC CGTGTTTGTC 
AGCCATTCGT TCTCGAAGAA CTTCTCTCTG TACGGCGAAC GCTGCGGCGG GCTGTCGATC 
GCATGCGCGA ACGAACGCGA AGCCGCACGG GTGCTGAGCC AGATCCAGGC GGGCGTGCGC 
CGCGTCTATT CGAGCCCGCC GCTGCACGGT GCGCGCCTCG TCTCGACCGT GCTGAACGAT 
CCGGCGCTCG CGCGGCAATG GGACCGCGAC GTCGCCGCGA TGCGCGCGCG AATCAAGCGG 
ATGCGCACCG CGCTCGCCGC GCGGCTCGCG GCGCGCGTGC CCGGCGCGTC GTTCGACTAT 
CTCGTCGAGC AGCGCGGGAT GTTCAGCTAC ACGGGGCTCG CGCCCCATGA GGTCGACGCG 
CTGCGCGAGC ACGACGGCGT CTATCTGCTG CGCTCCGGCC GCGCATGCAT CGCGGGGCTG 
AGCGATGCGA ACGTCGACCA TGTCGCGAAC GCGATCGCCG CGGTGTTGAA GGCGCGGCGA 
GCGCGCGCCG CGGCGTGA

Protein sequence

MFEHLPAHPG DPILSLFQAF QRDPEPRKVN LSIGLYYDEN GAVPVLDSVR AAAARLAARD 
DAHTYLPMEG MADYRRALQA LVFGANSAAL REQRIATVQT VGGSGALRLG ADLLKRYFPD 
SAIWIGDPTW DNHRVLFAAA GLDVHTYPYY DAATNGVRFD AMMATLDTLP ARAIVLLQPC 
CHNPTGIDLS RGQWREIAAL CERRALIAFL DIAYQGFGDG LDDDAWPIRA MADAGLPVFV 
SHSFSKNFSL YGERCGGLSI ACANEREAAR VLSQIQAGVR RVYSSPPLHG ARLVSTVLND 
PALARQWDRD VAAMRARIKR MRTALAARLA ARVPGASFDY LVEQRGMFSY TGLAPHEVDA 
LREHDGVYLL RSGRACIAGL SDANVDHVAN AIAAVLKARR ARAAA