Gene BURPS668_1993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1993
Symbol
ID	4882856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1970451
End bp	1971461
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	640127921
Product	histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
Protein accession	YP_001059028
Protein GI	126438425
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.156629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGTTG GCGAGGCAAT GGATACCGAA GTGCAGGCGG CGGCGCAAAC CGTCTGCCTG 
GCGTTCAATG AAAACCCGGA AGCGGTGGAG CCGCGCGTGC AGGCCGCGAT TGCTGCCGCG 
GCCGCGCGGA TCAATCGCTA CCCGTTTGAT GCCGAACCGC GCGTCATGCG CAAGCTCGCC 
GAGCATTTCA GCTGTCCCGA GGACAACCTG ATGCTGGTGC GCGGCATCGA CGAATGCTTC 
GATCGAATCA GCGCCGAATT TTCGTCGATG CGCTTCGTTA CCGCATGGCC GGGCTTCGAC 
GGCTATCGCG CACGCATCGC CGTCAGCGGG CTGAGACACT TCGAAATCGG CCTGACCGAC 
GATCTGCTGC TCGATCCGAA CGATCTCGCC CAAGTCTCGC GTGACGATTG CGTCGTGCTC 
GCCAATCCTT CGAATCCGAC CGGCCAGGCG CTGAGCGCGG GCGAGCTCGA TCAATTGAGG 
CAGCGCGCGG GCAAGTTGCT GATCGACGAA ACCTACGTCG ATTATTCGTC GTTTCGCGCC 
CGCGGCCTGG CTTACGGCAA GAACGAACTG GTGTTTCGTT CGTTCTCGAA ATCCTACGGC 
CTTGCCGGCT TGCGGCTCGG CGCGCTGTTC GGGCCGAGCG AGCTGATTGC TGCGATGAAG 
CGCAAGCAGT GGTTCTGCAA CGTCGGCACG CTCGATCTGC ATGCGCTCGA AGCCGCGCTC 
GACAACGATC GCGCACGTGA GGCGCACATC GCGAAGACGC TCGCGCAGCG CCGCCGCGTC 
GCCGACGCGC TGCGCGGGCT CGGCTACCGC GTCGCGTCGT CCGAGGCCAA TTTCGTGCTC 
GTCGAAAACG CCGCCGGCGA GCGCACGCTG CGCTTCCTGC GCGAACGGGG CATTCAGGTG 
AAGGACGCCG GCCAGTTCGG ACTTCACCAC CACATCAGAA TCAGCATCGG CCGTGAAGAG 
GACAACGATC GGTTGCTCGC GGCGCTGGCC GAATATTCCG ACCACTCATA A

Protein sequence

MSVGEAMDTE VQAAAQTVCL AFNENPEAVE PRVQAAIAAA AARINRYPFD AEPRVMRKLA 
EHFSCPEDNL MLVRGIDECF DRISAEFSSM RFVTAWPGFD GYRARIAVSG LRHFEIGLTD 
DLLLDPNDLA QVSRDDCVVL ANPSNPTGQA LSAGELDQLR QRAGKLLIDE TYVDYSSFRA 
RGLAYGKNEL VFRSFSKSYG LAGLRLGALF GPSELIAAMK RKQWFCNVGT LDLHALEAAL 
DNDRAREAHI AKTLAQRRRV ADALRGLGYR VASSEANFVL VENAAGERTL RFLRERGIQV 
KDAGQFGLHH HIRISIGREE DNDRLLAALA EYSDHS