Gene BURPS1710b_0750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_0750
Symbol	hisC
ID	3690866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	762822
End bp	763892
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	68%
IMG OID	637727206
Product	histidinol-phosphate aminotransferase
Protein accession	YP_332164
Protein GI	76812095
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.331282
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCGTT ACTGGAGCGA CATCGTCCGT CAACTCGAGC CGTATGTGCC GGGCGAGCAG 
CCGGCGCTCG CGCATCCCGT CAAGCTGAAC ACGAACGAGA ATCCGTATCC GCCGTCGCCG 
CGCGCGCTCG ACGCGATCCG GCGCGAGCTC GGCGACACGG GCGAAGCGCT GCGCCGCTAT 
CCGGACCCGG TCGCGCGCAG GCTGCGCGAG ACGGTGGCGG CCTATCACGG CATCGCGCCC 
GAGCAGGTGT TCGCCGGCAA CGGCTCCGAC GAAGTGCTCG CGCACGCGTT CCAGGCGCTC 
CTGCAACACG ACAGGCCGCT GCGCTTCCCG GACATCACGT ACAGCTTCTA CCCGACCTAT 
GCGCGGCTCT ATCGCGTCGC ATACGAGACG GTACCGCTCG CCGACGATTT CTCGATCGTC 
GTCGACGACT ATCTCGACGA CGCCGGCTGC GTGCTGTTCC CGAACCCGAA CGCGCCGACG 
GGCCGCGCGC TGCCGCTTGC CGACATCGAG CGGATCGTCG CCGCCAACCC GAGCTCGGTT 
GTCGTGATCG ACGAGGCCTA TGTCGATTTC GGCGCGGAAT CGGCCGTCTC GCTGATCGCG 
CGCTATCCGA ATCTGCTCGT CGTGCATACC GTGTCGAAGG CGCGCTCGCT CGCCGGCATG 
CGCGTCGGCT TCGCGTTCGG CGACGCCGCG CTGATCGACG CGCTCACGCG CGTGAAGGAC 
AGCTTCAACT CGTATCCGCT CGATCGTCTC GCGCAAGTCG CGACGCAAGC GTCGTACGAG 
GACGAGGCGT GGTTCCAGGC GACGCGCAAG CAGGTGATCG CGAGCCGCGA GCGGCTCGTC 
GGCGCGCTGG CGGCGCTCGG CTTCGACGTC GTGCCGTCGG CGGCGAATTT CGTGTTCGCG 
CGCCCTCGTA GCCACGATGC GGCGACGCTC GCCGCGCAAC TGAAACAGCG GGAAATTTTC 
GTGCGGCACT TCAAGCTGCC GCGGATCGAC CAGCACTTGC GCATCACGGT CGGCTCGGAC 
GCCGAATGCG ACGCGCTCGT CGCGGCGCTG CGGGAGCTGC TCGCCGCTTA A

Protein sequence

MSRYWSDIVR QLEPYVPGEQ PALAHPVKLN TNENPYPPSP RALDAIRREL GDTGEALRRY 
PDPVARRLRE TVAAYHGIAP EQVFAGNGSD EVLAHAFQAL LQHDRPLRFP DITYSFYPTY 
ARLYRVAYET VPLADDFSIV VDDYLDDAGC VLFPNPNAPT GRALPLADIE RIVAANPSSV 
VVIDEAYVDF GAESAVSLIA RYPNLLVVHT VSKARSLAGM RVGFAFGDAA LIDALTRVKD 
SFNSYPLDRL AQVATQASYE DEAWFQATRK QVIASRERLV GALAALGFDV VPSAANFVFA 
RPRSHDAATL AAQLKQREIF VRHFKLPRID QHLRITVGSD AECDALVAAL RELLAA