Gene BTH_I0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_I0471
Symbol	hisC-1
ID	3848756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007651
Strand	-
Start bp	524741
End bp	525808
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	68%
IMG OID	637840144
Product	histidinol-phosphate aminotransferase
Protein accession	YP_441029
Protein GI	83719412
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCGTT ACTGGAGCGA CATCGTCCAT CAACTCGAGC CGTACGTGCC GGGCGAGCAG 
CCGGCGCTCG CGCATCCCGT CAAGCTGAAC ACGAACGAGA ACCCGTATCC GCCGTCGCCG 
CGCGCGCTCG ACGCGATTCG GCATGAGCTC GGCGCCACGG GCGAGGCGCT GCGCCGCTAT 
CCCGACCCCG TCGCGCGCAA GCTGCGCGAG ACGGTCGCCG CCCATCACGG AATCGCGCCC 
GAGCAGGTGT TCGCCGGCAA CGGCTCCGAC GAAGTGCTCG CGCATGCGTT CCAGGCGCTC 
CTGCAGCACG ACAGGCCGCT GCGCTTCCCG GACATCACGT ACAGCTTCTA CCCGACCTAC 
GCACGGCTCT ATCGCGTCGC ATACGAGACG GTGCCGCTCG CCGACGATTT CTCGATCGTC 
GTCGACGACT ATCTCGACGA CGCCGGCTGC GTGCTGTTCC CGAATCCGAA CGCGCCGACG 
GGCCGTGCGC TGCCGCTTGC CGACATCGAG CGGATCGTCG CCGCGAATCC GAGCTCGGTC 
GTCGTGATCG ACGAGGCGTA TGTCGACTTC GGCGCGGAGT CGGCCGTGTC GCTGATCTCG 
CGCTACCCGA ACCTGCTCGT CGTGCATACC GCGTCGAAGG CGCGCTCGCT CGCGGGCATG 
CGCGTCGGCT TCGCGTTCGG CGACGCCGCG CTGATCGATG CGCTCACACG CGTGAAGGAC 
AGCTTCAACT CGTACCCGCT CGACCGTCTC GCGCAGGTGG CGACGCAGGC GTCGTACGAG 
GACGACGCGT GGTTCGAAGC GACACGCAAG CAGGTGATCG CGAGCCGCGA GCGGCTTGTC 
GCCGCGCTCG CCGCGCTCGG CTTCGACGTC GTGCCGTCGG CCGCGAATTT CGTGTTCGCG 
CGCCATCCTC GCCACGATGC GGCGACGCTT GCCGCACGAC TGAAGCTACG GGAAATTTTC 
GTGCGGCACT TCAAGCTGCC GCGAATCGAC CAGCATTTGC GCATCACGGT CGGCACCGAC 
GCAGAATGCG ACGCGCTCGT CGCCGCGCTG CGCGAATTGC TCGCGTAA

Protein sequence

MSRYWSDIVH QLEPYVPGEQ PALAHPVKLN TNENPYPPSP RALDAIRHEL GATGEALRRY 
PDPVARKLRE TVAAHHGIAP EQVFAGNGSD EVLAHAFQAL LQHDRPLRFP DITYSFYPTY 
ARLYRVAYET VPLADDFSIV VDDYLDDAGC VLFPNPNAPT GRALPLADIE RIVAANPSSV 
VVIDEAYVDF GAESAVSLIS RYPNLLVVHT ASKARSLAGM RVGFAFGDAA LIDALTRVKD 
SFNSYPLDRL AQVATQASYE DDAWFEATRK QVIASRERLV AALAALGFDV VPSAANFVFA 
RHPRHDAATL AARLKLREIF VRHFKLPRID QHLRITVGTD AECDALVAAL RELLA