Gene BURPS1710b_2149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2149
Symbol	hisC
ID	3689727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	2352965
End bp	2353957
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	65%
IMG OID	637728605
Product	putative histidinol-phosphate aminotransferase
Protein accession	YP_333544
Protein GI	76809745
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000106616
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATACCG AAGTGCGGGC GGCGGCGCAA GCCGTCTGCC TGGCGTTCAA TGAAAACCCG 
GAAGCGGTGG AGCCGCGCGT GCAGGCCGCG ATTGCTGCCG CGGCCGCGCG GATCAATCGC 
TACCCGTTTG ACGCCGAACC GCGCGTCATG CGCAAGCTCG CCGAGCATTT CAGCTGTCCC 
GAGGACAACC TGATGCTGGT GCGCGGCATC GACGAATGCT TCGATCGAAT CAGCGCCGAA 
TTTTCGTCGA TGCGCTTCGT TACCGCATGG CCGGGCTTCG ACGGCTATCG CGCACGCATC 
GCCGTCAGCG GGCTGAGACA CTTCGAAATC GGCCTGACCG ACGATCTGCT GCTCGATCCG 
AACGATCTCG CCCAAGTCTC GCGTGACGAT TGCGTCGTGC TCGCCAATCC TTCGAATCCG 
ACCGGCCAGG CGCTGAGCGC GGGCGAGCTC GAGCAATTGA GGCAGCGCGC GGGCAAGTTG 
CTGATCGACG AAACCTACGT CGATTATTCG TCGTTTCGCG CCCGCGGCCT GGCTTACGGC 
GAGAACGAAC TGGTGTTTCG TTCGTTCTCG AAATCCTACG GCCTCGCCGG CTTGCGGCTC 
GGCGCGCTGT TCGGGCCGAG CGAGCTGATT GCCGCGATGA AGCGCAAGCA GTGGTTCTGC 
AACGTCGGCA CGCTCGATCT GCATGCGCTC GAAGCCGCGC TCGACAACGA TCGCGCACGT 
GAGGCGCACA TCGCGAAGAC GCTCGCGCAG CGCCGCCGCG TCGCCGACGC GCTGCGCGGG 
CTCGGCTACC GCGTCGCGTC GTCCGAGGCC AATTTCGTGC TCGTCGAAAA CGCCGCCGGC 
GAGCGCACGC TGCGCTTCCT GCGCGAACGG GGCATTCAGG TGAAGGACGC CGGCCAGTTC 
GGACTTCACC ACCACATCAG AATCAGCATC GGCCGTGAAG AGGACAACGA TCGGTTGCTC 
GCGGCGCTGG CCGAATATTC CGACCACTCA TAA

Protein sequence

MDTEVRAAAQ AVCLAFNENP EAVEPRVQAA IAAAAARINR YPFDAEPRVM RKLAEHFSCP 
EDNLMLVRGI DECFDRISAE FSSMRFVTAW PGFDGYRARI AVSGLRHFEI GLTDDLLLDP 
NDLAQVSRDD CVVLANPSNP TGQALSAGEL EQLRQRAGKL LIDETYVDYS SFRARGLAYG 
ENELVFRSFS KSYGLAGLRL GALFGPSELI AAMKRKQWFC NVGTLDLHAL EAALDNDRAR 
EAHIAKTLAQ RRRVADALRG LGYRVASSEA NFVLVENAAG ERTLRFLRER GIQVKDAGQF 
GLHHHIRISI GREEDNDRLL AALAEYSDHS