Gene YpAngola_A3172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3172
Symbol	hisB
ID	5801647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3357650
End bp	3358717
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	51%
IMG OID	641341005
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001607532
Protein GI	162420147
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.894788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA AATTTCTTTT TATTGACCGC GACGGCACCA TCATTGCCGA GCCACCAACT 
GATTATCAGG TTGACCGGTT GGATAAACTG GCGCTGGAGC CTGATGTCAT TCCCGCATTA 
CTGGCGTTGC AAAAAGCAGA CTACAAACTG GTGATGATCA CTAATCAGGA TGGCCTCGGC 
ACCAGCAGTT TCCCGCAGGA AACCTTCGAT CCGCCACATA ACCTGATGAT GCAAATCCTG 
ACGTCTCAGG GGATCAATTT TGAACAGATA CTGATTTGCC CACATCTGCC AGAGGATAAC 
TGCACCTGTC GCAAACCGAA AACCGCGCTG GTAGAAAGCT ATCTGGCAGA TGGCGTGATG 
AACAGCACCA ATAGCTATGT CATCGGTGAC CGTGAAACTG ACCTACAACT GGCCGAGAAC 
ATGGGCATCA GCGGGTTACG TTATCAGCGT GATGGCTTGA ACTGGACGCA AATTGCCAAA 
CAACTGACCC AGCGCGACCG CCACGCCTAT GTTAATCGCG TGACCAAAGA AACCGCCATT 
GACGTTAATG TTTGGCTGGA TCGCGAAGGG GGAAGCAAAA TTAAAACCGG CGTGGGCTTC 
TTCGACCATA TGCTGGATCA AATCGCCACC CACGGCGGTT TTCGCATGGA TATTCAGGTC 
AGCGGCGATC TGTATATCGA TGATCACCAC ACAGTGGAAG ATACCGCGCT GGCACTGGGC 
GAAGCGATCA ACATCGCACT GGGTGACAAA CGGGGTATTG GCCGCTTTGG TTTTGTATTG 
CCGATGGATG AGTGCCTGGC ACGCTGTGCC TTGGATATTT CTGGTCGCCC GCATTTGGAA 
TACAAAGCTG AATTTAACTA CCAGCGTGTC GGCGATCTAA GCACCGAGAT GGTCGAGCAC 
TTCTTCCGCT CCCTTTCGTA TGCCATGGCC TGTACCTTGC ACCTGAAAAC CAAAGGTCGC 
AACGATCATC ACCGAGTAGA AAGCCTGTTT AAAGTATTTG GTCGTACCTT GCGTCAAGCC 
ATTCGCGTTG AAGGCAATAC CCTGCCAAGT TCAAAAGGAG TGCTGTAA

Protein sequence

MSQKFLFIDR DGTIIAEPPT DYQVDRLDKL ALEPDVIPAL LALQKADYKL VMITNQDGLG 
TSSFPQETFD PPHNLMMQIL TSQGINFEQI LICPHLPEDN CTCRKPKTAL VESYLADGVM 
NSTNSYVIGD RETDLQLAEN MGISGLRYQR DGLNWTQIAK QLTQRDRHAY VNRVTKETAI 
DVNVWLDREG GSKIKTGVGF FDHMLDQIAT HGGFRMDIQV SGDLYIDDHH TVEDTALALG 
EAINIALGDK RGIGRFGFVL PMDECLARCA LDISGRPHLE YKAEFNYQRV GDLSTEMVEH 
FFRSLSYAMA CTLHLKTKGR NDHHRVESLF KVFGRTLRQA IRVEGNTLPS SKGVL