Gene YpsIP31758_2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2431
Symbol	hisB
ID	5387852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	2740380
End bp	2741447
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	51%
IMG OID	640865422
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001401400
Protein GI	153950620
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGA AATTTCTTTT TATTGACCGC GACGGCACCA TCATTGCCGA GCCACCAACT 
GATTATCAGG TTGACCGGTT GGATAAACTG GCGCTGGAGC CTGATGTCAT TCCCGCATTG 
CTGGCGTTGC AAAAAGCAGA CTACAAACTG GTGATGATCA CTAATCAGGA TGGCCTCGGC 
ACCAGCAGTT TCCCGCAGGA AACCTTCGAT CCGCCACATA ACCTGATGAT GCAAATCCTG 
ACGTCTCAGG GGATCAATTT TGAACAGATA CTGATTTGCC CACATCTGCC AGCCGATAAC 
TGCACCTGTC GCAAACCGAA AACCGCGCTG GTAGAAAGCT ATCTGGCAGA CGGCGTGATG 
AACAGTGCCA CTAGCTATGT CATCGGTGAC CGTGAAACTG ACCTACAACT GGCCGAGAAC 
ATGGGTATCA GCGGGTTACG TTATCAGCGT GATGGCTTGA ACTGGACGCA AATTGCCAAA 
CAACTGACCC AGCGCGACCG CCACGCCTAT GTTAATCGCG TGACCAAAGA AACCGCCATT 
GACGTTAATG TTTGGCTGGA TCGCGAAGGG GGAAGCAAAA TTAAAACCGG CGTGGGCTTC 
TTCGACCATA TGCTGGATCA AATCGCCACC CACGGCGGTT TTCGCATGGA TATTCAGGTC 
AGCGGCGATC TGTATATCGA TGATCACCAC ACAGTGGAAG ATACCGCGCT GGCACTGGGC 
GAAGCGATCA ACATCGCACT GGGTGACAAA CGGGGTATTG GCCGCTTTGG TTTTGTATTG 
CCGATGGATG AGTGCCTGGC ACGCTGTGCC TTGGATATTT CTGGTCGCCC GCATTTGGAA 
TACAAAGCTG AATTTAACTA CCAGCGTGTC GGCGATCTAA GCACCGAGAT GGTCGAGCAC 
TTCTTCCGCT CCCTTTCGTA TGCCATGGCC TGTACCTTGC ACCTGAAAAC CAAAGGTCGC 
AACGATCATC ACCGAGTAGA AAGCCTGTTT AAAGTATTTG GTCGTACCTT GCGTCAAGCC 
ATTCGGGTTG AAGGCAATAC CCTGCCAAGT TCAAAAGGAG TGCTGTAA

Protein sequence

MSQKFLFIDR DGTIIAEPPT DYQVDRLDKL ALEPDVIPAL LALQKADYKL VMITNQDGLG 
TSSFPQETFD PPHNLMMQIL TSQGINFEQI LICPHLPADN CTCRKPKTAL VESYLADGVM 
NSATSYVIGD RETDLQLAEN MGISGLRYQR DGLNWTQIAK QLTQRDRHAY VNRVTKETAI 
DVNVWLDREG GSKIKTGVGF FDHMLDQIAT HGGFRMDIQV SGDLYIDDHH TVEDTALALG 
EAINIALGDK RGIGRFGFVL PMDECLARCA LDISGRPHLE YKAEFNYQRV GDLSTEMVEH 
FFRSLSYAMA CTLHLKTKGR NDHHRVESLF KVFGRTLRQA IRVEGNTLPS SKGVL