Gene YpsIP31758_4085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4085
Symbol	hutH
ID	5386549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	4607354
End bp	4608886
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	51%
IMG OID	640867114
Product	histidine ammonia-lyase
Protein accession	YP_001403029
Protein GI	153946871
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACAA TAACACTACG TCCTGGTCAG ATGACGCTGG CTGACTTACG GCATATTTAT 
CAACATCCCG TACATATCAC ATTGGATGAA AGTGCCTATG TACCCATTCA GCAAAGTGTG 
GATTGTGTGC AAGCCATATT GGCAGAACAG CGCACGGCAT ATGGCATTAA CACTGGGTTT 
GGCTTGCTGG CCTCTACCCG TATCGCCACC GAAGACTTGG AAAACTTACA GCGCTCAATC 
GTACTCTCTC ACGCGGCAGG AGTCGGAGAA GCGAATGATG ATGCGATTGT GCGTCTGATT 
ATGGTGCTGA AAATCAATAG CCTGGCGAGA GGTTTCTCAG GTATTCGGCT GGAGGTGATT 
CAGGCGCTGA TTACCTTGGT CAATGCTGGG GTTTATCCGC ATATCCCGTT AAAAGGATCA 
GTGGGCGCTT CTGGCGATTT AGCTCCGCTG GCACATATGA GCTTGCTGCT ATTAGGTGAA 
GGAAAAGCCC GCTATCAGGG TGAATGGTTG CCCGCACACA CGGCACTGGC GCAAGCGGGT 
TTGCAGCCCC TCACACTGGC GGCGAAAGAG GGTTTGGCAC TACTTAACGG CACCCAGGTC 
TCTGCCGCTT ATGCATTGCG TGGTTTATTT GAGGCCGAAG ATCTCTATGC GGCCGCTTCG 
GTGTTTGGCT GCCTGACAGT GGATGCAGCA TTAGGATCCC GTAGCCCATT TGACGCCCGT 
ATTCACGCCG TTCGGGGCCA ACGTGGGCAG ATTGATGCTG CCAGCACTTA TCGTCATCTG 
CTTGGTGAAC GCAGTGAAAT CTCAGAATCA CACAAGAATT GTGACAAAGT GCAGGATCCA 
TATTCTTTAC GCTGTCAGCC ACAGGTGATG GGCGCATGTT TAGGCCAAAT ACGTCAGGCG 
GCAGAGGTGC TGGCTATTGA ATCTAATGCC GTTTCAGATA ACCCGTTGGT GTTTGCTGAA 
CAGGGTGATG TCTTGTCTGG TGGGAATTTC CATGCTGAAC CGGTCGCTAT GGCAGCAGAT 
AATCTGGCGT TGGCGTTGGC AGAAATCGGT TCATTATCAG AGTGCCGTAT CTCGTTGATG 
ATGGACAAGC ATATGTCTCA GTTACCTCCA TTTCTGGTAG AGAACGGTGG CGTAAATTCT 
GGCTTTATGA TTGCTCAGGT TACGGCTGCG GCGTTAACCA GTGAAAATAA AGGGCTGGCA 
TTCCCCGCCA GTGTCGATAG CATCCCAACA TCTGCTAATC AGGAAGATCA TGTCTCTATG 
GCCCCTCGGG CGGGTAAACG CTTGTGGGAA ATGGCTGAAA ATGTACGGAA TATACTGGCT 
ATCGAGTGGC TGGCTGCGTG TCAGGGGCTT GATTTGCGCA AAGGGCTAAG AACTTCCGCC 
ATACTGGAGC CCGCCCGCCA ACTATTACGC CAGCACGTCA CTTACTACGA TAAAGATCGT 
TTCTTTGCCC CCGATATTGA AGTTGCTAGC CAGCTTATTG CACAACGTCA TATGAATGAG 
TTGATACCAG CAAAATTACT GCCAAGTCTT TAA

Protein sequence

MKTITLRPGQ MTLADLRHIY QHPVHITLDE SAYVPIQQSV DCVQAILAEQ RTAYGINTGF 
GLLASTRIAT EDLENLQRSI VLSHAAGVGE ANDDAIVRLI MVLKINSLAR GFSGIRLEVI 
QALITLVNAG VYPHIPLKGS VGASGDLAPL AHMSLLLLGE GKARYQGEWL PAHTALAQAG 
LQPLTLAAKE GLALLNGTQV SAAYALRGLF EAEDLYAAAS VFGCLTVDAA LGSRSPFDAR 
IHAVRGQRGQ IDAASTYRHL LGERSEISES HKNCDKVQDP YSLRCQPQVM GACLGQIRQA 
AEVLAIESNA VSDNPLVFAE QGDVLSGGNF HAEPVAMAAD NLALALAEIG SLSECRISLM 
MDKHMSQLPP FLVENGGVNS GFMIAQVTAA ALTSENKGLA FPASVDSIPT SANQEDHVSM 
APRAGKRLWE MAENVRNILA IEWLAACQGL DLRKGLRTSA ILEPARQLLR QHVTYYDKDR 
FFAPDIEVAS QLIAQRHMNE LIPAKLLPSL