Gene YpAngola_A2512 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2512
Symbol	hutI
ID	5800982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2629278
End bp	2630498
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	50%
IMG OID	641340382
Product	imidazolonepropionase
Protein accession	YP_001606925
Protein GI	162419282
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0955381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATCAG TAACTCACTG TGACAGCTTA TGGTTCGGGG CCGATATCAT TACGATGCGC 
GGGGGAAATT ATCAGTTGAT TCCGCAAGGG GCAATCGCTG TCACTGGCGA TAAGATAGTC 
TGGATTGGGC CACATGCCGA ATTACCGCCT ATTCATGCCG CACGTCAGGT CGTATATGAA 
GGTGGTCTTA TCACCCCTGG ATTGATTGAC TGTCACACCC ATCTCGTGTT TGGCGATGAT 
CGTAGCAATG AATTTGAGCA ACGCCTTAAC GGGGTCAGCT ATGCCGAAAT TGCTGCTAAT 
GGCGGTGGTA TTATTTCAAC CGTCAGAGCC ACACGCCAAG CTAGCGAACA GCAACTACTG 
GAACAAGCCC TATTTCGTCT GAAGCCCTTA CTTGCTGAAG GGGTGACTAC GATTGAGATT 
AAGTCTGGCT ATGGCCTTAA TCTTGAAAGT GAAATAAAAA TGTTGCGAGT GGCCCGCCGA 
TTGGGGGAGT TACTGCCTAT TGACGTCAAA ACGACTTGTT TGGCCGCCCA TGCGCTACCG 
CCCGAGTTTA TCGGGCAGCC TGATGATTAT ATTGATGTCG TATGTAATAG CATTATTCCT 
CAGGTGGCAG TTGAAAACTT AGCCGATGCC GTGGACGCAT TTTGCGAACA TTTAGCTTTT 
TCACCGGCTC AAGTTGAGCG AGTATTTTTA GCCGCACAAA AAGCCGGGCT ACCTGTAAAA 
CTGCACGCAG AGCAACTTTC TGCTCTCCGT GGCGCGACTC TGGCCGCTAA ATTCCATGCG 
ATATCGGCAG ACCATCTGGA GTACGCGACT GAATCTGATG TCCAGGCTAT GGCAAATGCG 
GGTACTGTCG CAGTCTTACT ACCAGGTGCC TACTACTTAT TGCGGGAAAC ACAATGCCCC 
CCAATTGATC TGTTCCGCCA GTATAAGGTC CCCATGGCAC TGGCCAGTGA TGCCAACCCA 
GGGACATCTC CGGTACTTTC ACTACGCTTG ATGCTCAATA TGGCTTGCAC GTTATTCCGC 
ATGACACCAG AAGAAGCACT GGCTGGTGTC ACGTGCCACG CAGCTCAAGC TCTTGGTGTA 
CAACAGACTC AAGGTACGTT GGAGACAGGG AAATTAGCTA ACTGGGTGCA TTGGCCCTTA 
TCACACCCAG CCGAGTTAGC TTATTGGTTA GGAGGGCAAT TACCTGCCAC TGTCGTATTC 
CGAGGAGAAG TACGCCCATG A

Protein sequence

MVSVTHCDSL WFGADIITMR GGNYQLIPQG AIAVTGDKIV WIGPHAELPP IHAARQVVYE 
GGLITPGLID CHTHLVFGDD RSNEFEQRLN GVSYAEIAAN GGGIISTVRA TRQASEQQLL 
EQALFRLKPL LAEGVTTIEI KSGYGLNLES EIKMLRVARR LGELLPIDVK TTCLAAHALP 
PEFIGQPDDY IDVVCNSIIP QVAVENLADA VDAFCEHLAF SPAQVERVFL AAQKAGLPVK 
LHAEQLSALR GATLAAKFHA ISADHLEYAT ESDVQAMANA GTVAVLLPGA YYLLRETQCP 
PIDLFRQYKV PMALASDANP GTSPVLSLRL MLNMACTLFR MTPEEALAGV TCHAAQALGV 
QQTQGTLETG KLANWVHWPL SHPAELAYWL GGQLPATVVF RGEVRP