Gene HS_1551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1551
Symbol	purM
ID	4241072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1747749
End bp	1748786
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	41%
IMG OID	638105131
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_719756
Protein GI	113461687
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTAAAC AATCATTAAG TTATAAAGAC GCAGGTGTGG ATATTAATGC GGGGAACACA 
TTAGTAGAAC GTATTAAATC TGATGTAAAA CGTACAACTA GACCCGAGGT TATTGGTGGG 
TTAGGGGGCT TCGGTGCACT ATGTGCATTG CCAAGTAAAT ATAAGGATCC TATTCTTGTA 
TCCGGAACTG ATGGTGTTGG GACTAAGTTA CGCCTTGCGA TTGACCTAAA AAAACATGAC 
ACAATTGGTG TTGATTTGGT CGCAATGTGT GTCAATGATC TTGTGGTGCA AGGTGCAGAA 
CCGTTATTTT TTCTCGACTA TTATGCAACA GGTAAATTGG ATGTAGACGT TGCAGCAGAT 
GTCATCAAAG GTATTGCTGA TGGTTGTGTG CAAGCCGGTT GTGCTTTAGT AGGGGGTGAA 
ACCGCAGAAA TGCCGGGAAT GTATCATACC GGTGATTATG ATTTGGCAGG TTTTTGTGTG 
GGTGTAGTTG AGAAATCGGA AATTATTGAC GGTTCCAACG TTAAAGCAGG CGATGCATTA 
CTTGCCTTAG CTTCAAGCGG TCCTCATTCA AATGGATATT CATTAATTCG CAAAGTCATT 
GAAGTTTCAG GTATTGATCC GACAACAACA CAATTAGCCG AGCATTCATT CGCTGAACAA 
GTTCTTGCAC CGACAAAAAT TTATGTAAAA CCGGTGTTGC AATTAATTAA ACATACTGAC 
GTTCATGCTA TTTGCCATTT AACAGGCGGC GGTTTTTGGG AAAATATTCC GCGTGTTTTA 
CCGTCTTCCG TTAAAGCGGT AATTAATGAA AAGAGTTGGG AATGGCATCC TATTTTCAAA 
TGGTTACAAG AACAAGGAAA TATTGATCGC TATGAAATGT ATAGAACCTT TAACTGTGGC 
GTAGGCATGA TTATCGCTCT CCCACAGGAA GATGTGGAAA CTGCATTGGC ATTATTACAA 
CAAGTAGGCG AAAAAGCATG GGTAATCGGT AAAATCGAAC ATGCGAATGC TGATGAAGAA 
AAAGTTGTGA TTTGTTGA

Protein sequence

MSKQSLSYKD AGVDINAGNT LVERIKSDVK RTTRPEVIGG LGGFGALCAL PSKYKDPILV 
SGTDGVGTKL RLAIDLKKHD TIGVDLVAMC VNDLVVQGAE PLFFLDYYAT GKLDVDVAAD 
VIKGIADGCV QAGCALVGGE TAEMPGMYHT GDYDLAGFCV GVVEKSEIID GSNVKAGDAL 
LALASSGPHS NGYSLIRKVI EVSGIDPTTT QLAEHSFAEQ VLAPTKIYVK PVLQLIKHTD 
VHAICHLTGG GFWENIPRVL PSSVKAVINE KSWEWHPIFK WLQEQGNIDR YEMYRTFNCG 
VGMIIALPQE DVETALALLQ QVGEKAWVIG KIEHANADEE KVVIC