Gene HS_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0420
Symbol	guaB
ID	4239896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	448262
End bp	449725
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	44%
IMG OID	638103963
Product	inosine 5'-monophosphate dehydrogenase
Protein accession	YP_718630
Protein GI	113460566
COG category	[F] Nucleotide transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0516] IMP dehydrogenase/GMP reductase [COG3448] CBS-domain-containing membrane protein
TIGRFAM ID	[TIGR01302] inosine-5'-monophosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACGCA TCAAACAAGA AGCCTTAACT TTTGACGACG TTCTATTAGT TCCGGCTCAT 
TCTACAGTAC TTCCAAATAC TGCCAACCTT TCAACTAACC TTACCAAAGA AATCCGTCTA 
AATATTCCTA TGTTATCTGC TGCAATGGAT ACTGTTACCG AAGCTAAATT GGCTATTTCT 
CTAGCTCAAG AGGGCGGTAT CGGATTTATT CATAAAAATA TGACCATTGA ACGTCAAGCG 
GATCGTGTGC GTAAAGTGAA AAAATTCGAG AGCGGAATTG TATCTGAACC GGTTACCGTT 
TCACCAACAA TGACGTTAAC TGAATTAGCG GAATTGGCTA AGAAAAACGG TTTTGCAGGT 
TATCCGGTAG TTGATGAACA AAAAGGTTTA GTCGGGATCA TTACAGGTCG TGATACACGT 
TTCGTTTCAG ATTTGAATAA AACCGTTGCG GATTTTATGA CCCCAAAAGA TCGTTTAGTT 
ACTGTGAAAG AAGGGGCTAC TCGGGAAGAA ATTTTCCATT TAATGCACGA ACATCGTGTC 
GAAAAAGTGC TGGTGGTAGA TGACAGCTTT AAACTAAAAG GAATGATTAC CTTAAAAGAC 
TACCAAAAAG CCGAAAGTAA GCCGAATGCG TGTAAAGATG AATTTGGTCG TTTACGTGTT 
GGTGCCGCAG TCGGTGCCGG TCCCGGTAAT GAAGAACGTA TTGAAGCCTT AGTAAATGCC 
GGTGTGGACA TTTTATTGAT TGATTCATCA CACGGACATT CCGAAGGTGT TTTACAACGC 
GTGCGTGAAA CGCGTGCTAA ATATCCAAAT TTACCTATTA TTGCAGGGAA TATTGCGACA 
GCGGAAGGTG CGATTGCATT AGCTGATGCG GGGGCAAGTG CGGTTAAAGT TGGGATTGGA 
CCGGGATCAA TTTGTACGAC TCGTATTGTA ACAGGTGTGG GGGTGCCACA AATTACGGCG 
ATTGCTGATG CTGCTGAAGC ATTGCGTGAG CGTGGTATTC CAGTGATTGC CGATGGTGGT 
ATCCGCTATT CGGGTGATAT CGCTAAAGCG ATTGCAGCAG GTGCATCTTG TGTTATGGTC 
GGATCAATGT TTGCAGGAAC GGAAGAAGCA CCGGGTGAAA TCGAACTTTA TCAAGGGCGA 
GCATTTAAAT CTTACCGAGG TATGGGTTCC CTTGGTGCAA TGTCAAAAGG ATCTTCCGAT 
CGTTATTTTC AATCCGATAA TGCTGCGGAT AAACTAGTGC CTGAAGGGAT TGAAGGGCGT 
ATTCCATACA AAGGCTTATT AAAAGAAATT ATCCACCAAC AAATGGGTGG ATTACGTTCT 
TGCATGGGCT TAACCGGCTG TGCGACTATC GAAGAATTAC GCACTAAAGC CCAATTTGTA 
CGTATCAGCG GAGCAGGCAT CAAAGAGAGT CACGTTCACG ATGTGACCAT TACCAAAGAA 
GCACCGAATT ATCGCATGGG GTAA

Protein sequence

MLRIKQEALT FDDVLLVPAH STVLPNTANL STNLTKEIRL NIPMLSAAMD TVTEAKLAIS 
LAQEGGIGFI HKNMTIERQA DRVRKVKKFE SGIVSEPVTV SPTMTLTELA ELAKKNGFAG 
YPVVDEQKGL VGIITGRDTR FVSDLNKTVA DFMTPKDRLV TVKEGATREE IFHLMHEHRV 
EKVLVVDDSF KLKGMITLKD YQKAESKPNA CKDEFGRLRV GAAVGAGPGN EERIEALVNA 
GVDILLIDSS HGHSEGVLQR VRETRAKYPN LPIIAGNIAT AEGAIALADA GASAVKVGIG 
PGSICTTRIV TGVGVPQITA IADAAEALRE RGIPVIADGG IRYSGDIAKA IAAGASCVMV 
GSMFAGTEEA PGEIELYQGR AFKSYRGMGS LGAMSKGSSD RYFQSDNAAD KLVPEGIEGR 
IPYKGLLKEI IHQQMGGLRS CMGLTGCATI EELRTKAQFV RISGAGIKES HVHDVTITKE 
APNYRMG