Gene HS_0236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0236
Symbol	galM
ID	4239752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	236574
End bp	237617
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	38%
IMG OID	638103773
Product	aldose 1-epimerase
Protein accession	YP_718444
Protein GI	113460382
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID	[TIGR02636] galactose mutarotase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAATTG ATTGTTTTGA GAAGGAACAC AAGCAAGGAA TGGCACCGGA TGGACAACCT 
TTTCGTATTT TTACGTTAAC TAATACAAAA GGCATGAAAG TGCAAGTGAT GGATTGGGGG 
GCAACTTGGA TTTCTTGTCA AGTACCGGTA GGAAAAGAAG TACGAGAAGT TTTGCTTGGG 
TGTCAGATTA ATGATTATCC GATACAACAG GTTTATTTAG GAGCGAGTAT TGGGCGTTAT 
GCAAATCGTA TTGCAAATAG CCGATTTGAG TTGAATGGTA AACGCTATTT ACTTAACGCT 
AATCAACATC AGCATCAACT TCATGGTGGA AAAGGGTTTC ATAATGAGCG TTGGTATTTA 
GAAAAGTGCG GTGTAAATTC CATCACTTTT TCTCATTTTA GCCCTGATGG AGATCAGGGA 
TTTCCCGGTA ATTTACATGC TTTTGTTACT TATTCTTTAA GTGAAACCAA CAACGTGAGA 
ATTGAATATG AGGCAATTTG TGATCAAGAT TGCCCAATTA ATTTGACTAA CCATGCTTAT 
TTTAACTTGA ATGATGCTAC TTTCGGTTGT GATATTCGAG GGCATTCTTT ACAACTTAAT 
AGCGATTATT TTTTGCCGGT GGACAGTGTG GGTATCCCTA ATGCTAAGTT AAAAGCGGTT 
GAGGGAACTA GTTTTGATTT TCGTGAGGAA AAACCAATCG GTTTAGATTT TTTACAAGAA 
GAACAAAAAT TGGTAAAAGG TTACGACCAT TCTTTCTTGC TTAATCCGGA CATTGAAAAA 
CCTTGTGCTA TTTTGACCGC ACTTGATCGT TCTTTGAGAA TGCAAGTGTT GACTTCTCAG 
CCGGCTTTAC AGATTTATAC GGGCAATTTT CTATCAGCTA CGCCAACTCG TCAAAACGGG 
CAGTATGCTG ATTATGCTGG TATTGCTTTG GAAACTCAAT GTTTGCCTGA TACACCGAAT 
CATCCGGAAT GGTGGAAATA TGGTGGAATA ACAAAGGTGG GCGAAAAATA TTCTCATAAA 
ACGGAATATC AATTTATCCG TTAG

Protein sequence

MLIDCFEKEH KQGMAPDGQP FRIFTLTNTK GMKVQVMDWG ATWISCQVPV GKEVREVLLG 
CQINDYPIQQ VYLGASIGRY ANRIANSRFE LNGKRYLLNA NQHQHQLHGG KGFHNERWYL 
EKCGVNSITF SHFSPDGDQG FPGNLHAFVT YSLSETNNVR IEYEAICDQD CPINLTNHAY 
FNLNDATFGC DIRGHSLQLN SDYFLPVDSV GIPNAKLKAV EGTSFDFREE KPIGLDFLQE 
EQKLVKGYDH SFLLNPDIEK PCAILTALDR SLRMQVLTSQ PALQIYTGNF LSATPTRQNG 
QYADYAGIAL ETQCLPDTPN HPEWWKYGGI TKVGEKYSHK TEYQFIR