Gene VC0395_A1196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1196
Symbol	galM
ID	5136975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1259574
End bp	1260626
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	51%
IMG OID	640532654
Product	aldose 1-epimerase
Protein accession	YP_001217142
Protein GI	147675555
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID	[TIGR02636] galactose mutarotase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCGT TATTCACCAG CATGACAGCA CAGGTCGCCT ATGATGGTCA GCCTGCCAAG 
CTTATTGAGC TCACTAACCG CCGCGGTATG CGTGTGGTAG TGATGGACAT CGGTGCCACT 
TGGCTCAGTT GCACTCTACC GATGGGCGAT GAATCAAGAG AAGTGCTACT TGGCGTAAGC 
AGCATGGATG ATTTTGTGCG CCAAGGCAGT TATTTAGGCG CAACGGTGGG GCGTTATGCC 
AATCGGATTG CGCGTGGCGA ACTCAAGATA GGGACACAAA CGTATGCTTT GTCGGTCAAT 
CAAGCTGGCA ATACGTTACA CGGTGGCGTT GTAGGGTTTG ATCGTCGTCG CTGGCAAATC 
ACGCAGCAAA GCGCACAGCA TGTGACCTTT CAACTGCTTT CTGCTGACGG AGAACAAGGC 
TTTCCGGGCA ACCTCCACGT TGCAGTGACC TACCGGTTGG ATGAGCAAGG TGGGGTGAAT 
ATCGACTACC AAGCCACCAC CGATCGTGCG ACCGCCGTGA ATCTAACGAA CCACGCCTAC 
TTTAATTTGA ATGGCGCTGA GCAAGGTAGT GATTGCCTCA ATCATCAGCT CTGGATTGAT 
GCAAAGCAGT TCTTACCAAC GGATGCCTCG GGTATCCCGC TCGGGGAGTT GCAATCGGTA 
CTGGGTAGCG GTTTTGATTT CACTCAACCG AAAAGGGTTG GGGAGGATTT GCTTCAAGAT 
AAACAGCAAA TCCGTGCGAA AGGCTATGAC CACAGTTATT TCTTTGCGCC AGAGCGAGAT 
ATGCACACGC CTATCGCTAA GGTGTGGTCT GCCGATGAGA AAGTGCAACT GCTCGTCAGT 
ACGGATAAAC CTGCTATGCA GCTTTATACC GGTAATTGGT TGGCGGGAAC ACCCAATCGC 
CTTGGTTCGC ACTACAAGGA TTACGCTGGC CTCGCTTTAG AAACGCAGTT TTTACCCGAT 
TCCCCTCATC ATCCAGAATG GCTGCAACCG AGCTGCATCC TGCAACCCGG AGAAGTCTAT 
CGCTATCAAA CGCGCTATCA GTTTGTTTTT TAA

Protein sequence

MNALFTSMTA QVAYDGQPAK LIELTNRRGM RVVVMDIGAT WLSCTLPMGD ESREVLLGVS 
SMDDFVRQGS YLGATVGRYA NRIARGELKI GTQTYALSVN QAGNTLHGGV VGFDRRRWQI 
TQQSAQHVTF QLLSADGEQG FPGNLHVAVT YRLDEQGGVN IDYQATTDRA TAVNLTNHAY 
FNLNGAEQGS DCLNHQLWID AKQFLPTDAS GIPLGELQSV LGSGFDFTQP KRVGEDLLQD 
KQQIRAKGYD HSYFFAPERD MHTPIAKVWS ADEKVQLLVS TDKPAMQLYT GNWLAGTPNR 
LGSHYKDYAG LALETQFLPD SPHHPEWLQP SCILQPGEVY RYQTRYQFVF