Gene Mmcs_1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1789
Symbol
ID	4110623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1930076
End bp	1931116
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	638030909
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_638954
Protein GI	108798757
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0412358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATCGG CGATGGACGG CGCCCAGGCG CGCAAGAGGG CACTGGTGCT CGGAGCCAGT 
GGAAACGTGG GCGCCGCAGT CGTCCGGCAC CTGGTGGCTG ACGGCGACGA CGTGCGAGTC 
TTGTTGCGGC GCAGCAGTTC CACCAGGGGT ATCGACGGAC TCGACGTGGA CCGGCGCTAC 
GGCGACATCT TCGACACCGA GGCGGTCGCC GCCGCGATGG CCGACCGCGA TGTCGTCTTC 
TACTGCGTGG TGGACACCAG GGCGCATCTG GCCGATCCCG CACCGCTGTT CGCGACCAAC 
GTGGAGGGTC TGCGCGGGGT GCTCGACATC GCCGCACGGG CGGATCTGAA GCGCTTCGTG 
TTCCTCAGCA CCATCGGGAC CATCGCGGTC GGCGCCGACG GTGCGGCGGT GGACGAGGAC 
ACACCGTTCA ACTGGAGCGG TAAGGGCGGA CCGTACATCG AATCCCGCCG TCAGGCCGAA 
GACCTGGTGC TGCGCTGCGC CCGCGAGCGG GGACTGCCCG CGGTGGCGAT GTGTGTGTCC 
AACCCGTACG GCCCGCCGGA CTGGAACCCC AGACAGGGTG CCCTCGTTGC GCTGGCCGCG 
TTCGGCAAGA TGCCCTGCTA CATCCGCGGG GTGGGTGCGG AGGTGGTGGA CATCGACGAC 
GCCGCACGGG CGTTGGTGTC GGCCGCCGAA CGCGGCCGGG TCGGCGAGCG CTACATCGTG 
TCGGAGCGCT ACATGTCCCA GCGCGAGATG CTCACCCTCG CCGCGGAGGC GGCGGGTGCC 
ACCCCGCCGA GGTTCGGCAT CCCGATGGCA CTGGTCCACG CCTTCGCCGC AGTCGCCGGG 
ATGTCCAACC GGCTGTTCGG CACCGACCTC CCGATCAATC CGGCCGCGGC GCGGCTGATC 
GCGCTGACCT CGCCGGCCGA CCACGGCAAG GCGACGCGTG ACCTCGGGTG GCGCCCCGGA 
CCCACCGCCG ACGCGATCCG CCGCGCCGCC CGGTCCTACG TCGAACGGCG CGACCGCAAC 
GAGCAGGTGG TCGCGCTGTG A

Protein sequence

MGSAMDGAQA RKRALVLGAS GNVGAAVVRH LVADGDDVRV LLRRSSSTRG IDGLDVDRRY 
GDIFDTEAVA AAMADRDVVF YCVVDTRAHL ADPAPLFATN VEGLRGVLDI AARADLKRFV 
FLSTIGTIAV GADGAAVDED TPFNWSGKGG PYIESRRQAE DLVLRCARER GLPAVAMCVS 
NPYGPPDWNP RQGALVALAA FGKMPCYIRG VGAEVVDIDD AARALVSAAE RGRVGERYIV 
SERYMSQREM LTLAAEAAGA TPPRFGIPMA LVHAFAAVAG MSNRLFGTDL PINPAAARLI 
ALTSPADHGK ATRDLGWRPG PTADAIRRAA RSYVERRDRN EQVVAL