Gene Mkms_1286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1286
Symbol
ID	4614299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	1382103
End bp	1383383
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	71%
IMG OID	639790961
Product	glycosyl transferase family protein
Protein accession	YP_937288
Protein GI	119867336
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR01426] glycosyltransferase, MGT family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.540508
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.192884
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGA TCCTGGCCTA CACCTCACCG TCGGCGGGCC ACCTCTTTCC GATGCTCGCG 
CTCCTCGGCG AACTGGCCGG GCGCGGTCAC CGGGTGCACG TGCGCACCTA CGCCGGCGGA 
GTCCCCGCCG CCCGCGCGGC GGGGCTGACC GCCGACGCCG TGGATCCCCG CATCGAGGAC 
ATCGTGAGCG AGGACTGGCG GGCCACCGGT GGACGTGCGG TGCTGCGTAT GACGATCGAG 
ACGTTCGGTG GCCGCGGCGC CCACGAACTC GACGACCTCG ACGATGCGAT CGCGCTCGTC 
GGGCCTGATC TGCTGCTGCT CGACATCAAC TGCTGGGGTG CGATGGCCGC CGCTGACGCC 
GGCGACATCC TGTGGGCGGT GTTCTCCCCG TACACCCCGT TCCTGAACTC ACCGGGGATG 
CCGCCGGTGG GCGCCGGGAT GGCGCCGTGG CCGGGATTCG TCGGCCGGGT GCGGGACGCG 
GGTGTGCGCG CCGTGGTTCA GCAGGTGTTC GACGTGCCGA TGATGGCTAA CGTCAACGGT 
TTTCGTGCGA AACGGGGGCT ACCCGCCCTG CGCGATGTGG ACGCCGTCCT ACGCCGTGCG 
CCGCTGATGC TGGTGGCCGG CGGCGAGCCG TTCGAGTATC CGCACCCGGG CTGGGGTGCG 
GCGGTGCAGA TGATCGGACC GTGTGAATAC GACCCGAAAC CCGCCGCGGC GCCGTCGTGG 
CTCGACGGCA TCGACCGTCC GGTGGTCCTC GTCACGACCT CGTCGGTGAA ACAGGCCGAC 
TCCGCGCTGG TTACCACGGC GCTGACCGCG TTGGCGGACA AAGACATTCA CATCGTCGCG 
ACCTGCCCCT CGGGTATTCC CGGCGGAATC ACGGTGCCGC GCAACGCCAC CGTGACCGGA 
TTCCTCCCGC ACGGTCCGGT GCTCGACCGG GCGGTCTGTG CGATCACGCA CGGCGGTATG 
GGTGTCACCC AGAAGGCGCT GTCCCGCGGG GTGCCGGTGT GCGCGGTGCC GCACGGCCGC 
GATCAGTTCG AGGTGGCCCG CCGGGTGCAG GCCGCCCGGT GCGGCACCCG CCTGCCGGCG 
CGGCGCCTGA CACCGCAGCG GTTGCGCACC GCGGTCGAAC GCGCGCTGAC GATGACCGCG 
GGGGCGCGTC GCGTCGCCGC CGGCTTCGCC GCCACCGGCG GCGTGGCACG CGGCGCGGAT 
TTGCTGGAAC AGCGGCTGAT CGGTCGGTCG GCTACCCGAA GTGCACGCCT TGAGCCAGAG 
GTAACTCGGC GGAGTAGTTG A

Protein sequence

MATILAYTSP SAGHLFPMLA LLGELAGRGH RVHVRTYAGG VPAARAAGLT ADAVDPRIED 
IVSEDWRATG GRAVLRMTIE TFGGRGAHEL DDLDDAIALV GPDLLLLDIN CWGAMAAADA 
GDILWAVFSP YTPFLNSPGM PPVGAGMAPW PGFVGRVRDA GVRAVVQQVF DVPMMANVNG 
FRAKRGLPAL RDVDAVLRRA PLMLVAGGEP FEYPHPGWGA AVQMIGPCEY DPKPAAAPSW 
LDGIDRPVVL VTTSSVKQAD SALVTTALTA LADKDIHIVA TCPSGIPGGI TVPRNATVTG 
FLPHGPVLDR AVCAITHGGM GVTQKALSRG VPVCAVPHGR DQFEVARRVQ AARCGTRLPA 
RRLTPQRLRT AVERALTMTA GARRVAAGFA ATGGVARGAD LLEQRLIGRS ATRSARLEPE 
VTRRSS