Gene Mkms_3646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3646
Symbol
ID	4611576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3839375
End bp	3840679
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	71%
IMG OID	639793322
Product	glycosyl transferase family protein
Protein accession	YP_939630
Protein GI	119869678
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR01426] glycosyltransferase, MGT family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.293186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGAAG TACTGATCGC GTCCATGTCG CCGATAGGCC ACCTCGGGCC GTTGCTCAAC 
CTCGCCCGCG GCCTCGTCGA CCGCGGTGAC CGGGTCACGG TCCTGACCTC GGCCGCGCGC 
GCCGGGATGA TCCGCGCGGC CGGGGCACGA CCCCGCGCCC TGCCGCCGCA GACCGACATC 
GACGAGAGCC GGCTCAACGA AAGCCTCCCC GGGCGCGAGA AGACGTCCGG CATCAAACGG 
GTCGACTTCG ACATCACCAA CGTCTTCGTG ACCCCGATGC CCCATCAGGC GGCGGCCCTG 
GCCGAGGCGT TCGCCGAGAC ACGGTATGAC GCCGTCATCG TCGACGCGAT GTTCCTGGGC 
ATCCTGCCGT TCCTGCTCGG TGAACACGCC GCCCGCCCAC CGGTGCTGGC CTACTCGACC 
ACGCCGCTGT TGATCAGCAG CCGGGACACC GCTCCTCCGG GGTTGGGTCT GCCGCCGTCG 
TCGAGCCCGC TCGGGCGGCT GCGCAACTCG GCGCTGACCA CGCTGACGCA CCGGGTCCTC 
CTGCGAGGCT GCCACCGGGC CGCCGACGAG GCGCTGCACC GGATGAACAG CCGCCCGCTG 
CCGATGTTCG TCACCGACGC CGCGTTGCTC GCCGACCGCT TCATCGCCCC TACCGTCCCC 
GAATTCGACT ATCCGCGCGG CGATCTGCCG CCTCATGTGC GCTACGTGGG CGCCGTGCAT 
CCCGCACGGA CGCAGACGTT CACCCCGCCC CCGTGGTGGG GGGCGCTCGA CGGCGAACGC 
CCGGTGGTGC ACGTCACCCA GGGCACCGTC GACAACGCCG ACCCCCGGCG GCTACTGCTG 
CCGACCGTCG AGGCGCTGGC CGGTGAGGAG GTCACCGTGG TGGTCACCAC CGGTGGCCGT 
GGACTTTCCG TACCTCACAC CGCCCTGCCG ACGAATACCC ATGTGGCCGA ATTCATTCCG 
CACGACGTGT TGCTTCCGAA GGTCGACGTG ATGGTCACCA ACGGCGGGTT CGGTGCGGTG 
CAGCGCGCGC TGTCCCTCGG CGTGCCGCTC GTGGTCGCGG GCGACACCGA GGACAAGCCG 
GAGGTCGCCG CGCGCGTCGC CTGGACCGGT GCCGGTGTCG ACCTGCGCAC CGGCACGCCG 
ACTCCCGGTG CGATCCGCTC GGCGGTCCGC GACGTGCTCG ACCGCGCGCA CTACCGGGAG 
AACGCCCGAC GGCTCGAGGT CGCCTTCACA CGCCGCGACG GGGTGGCCGA GATCGCCGCG 
GTGATCGACG AAGTCCTCGC CGAGCGTCGT CAGACAGTGC GGTGA

Protein sequence

MPEVLIASMS PIGHLGPLLN LARGLVDRGD RVTVLTSAAR AGMIRAAGAR PRALPPQTDI 
DESRLNESLP GREKTSGIKR VDFDITNVFV TPMPHQAAAL AEAFAETRYD AVIVDAMFLG 
ILPFLLGEHA ARPPVLAYST TPLLISSRDT APPGLGLPPS SSPLGRLRNS ALTTLTHRVL 
LRGCHRAADE ALHRMNSRPL PMFVTDAALL ADRFIAPTVP EFDYPRGDLP PHVRYVGAVH 
PARTQTFTPP PWWGALDGER PVVHVTQGTV DNADPRRLLL PTVEALAGEE VTVVVTTGGR 
GLSVPHTALP TNTHVAEFIP HDVLLPKVDV MVTNGGFGAV QRALSLGVPL VVAGDTEDKP 
EVAARVAWTG AGVDLRTGTP TPGAIRSAVR DVLDRAHYRE NARRLEVAFT RRDGVAEIAA 
VIDEVLAERR QTVR