Gene Mmcs_3573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3573
Symbol
ID	4112405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	3804893
End bp	3806197
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	71%
IMG OID	638032708
Product	glycosyl transferase family protein
Protein accession	YP_640736
Protein GI	108800539
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR01426] glycosyltransferase, MGT family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGAAG TACTGATCGC GTCCATGTCG CCGATAGGCC ACCTCGGGCC GTTGCTCAAC 
CTCGCCCGCG GCCTCGTCGA CCGCGGTGAC CGGGTCACGG TCCTGACCTC GGCCGCGCGC 
GCCGGGATGA TCCGCGCGGC CGGGGCACGA CCCCGCGCCC TGCCGCCGCA GACCGACATC 
GACGAGAGCC GGCTCAACGA AAGCCTCCCC GGGCGCGAGA AGACGTCCGG CATCAAACGG 
GTCGACTTCG ACATCACCAA CGTCTTCGTG ACCCCGATGC CCCATCAGGC GGCGGCCCTG 
GCCGAGGCGT TCGCCGAGAC ACGGTATGAC GCCGTCATCG TCGACGCGAT GTTCCTGGGC 
ATCCTGCCGT TCCTGCTCGG TGAACACGCC GCCCGCCCAC CGGTGCTGGC CTACTCGACC 
ACGCCGCTGT TGATCAGCAG CCGGGACACC GCTCCTCCGG GGTTGGGTCT GCCGCCGTCG 
TCGAGCCCGC TCGGGCGGCT GCGCAACTCG GCGCTGACCA CGCTGACGCA CCGGGTCCTC 
CTGCGAGGCT GCCACCGGGC CGCCGACGAG GCGCTGCACC GGATGAACAG CCGCCCGCTG 
CCGATGTTCG TCACCGACGC CGCGTTGCTC GCCGACCGCT TCATCGCCCC TACCGTCCCC 
GAATTCGACT ATCCGCGCGG CGATCTGCCG CCTCATGTGC GCTACGTGGG CGCCGTGCAT 
CCCGCACGGA CGCAGACGTT CACCCCGCCC CCGTGGTGGG GGGCGCTCGA CGGCGAACGC 
CCGGTGGTGC ACGTCACCCA GGGCACCGTC GACAACGCCG ACCCCCGGCG GCTACTGCTG 
CCGACCGTCG AGGCGCTGGC CGGTGAGGAG GTCACCGTGG TGGTCACCAC CGGTGGCCGT 
GGACTTTCCG TACCTCACAC CGCCCTGCCG ACGAATACCC ATGTGGCCGA ATTCATTCCG 
CACGACGTGT TGCTTCCGAA GGTCGACGTG ATGGTCACCA ACGGCGGGTT CGGTGCGGTG 
CAGCGCGCGC TGTCCCTCGG CGTGCCGCTC GTGGTCGCGG GCGACACCGA GGACAAGCCG 
GAGGTCGCCG CGCGCGTCGC CTGGACCGGT GCCGGTGTCG ACCTGCGCAC CGGCACGCCG 
ACTCCCGGTG CGATCCGCTC GGCGGTCCGC GACGTGCTCG ACCGCGCGCA CTACCGGGAG 
AACGCCCGAC GGCTCGAGGT CGCCTTCACA CGCCGCGACG GGGTGGCCGA GATCGCCGCG 
GTGATCGACG AAGTCCTCGC CGAGCGTCGT CAGACAGTGC GGTGA

Protein sequence

MPEVLIASMS PIGHLGPLLN LARGLVDRGD RVTVLTSAAR AGMIRAAGAR PRALPPQTDI 
DESRLNESLP GREKTSGIKR VDFDITNVFV TPMPHQAAAL AEAFAETRYD AVIVDAMFLG 
ILPFLLGEHA ARPPVLAYST TPLLISSRDT APPGLGLPPS SSPLGRLRNS ALTTLTHRVL 
LRGCHRAADE ALHRMNSRPL PMFVTDAALL ADRFIAPTVP EFDYPRGDLP PHVRYVGAVH 
PARTQTFTPP PWWGALDGER PVVHVTQGTV DNADPRRLLL PTVEALAGEE VTVVVTTGGR 
GLSVPHTALP TNTHVAEFIP HDVLLPKVDV MVTNGGFGAV QRALSLGVPL VVAGDTEDKP 
EVAARVAWTG AGVDLRTGTP TPGAIRSAVR DVLDRAHYRE NARRLEVAFT RRDGVAEIAA 
VIDEVLAERR QTVR