Gene Mjls_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3101
Symbol
ID	4878814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	3242744
End bp	3244021
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	67%
IMG OID	640140401
Product	glycosyl transferase family protein
Protein accession	YP_001071371
Protein GI	126435680
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.61797
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.564364
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCG CGGTCGCCAT CCATGGCACC CGGGGTGACG TCGAACCGTG TGCAGCCGTA 
GCCCTGGAAT TGCAGCGCCG TGGACACGAA GTACGGGCTG CGGTACCGCC CAACACGGTC 
GGATTCGTCG AAGCTGTGGG CCTGTCTGCC GTCAGTTATG GCCCCGATTC CCAACAGCAG 
CTGCAGGGCG ATGTATTCGA ACGACCAGAC GCGCTAACGG CGGCCAGTCC ATCGGACTGG 
CTGCGGCTGG GAAACCCGCT CAACGCGCTG CGCAGGGCTC GCGTTGCCGC CACCCGCGGC 
TGGGATGAGA TGAGCCAGAC ACTGTTGTCG ATGACCGCGC GTGCCGACCT GGTCGTCACC 
GGCACGGCCT ATGAGGAGAT CGCGAGCAAC GTCGCTGAAT TCCGCGGCGT CCCGTTGGCG 
GAGGTACATT ACTTTCCGGT CCGCGCCAAC ACCCGCGTAC TGCCGGTTCG ACTACCGCCG 
ACGGCGGCCC ACGGCGCGTT CGCCGCGGGT GAATGGATGC ATTGGCAGCT GCTTAAACCC 
GCCGAGAGCC GGCAGCGGCG CACCCTGGGT CTACCCCCGG CGACCACTCG GCCGGTGGCA 
CGCATCGTGG CCGGCGAGGC TCTGGAGCTT CAGGCCTACG ATCCGGTGTT CTTTCCTGCG 
CTGGCGCAGG AGTGGGGCGC CCGGCGCCCT CTCATCGGGT CGATGACGAT GCGGCTTTCC 
ACCGAGGTCG ACGGCGAGGT GGCGTCGTGG ATCGCCGCAG GTCCCCCGCC CATCTACTTC 
GGATTCGGCA GCATGCCTTT GCACAACCCC ACAGACACGG TGCGTCTCAT TCGTGACGTG 
TGCGGCACGC TCGGCACGCG AGCACTGATC TGCGCGGGAA GTTCCGCGTT CGACGACATT 
GTTACCACCG AGGATGTCAA GGTCGTTGCC GACGTCAACC ACGCCGCGGT CTTTCCGATG 
TGCCGCGCCG TCGTGCACCA TGGCGGGGCG GGCACCACGG CTGCCGGACT GCGCGCCGGC 
GTTCCCACCT TGGTGTTGTG GGTGGCCGCC GAACAACCGC TGTGGGGCAA GCAGGTCAAA 
CGCCTTGGTG TCGGCACGTA CCGGCGTTTT TCCACCATTA CCCGGAATTC GTTGGTCGCC 
GATCTGCAGG TGGTGCTGGC CCCAGGTATG TCTGAGCGCG CGCGTTCGCT CGCTGGGCGA 
ATGAGCCGAC CTTCCGATAG CGTCACGACG GCCGCAGACT TGCTCGAGGG GGCGGCTCGC 
GCCGGCCGTC TCGGGTGA

Protein sequence

MKFAVAIHGT RGDVEPCAAV ALELQRRGHE VRAAVPPNTV GFVEAVGLSA VSYGPDSQQQ 
LQGDVFERPD ALTAASPSDW LRLGNPLNAL RRARVAATRG WDEMSQTLLS MTARADLVVT 
GTAYEEIASN VAEFRGVPLA EVHYFPVRAN TRVLPVRLPP TAAHGAFAAG EWMHWQLLKP 
AESRQRRTLG LPPATTRPVA RIVAGEALEL QAYDPVFFPA LAQEWGARRP LIGSMTMRLS 
TEVDGEVASW IAAGPPPIYF GFGSMPLHNP TDTVRLIRDV CGTLGTRALI CAGSSAFDDI 
VTTEDVKVVA DVNHAAVFPM CRAVVHHGGA GTTAAGLRAG VPTLVLWVAA EQPLWGKQVK 
RLGVGTYRRF STITRNSLVA DLQVVLAPGM SERARSLAGR MSRPSDSVTT AADLLEGAAR 
AGRLG