Gene Mjls_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3937
Symbol
ID	4879646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4157674
End bp	4159542
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	71%
IMG OID	640141249
Product	glycosyl transferase family protein
Protein accession	YP_001072203
Protein GI	126436512
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.260108
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTGA CCACCGAGGC ACCACCGGCG GCGGCGCCCG CCACCTCCGG AGGCCGCGCG 
CGCTGGGAGC GGCCGGCGCT GCTCACCCTG CTCGCCGCCA CCGCCGTGCT CTACCTGTGG 
GGGCTGGGCT CCTCGGGCTG GGCCAACGAA TACTACGCCG CGGCCGTGCA GGCCGGCACC 
CAGAACTGGA CGGCCTGGCT GTTCGGGTCG CTGGACCCCG GCAACTCCAT CACCGTCGAC 
AAGCCACCGG CTTCGCTCTG GCTGATGGTG TTGTCCGCCA GGTTGTTCGG GTTCAGCGCG 
TTTGCGATGC TGTTACCGCA GGCGCTGATG GGTGTGGCGA CGGTGGCGGT GCTGTTCGCC 
GCGGTGCGAC GGGTCAGCGG TGCGGGCGCC GGGATGGTCG CCGGTGCGGT GATGGCTACG 
ATGCCGGTGG CGGCGTTGAT GTTCCGCTTC AACAATCCCG ACGCGCTGCT GGTGCTGCTG 
CTCGTCGTCG CCGCGTACTG CATGGTGCGG GCGATCGAGA CCGCGAGTAC GCGCTGGATG 
GTCCTCGTCG GCTGCGCGTT GGGGTTCGCG TTCCTCACCA AGATGCTGCA GGCCTTCCTC 
GTGATGCCCG GTCTGGCGCT GGCGTTCCTG GTGGCGGCGC CGGTGGCGTT GTGGCGGCGG 
ATCGGCACGC TCGCCGTCGG CGCGGTGTCG ATGGTGGTGT CGGCGGGATG GTTCATCGCT 
CTGGTCGAGG TGTGGCCGGC GTCGTCGCGT CCCTACATCG GCGGTTCGAC CGACAACAGC 
CTGCTGCAGT TGGCCCTGGG CTACAACGGC ATCCAGCGAA TCGCCGGTGG CGGGGGACCG 
GGCGGCGGGC CCGGCGGCGG TCCGGGGGAC GGACCGGGTC GCGGCGCGAA TCTGTTCTTC 
GGCGGTGAGC CTGGGATCGG ACGCCTGTTC GGGCATTCGA TGGGTGTCGA GGCCTCGTGG 
CTCCTGCCCG CGGCGCTGAT CGGCCTGGCC GCCGGCATCT GGTTCACCCG CCGCGCCGTG 
CGCACCGACG CGGTACGCGC GAGCCTGCTG CTGTGGGGCG GGTGGCTGCT GGTCACCGGC 
GTCGTGTTCA GTTTCATGGA CGGCACGATC CACCCGTACT ACACGGTGGC GCTGTCGCCC 
GCGGTGGCCG CGCTGGTCGG CATCGCGGTC GTGGAGTGCT GGCGCGGCAG GCGCTACCTT 
CAGCCCCGCC TCGCGCTGGC CGCGATGATG GCGGCGACGG GCGTCTGGGC GTTCGTGTTG 
CTCGTCCGCA CCCCGGACTG GCTGCCGTGG CTGCGCTGGG TGGTGCTCGC GCTCGCGATT 
TTGGTCGCGG CGATCCTGGT GGTCGGTGCG CACCGGCTGA AGCGGGCCGC GACAGCCGTC 
GTCGTCGCCG CGGCGCTGGC CGGCCTCGCC GCGCCCACCG CCTTCGCGGT CTACAACGTG 
GCGCACCCCG CGAGTGGTCC CGGCACCATG TCCGGTCCCG CACGCGGCGA CGCCTTCGGA 
GGAATGCCAC CGGGAGGCCC CCGCGGCGAC CGGGACGACG CCGCCGTGGC GGAGCTGGTC 
CGAGGTGTCG ACAGCCGTTG GGCGGCAGCC AGTGTCGGGT CGATGGGATC GGCGGGTCTG 
CAGTTGGACT CCGGGGCCTC GATCATGGCG ATCGGCGGGT TCACCGGCTC GGACGCCTCG 
CCGACACTCG CGCAGTTCCA GCAGTACGTC GCCGACGGTG ATGTCCGGTA TTTCATCGGC 
AGTGACAGGG GTGGTCCACC CGGCTTCGGG CGCGACGGCA CCGCCGCGGA GATCACCGCG 
TGGGTGCAGG AGAACTTCAC CCCCGTTCAG GTTGGTGGAG CGACCGTCTA CGACCTGCAA 
TCCGGCTGA

Protein sequence

MTVTTEAPPA AAPATSGGRA RWERPALLTL LAATAVLYLW GLGSSGWANE YYAAAVQAGT 
QNWTAWLFGS LDPGNSITVD KPPASLWLMV LSARLFGFSA FAMLLPQALM GVATVAVLFA 
AVRRVSGAGA GMVAGAVMAT MPVAALMFRF NNPDALLVLL LVVAAYCMVR AIETASTRWM 
VLVGCALGFA FLTKMLQAFL VMPGLALAFL VAAPVALWRR IGTLAVGAVS MVVSAGWFIA 
LVEVWPASSR PYIGGSTDNS LLQLALGYNG IQRIAGGGGP GGGPGGGPGD GPGRGANLFF 
GGEPGIGRLF GHSMGVEASW LLPAALIGLA AGIWFTRRAV RTDAVRASLL LWGGWLLVTG 
VVFSFMDGTI HPYYTVALSP AVAALVGIAV VECWRGRRYL QPRLALAAMM AATGVWAFVL 
LVRTPDWLPW LRWVVLALAI LVAAILVVGA HRLKRAATAV VVAAALAGLA APTAFAVYNV 
AHPASGPGTM SGPARGDAFG GMPPGGPRGD RDDAAVAELV RGVDSRWAAA SVGSMGSAGL 
QLDSGASIMA IGGFTGSDAS PTLAQFQQYV ADGDVRYFIG SDRGGPPGFG RDGTAAEITA 
WVQENFTPVQ VGGATVYDLQ SG