Gene Mjls_4947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4947
Symbol
ID	4880646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	5189379
End bp	5190464
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	65%
IMG OID	640142257
Product	UDP-sulfoquinovose synthase
Protein accession	YP_001073203
Protein GI	126437512
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.109303
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCG AACTCGGGGT GCAGTCCCTG ACCCCGATCG CCTCGCTCCC TGAGCGGCTC 
ACCGGCTGGC GTGAGGTGTC CGGCAGACGA ATCGAGTCCG TAAACCCCGA CATCGCCGAG 
GATTACGGCG AGCTGCTCGA CCTTCTGCGC AGTGCGCGCC CCGACGCCGT CGTCCATTTC 
GCCGAACAAC GTGCCGCGCC GTATTCGATG AAGGACGCCG CCCACAAGCG CTACACCGTC 
GCCAACAATG TGAACGCGAC GCACAACGTG CTGGCCGCAC TCGTGGAGTC CCGCCTCGAC 
TGCCATCTCG TGCACCTCGG GACGATGGGC GTCTACGGCT ACGAGACCTC GGCGGTGAAT 
CTCCCCGAGG GCTACCTCAC GATCAGCTAC CCCGACCGCC ACGGGGCCGT CGTGACCCGT 
GAGGCGCTCT ATCCGACCAA ACCCGGCAGC ATCTACCACC TCACCAAGTC GCTGGACCAA 
CTGTTGTTCC AGTTCTACGC ACAGAACGAC CGGTTGCGGA TCACCGATCT GCACCAGGGC 
ATCGTGTGGG GCACCCAGAC CGAGGAGACT CGTCGCGATC CGCGGTTGAT CAACCGGTTC 
GACTACGACG GTGACTTCGG TACGGTGCTC AACCGGTTCC TCTTGCAGGC CGCGATCGGT 
TATCCGTTGA CCGTGCACGG AACCGGCGGA CAGACCCGGG CCTTCATCAA CATCCAGGAC 
ACGGTTCGTT GCGTGCGATA CGCCGTGGAA TCCGGAACGC AGGTGGGGTC CCGGGTGCGA 
ATCATGAACC AGGTCGCCGA GACACTGCGG GTGCGAGACC TCGCCCACCT TCTCGAGCGG 
CTCGTCGGTG CAGAGGTCGC CTATCTGCCC AATCCCCGGG CCGAGGCCGA CGAGAACGAG 
CTCGCCGTGT GCACCGACAA TCTGCGACAG CTGGGATTGG ACCCGATTCT GCTGGAGGCC 
GGACTCCTGG CCGAATCTCT CGAGATCGCA GCGGCATACG CCGATCGGTG TGACCTCGGC 
AAGATCCCGT GCGTGTCCTA TTGGAACGAC GAGCGCCGGT GCGCAGCCGA GAAGGTCGAC 
CGGTGA

Protein sequence

MDTELGVQSL TPIASLPERL TGWREVSGRR IESVNPDIAE DYGELLDLLR SARPDAVVHF 
AEQRAAPYSM KDAAHKRYTV ANNVNATHNV LAALVESRLD CHLVHLGTMG VYGYETSAVN 
LPEGYLTISY PDRHGAVVTR EALYPTKPGS IYHLTKSLDQ LLFQFYAQND RLRITDLHQG 
IVWGTQTEET RRDPRLINRF DYDGDFGTVL NRFLLQAAIG YPLTVHGTGG QTRAFINIQD 
TVRCVRYAVE SGTQVGSRVR IMNQVAETLR VRDLAHLLER LVGAEVAYLP NPRAEADENE 
LAVCTDNLRQ LGLDPILLEA GLLAESLEIA AAYADRCDLG KIPCVSYWND ERRCAAEKVD 
R