Gene Mjls_5066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_5066
Symbol
ID	4880764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	5312717
End bp	5313622
Gene Length	906 bp
Protein Length	301 aa
Translation table	11
GC content	71%
IMG OID	640142376
Product	short chain dehydrogenase
Protein accession	YP_001073321
Protein GI	126437630
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.727463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.567593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTGC TCGACGGCCG CGTGGTCATC GTGACGGGTG CGGGCGGCGG CATCGGCCGT 
GCGCACGCAC TGGCATTCGC CGCCGAAGGC GCGCGCGTGG TGGTCAACGA CATCGGTGTC 
GGCCTGGACG GATCGCCGGC CGGCGGCGGC AGCGCCGCGC AGAGCGTCGT CGACGAGATC 
ACCGCCGCCG GTGGGGAAGC CGTCACCAGC GGTGCCAACG TCGCGGACTG GGCGCAGGCC 
GAGGGACTGA TCCAAACGGC GGTCGACTCG TTCGGCGGAC TCGACGTCCT GGTCAACAAC 
GCCGGCATCG TGCGGGACCG GATGTTCGCC AACACCAGCG AAGAGGAGTT CGACGCGGTC 
ATCGCGGTGC ACCTCAAGGG GCATTTCGCC ACCATGAAGC ACGCTGCGGC GTACTGGCGC 
GCACAGTCCA AGGCCGGGAA GACCGTGGAC GCCCGCATCG TCAACACCAG TTCCGGTGCC 
GGCCTGCAGG GCAGCGTCGG ACAGGCCAAC TACAGCGCCG CCAAGGCGGG TATCGCGGCC 
ATGACGCTGG TGGCCGCCGC CGAGATGGGC CGCTACGGCG TCACCGTGAA CGCCATTGCG 
CCGTCGGCGC GGACCCGGAT GACCGAGACG GTGTTCGCCG AGATGATGTC CACCCAGGGC 
AACGACTTCG ACGCCATGGC GCCGGAGAAC GTCTCCCCGC TGGTCGTGTG GCTGGGTAGC 
ACCGAGTCCC GCGACATCAC CGGGCAGGTG TTCGAGGTCG AAGGCGGCAA GATCCGCGTG 
GCCGAGGGGT GGGCCCACGG GCCGCAGGTC GACAAGGGCG CCCGTTGGGA CCCCGCCGAA 
CTCGGACCCG TCGTCGCGGA TCTGCTGGCA AAGGCGCGGC CGCCGGTGCC GGTCTACGGC 
GCCTGA

Protein sequence

MGLLDGRVVI VTGAGGGIGR AHALAFAAEG ARVVVNDIGV GLDGSPAGGG SAAQSVVDEI 
TAAGGEAVTS GANVADWAQA EGLIQTAVDS FGGLDVLVNN AGIVRDRMFA NTSEEEFDAV 
IAVHLKGHFA TMKHAAAYWR AQSKAGKTVD ARIVNTSSGA GLQGSVGQAN YSAAKAGIAA 
MTLVAAAEMG RYGVTVNAIA PSARTRMTET VFAEMMSTQG NDFDAMAPEN VSPLVVWLGS 
TESRDITGQV FEVEGGKIRV AEGWAHGPQV DKGARWDPAE LGPVVADLLA KARPPVPVYG 
A