Gene Mjls_4069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4069
Symbol
ID	4879777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	4300681
End bp	4301799
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	72%
IMG OID	640141380
Product	putative thiolase
Protein accession	YP_001072334
Protein GI	126436643
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.655327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.671191
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCGA TGTCCTTGCG CCCCGGCAAG ACACCCGTGG AGCTGGCCGC TCAGGCCAGC 
GGCGCCGCGC TGGCCGACGC CGGCATTGCG CGCAGCGACG TGGACGGCCT GCTGGTCGGC 
TCCTCGCAGG GCGTGCGGCC GGATCGGCTC GGTGTCGGTT TCGCCGCCCA GGCGGGCTTC 
GCCGACCTAC GCCTGCTCGA ACACGTCGAG ATCAAGGGCG CCACCACGAT TGCCATGATC 
CAGCGCGCGC GCCACGCGAT CGCCACCGGC GAGGCCTCGA CCGTGCTGTG CGTATTCGCC 
GATGCCCCGC TGGTGGCCGG ACGGGGTGCC GGATCGACCT ACGCGCAGAG CGGCGGCAAC 
AACGGAACGC GCGGCCTGGA GCGGGCCTCC GGCCTGCTCG GCTCGGTGCC GACCTACGCG 
CTGCTGGCCC AGCGGTGGCT GCACGTCACC GGAACCGGTG CCGAGGCGCT GCGTTCGGTG 
GCCACCACGG CGCGACGCTG GGCGCAGGAC AATCCCCATG CGGTCAACCG TGAACCGCTC 
GACGACGACG GCTACCAGCG AAGTCCGATG ATCGCCGAAC CGCTGCGGCT GCTGGACTGC 
GCAAGACCGG TCAACGGCGC TGTCGCGGTG GTGCTCACCG GTCGAGCTTC GGTCGGCACC 
ACGCGCGTTC GCGTGCGCGG TGCCGGGAGG GACCATCCGG TGCGTCGCCG CCGGGCAGGC 
GCCGAGTCGT GGTTCGGTGG CGGCGGCCGG GCGGTGGAGG ACGCGCTCGA CCAGGCCGGC 
ATGTCCCGAT CGGACCTCGA TGTTGCTGAG CTCTACGACC CGTTCTCGAT CGTCACCCTG 
GTGCTGCTCG ACGAATACCG TCTCACCGGC GGCGTACCCG CAGGCGCCTT CGTCCGCGAC 
GGCCACACCG GCCCGGGCGG CACGCTGCCC ACCAACACCG GTGGTGGTCA GCTCTCCGGC 
TTCTACCTGC AGGGCATGAC GCCGCTCGCC GAGGCCGTGA TCCAGTTACG CGGCGCCGGT 
GGGCAGCGCC AAGTCCCCGA TGCCGCCGTG GCCCTGGTCG GCGGCATCGG TGGCCGGCTG 
GACCACCACG CCGCACTGGT TCTGGAGCGG GCGGCATGA

Protein sequence

MTPMSLRPGK TPVELAAQAS GAALADAGIA RSDVDGLLVG SSQGVRPDRL GVGFAAQAGF 
ADLRLLEHVE IKGATTIAMI QRARHAIATG EASTVLCVFA DAPLVAGRGA GSTYAQSGGN 
NGTRGLERAS GLLGSVPTYA LLAQRWLHVT GTGAEALRSV ATTARRWAQD NPHAVNREPL 
DDDGYQRSPM IAEPLRLLDC ARPVNGAVAV VLTGRASVGT TRVRVRGAGR DHPVRRRRAG 
AESWFGGGGR AVEDALDQAG MSRSDLDVAE LYDPFSIVTL VLLDEYRLTG GVPAGAFVRD 
GHTGPGGTLP TNTGGGQLSG FYLQGMTPLA EAVIQLRGAG GQRQVPDAAV ALVGGIGGRL 
DHHAALVLER AA