Gene Mjls_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4151
Symbol
ID	4879857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4385653
End bp	4386813
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	640141460
Product	thiolase
Protein accession	YP_001072414
Protein GI	126436723
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0423188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAACG TCGCAGTCGT CGGCGCGGGG ATGACGCCGT TCGCCGAGCA CTTCGAACTA 
GGGATCAAGG ACCTGGTGCC GATGGCGTAC GCCGAGGCCG TCGGAAATGT CGACAAGGGC 
ATCCAGAAGT CCGAAATCGA AGCGGCGTGG TTCGGCGAGC TGTCCACCAC TGACGGGTTC 
CCGTCGGGCA TTCTGGCCGA TACTCTCGAC CTGACCGACA TCCCCGTGAC CCGGGTCGAG 
AACGCCTGCG CCACTGGCAA TGACGCGATC CGCAACGGCA CCATGGCCAT CGCCTCAGGT 
GTCTACGACG TGGTGCTGGT GGTCGGTGCC GACAAGGTGC GCGAGACGTC TTCGACCACC 
ACGTTCTGGG ATTGGGCGGC GATGACCCGC GACAACGCCT GGGACTATCC GCTGGGACTG 
GTCGCGCCGG CCAACTTCGC GCTGCACGTC ATGCGCTACC TACACGAGTC GCCGGCGACC 
AAGGAACACA TGGCGATGGT CGCGGTGAAG AACCACTTCC ACGCGCTGAA CAACCCGAAA 
GCTCAACTGC GCTACGAGAT CACCGTGGAG AAGGCGCTGG CCGCGCCCAT CGTGGTCGAA 
CCGTTCGGGC TGTACGACTG CACCCCGCAG AGTGACGGCG CCGCAGCGGT CATCCTGGCC 
GCAGAGGACG TCGTCGACCG CTACACCGAC CGACCGGTGT GGGTGCGCGG CGTGGGTCTG 
GGCATGGACC GGGTGATGCA TCAGCACAAG CAGGACATGA CGACGTTCCC CCCGACGGTG 
CGTGCGGCGA AGGCCGCGAT GAAGATGGCA GGCGTGACAC CCCGCGACAT CGACGTGGCC 
GAGGTGCACG ACTGTTTCAC CGGTGTCGAA CTGATCAGCT ACGAGGACCT CGGGTTCGCC 
AACCGGTACG AGGCCTACAA ACTCGTCGAG GGCCGCGAGC ACTACGTCGG CGGGTCGATT 
CCGATCAACC CGAGTGGGGG ACTGAAGGCC AAGGGTCACC CACCGGGCGC AACCGGCGTG 
GCGCAGTGCT ACGAACTGTT CAACCAACTC CGCGGTGAAG CCGAGAATCA GGTCGACGGC 
GCCCGAGTCG CGTTGGCCCA CAACATCGGC GGCCCGACTG CGGTCTCCGC GGTCACCATC 
CTTTCCAGCG ACAAGAACTG A

Protein sequence

MRNVAVVGAG MTPFAEHFEL GIKDLVPMAY AEAVGNVDKG IQKSEIEAAW FGELSTTDGF 
PSGILADTLD LTDIPVTRVE NACATGNDAI RNGTMAIASG VYDVVLVVGA DKVRETSSTT 
TFWDWAAMTR DNAWDYPLGL VAPANFALHV MRYLHESPAT KEHMAMVAVK NHFHALNNPK 
AQLRYEITVE KALAAPIVVE PFGLYDCTPQ SDGAAAVILA AEDVVDRYTD RPVWVRGVGL 
GMDRVMHQHK QDMTTFPPTV RAAKAAMKMA GVTPRDIDVA EVHDCFTGVE LISYEDLGFA 
NRYEAYKLVE GREHYVGGSI PINPSGGLKA KGHPPGATGV AQCYELFNQL RGEAENQVDG 
ARVALAHNIG GPTAVSAVTI LSSDKN