Gene Mmcs_1779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1779
Symbol
ID	4110613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	1918611
End bp	1919756
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	67%
IMG OID	638030899
Product	thiolase
Protein accession	YP_638944
Protein GI	108798747
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.187266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGATG TCGCGATCAT CGGTGTGGGG CTGCATCCGT TCGGCCGGTT CGAGGGTAAG 
TCGGCGATGC AGATGGGCGT CGACGCGATC TTCGCCGCGG TCGACGACGC CGGCGTCGCG 
TGGTCGGATG TGCAGTTCGC CACCGGCGGC AGTTGGACGG TGGCCAACCC CGACGCCATC 
GTCGGCATGG TCGGGCTCTC GGGTATTCCG TTCACCAATG TCTTCAACGC CTGCGCCACC 
GCAGCGAGTG CGCTGAAGGC CTGCGCCGAC GGAATCCGAT TGGGCGACTA CGACATCGGC 
ATCGCGATCG GCCTGGACAA GCATCCGCGC GGCGCCTTCA CCGAGGATCC CGCACTGGTG 
GGCATGCCGT CCTGGTACGC GGAGAACGGC CAGTACCTGA CCACGCAGTT CTTCGGTATG 
AAGGCCAATC GCTATCTGCA CGATCACCAG ATCTCCCACG CCACGCTCGC CAAGGTGGCC 
GCCAAGAACT TCCGCAACGG GGCGCTCAAC CCGAATGCGT TCCGGCGCAA GCCGATGACC 
GAGGAGCAGA TCCTCGACTC GACGATGCTG AACTATCCGC TCACGCAGTA CATGTTCTGC 
GCGCCCGACG AAGGGGCCGC CGCGGTGGTG ATGTGCCGCG CCGACCTGGC CCACCGCTAC 
ACCTCGAAAC CGGTGTACCT GCGCGCGGTG GAGGTCCGCA CCCGGCAGTA CGGCGCGTAC 
GAGGTCAATA CCACGTTCGC GCCCGTCGAC GAGGACGTCG CGCCGACGGT GTACGCGGCC 
AGGTCGGCGT TCGAGAAGGC CGGCATCGCG CCGACCGACG TCGACGTCGT CCAGTTGCAG 
GACACCGACG CCGGCGCGGA GATCATCCAC ATGGCCGAAT GCGGATTCTG CGCCGACGGC 
GATCAGGAGA AGCTGCTGGC CGACGGCGCC ACCGAGATCG GCGGCCCACT GCCGATCAAC 
ACCGACGGTG GCCTGATCGC CAACGGCGAG CCGATCGGCG CATCGGGCCT GCGCCAGATC 
CACGAGCTGG TCCGGCAATT GCGGGGCGAG GCCGGAGACC GACAGGTACC CGGTGAGCCA 
CGGGTCGGGT TCGGGCAGCT CTACGGTGCG CCCGGTACCG CCGCGGCCAT GATCGTGTCC 
ACCTGA

Protein sequence

MNDVAIIGVG LHPFGRFEGK SAMQMGVDAI FAAVDDAGVA WSDVQFATGG SWTVANPDAI 
VGMVGLSGIP FTNVFNACAT AASALKACAD GIRLGDYDIG IAIGLDKHPR GAFTEDPALV 
GMPSWYAENG QYLTTQFFGM KANRYLHDHQ ISHATLAKVA AKNFRNGALN PNAFRRKPMT 
EEQILDSTML NYPLTQYMFC APDEGAAAVV MCRADLAHRY TSKPVYLRAV EVRTRQYGAY 
EVNTTFAPVD EDVAPTVYAA RSAFEKAGIA PTDVDVVQLQ DTDAGAEIIH MAECGFCADG 
DQEKLLADGA TEIGGPLPIN TDGGLIANGE PIGASGLRQI HELVRQLRGE AGDRQVPGEP 
RVGFGQLYGA PGTAAAMIVS T