Gene Mkms_4780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4780
Symbol
ID	4616195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	5010802
End bp	5012322
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	69%
IMG OID	639794471
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_940760
Protein GI	119870808
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCG CCCCGAGGAC GATCCCTGCC GTTCTCGACC GGATTGCAGA GCAGTTCTCC 
GACCACGAGG CCGTGGTCAC GGACGATCGC CGCCTGACCT ACGCGCAGCT GCGTGACGAG 
GTGCGCCGGG CCGCCGCGGC GATGATCGAC CTCGGCATCG CCGCGGGTGA CCGCGTCGCG 
ATCTGGTCAC CGAACACCTG GCACTGGGTC GTCGCAGCCC TGGCCACGAC CTACGCCGGC 
GGCGTCGTCG TCCCGCTCAA CACCCGCTAC ACCGCAAGCG AGGCGAGCGA CATCCTCGCC 
CGCACCGCCG CGCCCCTGTT GATCACGGCA GGGAAGTTCC TCGGCGCGGA CCGGTCGGCC 
GACCTCGACC GCTCGGCGCT GCCGGCACTT CGTCACATCG TGCGGGTGCC GATCGAGACA 
GCCGACGGTA CATGGGACGA CTTCGTCTCG CGCGGAACGG ATCTCGCTGC GGCCGACGCG 
CGGGCCGCGG CCGTCCGCCC CGACGACGTG GCCGACATCC TGTTCACCTC GGGGACCACG 
GGACGCAGCA AGGGTGTGCT GTGCGCGCAC CGTCAGTCCC TGGACGCGCC CGCGGCGTGG 
GCGGAGTGCG GACAGCTCAC CAGCTCCGAC CGGTATCTGT GCATCAACCC GTTCTTCCAC 
AACTTCGGAT ACAAGGCCGG GATTCTGACC TGCCTGCAGA CCGGGGCCAC GCTGATCCCG 
CAGCTGACGT TCGATCCCGA GAAGGCGATG GCCGCCGTCG CCGAACAGCG GATCACCGTG 
CTTCCCGGCC CCCCGACGAT CTACCAGACC ATCCTCGACC ACCCGAAACG CGCCGAGTAC 
GACCTGACGT CGCTGCGATT CGCGGTCACC GGCGCCGCCG TCGTCCCCGT CGTGCTGATC 
GAGCGGATGC AGTCCGAACT CGACATCGAC ATCGTGCTGA CCGCCTACGG GCTGACCGAG 
GCGAGTGGCT TCGGCACGAT GTGCCGGGCC GACGACGACG CGGTCACCGT CGCCACCACC 
TGCGGACGGC CGATCGCCGG CTTCGAACTG CGCATCGGCG ATTCGGGCGA GGTGCTGCTG 
CGCGGGCCGA ACGTGATGCT CGGCTATCTC GACGACCCGG AGGCCACCGC GGCCGCGATC 
GACCCCGACG GCTGGCTGCA CACCGGCGAC GTCGGCACCG TCGACGAACG CGGCAACCTG 
CGGATCACCG ACCGGCTCAA GGACATGTAC ATCTGCGGCG GCTTCAACGT CTATCCCGCG 
GAGATCGAAC AGGTCCTCGC CCGCCTCGAC GGGGTCGCCG AATCGGCCGT GATCGGGGTG 
CCCGACGAGC GGCTCGGTGA GGTCGGCAAG GCCTTCGTCG TCGCCAAACC GGGTGCGAAC 
CTCGACGAAC AGGCCGTGAT CGCCTACGCG CGTGACCATC TCGCGAATTT CAAGACGCCG 
CGGTCGGTGG AATTCCTCGA CGTGCTGCCC CGCAACCCGG GCGGCAAGGT CGTCAAACCG 
CTCCTGAGGA AGAGAGCCTG A

Protein sequence

MTTAPRTIPA VLDRIAEQFS DHEAVVTDDR RLTYAQLRDE VRRAAAAMID LGIAAGDRVA 
IWSPNTWHWV VAALATTYAG GVVVPLNTRY TASEASDILA RTAAPLLITA GKFLGADRSA 
DLDRSALPAL RHIVRVPIET ADGTWDDFVS RGTDLAAADA RAAAVRPDDV ADILFTSGTT 
GRSKGVLCAH RQSLDAPAAW AECGQLTSSD RYLCINPFFH NFGYKAGILT CLQTGATLIP 
QLTFDPEKAM AAVAEQRITV LPGPPTIYQT ILDHPKRAEY DLTSLRFAVT GAAVVPVVLI 
ERMQSELDID IVLTAYGLTE ASGFGTMCRA DDDAVTVATT CGRPIAGFEL RIGDSGEVLL 
RGPNVMLGYL DDPEATAAAI DPDGWLHTGD VGTVDERGNL RITDRLKDMY ICGGFNVYPA 
EIEQVLARLD GVAESAVIGV PDERLGEVGK AFVVAKPGAN LDEQAVIAYA RDHLANFKTP 
RSVEFLDVLP RNPGGKVVKP LLRKRA