Gene Namu_4552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4552
Symbol
ID	8450180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5064496
End bp	5066187
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	73%
IMG OID	645043593
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_003203820
Protein GI	258654664
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGT TCTCCGACGC CCTGTGCACA GCGGCGCAGG GCCCCACCGG CATGACCACT 
GGCGAGCCGC ATGAGCCGGT TCGCACGTCC TGGGCCGATG TCCACGCCAA GGCCTGCGCC 
GGGGCGCGGG TGCTGGCCGC CCACGGGATC GGGCCGGGTG ACGCGGTCGC GGTGCTGGCC 
GCCAAGCCGT TCGAGGTGGC CCCGATCGCC CAGGCGGCCT GGTTGGCCGG GGCCTCGGTG 
ACGATGCTGC ACCAGCCCAC CGCCCGGACC AATCTGATGA CCTACGCGCA GGACACGGCC 
GCGGTGCTGT CCCTGGTCGG GGCCAAGGCA GCCGTGCTGG GCGACCCGTT CACCGAGTTC 
GCGGAACTGT TGGACGGTTC GGGCGTGCTC GCGCTGACCG TCGACGATCT GCTGGCCGAG 
CCCGGCGGTC CGGCTCCGGA CGTCGAGATC GGCGAGGACC TGCCGGCCCT GCTGCAGCTG 
ACCTCCGGGT CGACCTCGAC CCCCAAGGCC GTGCGGATCA CCCACCGCAA CCTGTGGGCC 
AACATCGAGG CGATGTGCCA GGCGGCCCAG ATCCGGCCGG GCGAGGTGAT GGTGTCCTGG 
TTGCCGCTGT TCCACGACAT GGGCATGGTC GGCTTCCTGA CCCTGCCGAT GTGCCGGGGC 
ATCGAGCTGG TCACCGTCAC CCCCACCGAT TTCCTGGCCT CGCCGTTGAT CTGGCCGACG 
TTGATCAGCA AGTACCGCGG CACCATCACC GCCGCCCCCA ACTTCGCCTT CGCGCTGACT 
GCGCGGGTGC TGGCCCGGCC GACCACCCGG GAGCTGGGCC TGGACCTGTC CTGCATGCGG 
TTCGCGCTGA ACGGGGCCGA ACCGATCGAC GTCGCCGCGG TCCGGGCCTT CCTGGCCGCG 
GGGGCACCGT TCGGGCTCCC GGAGACCGCG GTGGTCTGCG CCTACGGCAT GGCCGAGGCG 
TCGTTGGCCG TGTCCTTCCA CCCCTGGGGC ACCCCGCTCA AGGTGGACAC CGTCGACGCG 
CAGGCGTTGG AGATCGCCCG GCGGGCGGTG CCGGCCGAAT CGGGCCGCTC GTTCCCGGTG 
CTGGGCCCGC CGCTGGACGG GATCGAGGTC GCCGTGCGGG GCCGCGACGG CGCGGTGCTC 
GGCGACCGCG AGGTCGGGGT GCTGCACCTG CGCGGCGAGT GCATCACCGA GCAGTACCTG 
ACCGTGGACG GGCCGGTGGC CACCCAGGAT GCCGACAAGT GGCTGGACAC TGGGGATCTC 
GGCTACCTGG TGGACGGCGA GGTGGTGGTC TGCGGCCGGG TCAAGGACGT GATCATCATG 
GGTGGGCGCA ACATCTACCC GACCGACATC GAGCGGGTGG CCCAGAGCAT CGACGGCGTT 
CGAGCGGGTA ACGCGGTCGC GGTGCGGTGG ACGACGCCCA GCGGTCGCGA ATCGTTCGCG 
GTGGCCGTCG AGTCCCGCGA GGCCGGTGAC CAGGACGCGG CCGAGCGCAT CCGGCAGGCC 
GTGCGGTCGG CGGTGACCGC CGAGATCGGC GCCCGCCCGG CGACGGTGTC GGTGCTCCCG 
GTCGGGAGTC TGCCCAAGAC TCCGTCCGGC AAGCTGCAGC GCTCCGCCGC GGCCCGGTTG 
ATCACGCCAC CGCCGGCCGA GGCGCTGCCG GTTCGGCCCC CGGCGCCCGA GGGTCTGCCG 
CTGCCCGGCT GA

Protein sequence

MSAFSDALCT AAQGPTGMTT GEPHEPVRTS WADVHAKACA GARVLAAHGI GPGDAVAVLA 
AKPFEVAPIA QAAWLAGASV TMLHQPTART NLMTYAQDTA AVLSLVGAKA AVLGDPFTEF 
AELLDGSGVL ALTVDDLLAE PGGPAPDVEI GEDLPALLQL TSGSTSTPKA VRITHRNLWA 
NIEAMCQAAQ IRPGEVMVSW LPLFHDMGMV GFLTLPMCRG IELVTVTPTD FLASPLIWPT 
LISKYRGTIT AAPNFAFALT ARVLARPTTR ELGLDLSCMR FALNGAEPID VAAVRAFLAA 
GAPFGLPETA VVCAYGMAEA SLAVSFHPWG TPLKVDTVDA QALEIARRAV PAESGRSFPV 
LGPPLDGIEV AVRGRDGAVL GDREVGVLHL RGECITEQYL TVDGPVATQD ADKWLDTGDL 
GYLVDGEVVV CGRVKDVIIM GGRNIYPTDI ERVAQSIDGV RAGNAVAVRW TTPSGRESFA 
VAVESREAGD QDAAERIRQA VRSAVTAEIG ARPATVSVLP VGSLPKTPSG KLQRSAAARL 
ITPPPAEALP VRPPAPEGLP LPG