Gene Namu_4702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4702
Symbol
ID	8450332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5229598
End bp	5231118
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	71%
IMG OID	645043742
Product	AMP-dependent synthetase and ligase
Protein accession	YP_003203967
Protein GI	258654811
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGA GCTTGGCGGC CATCCTGTCC GAATCCGCGT CGCGCTACCC CGATCGGGAC 
GCGGTGGTGA TGGGGCCGCA ACGGATCGGG TACGCCACCC TGTGGCAGGA GTCTCGCCGG 
TACGCCGCGG TGCTGCGCGA GCGCGGCGTC GGCCCGGGCG ACCGGGTGGC CCTCCTGTTG 
CCGAACGTGC CCGACTTTCC CCGGGTCTAC TACGCCGTGC TGTCCCTGGG CGCCGTCGTC 
GTGCCGGTGC ACGCGCTGCT GGTCGCCCGG GAGATCGGTT TCGTGCTGAC CGACTCCCAG 
GCCTCGCTGC TGGTCGCCGC CGGGCCGCTG CTGGCGCAGG GGCTGCCCGG GGCGGAGCAG 
GCCGGGGTGC CGGTGCTGGC GGTGCTCGGC GGGCCCGAGG GCGTCGACCG GCTGGACCTG 
CTGGCCGCCG ACGTCGAGCC GATCCGCACC TACGTCCAGC GCGAACCGTC GGACGAAGCG 
GTGATCCTGT ACACCTCGGG CACCACCGGC TCGCCCAAGG GTGCGGTGCT CACCCAGCTG 
AACATGGCGA TGAACGCCAT GATCAGCGCG ACGACCGTGC TGGATCTGAC GCCCGAGGAC 
GTGATCCTGG GCTGCCTACC CCTTTTCCAC TCGTTCGGCC AGACCTGCTC GATGAACGCC 
GGCTTCTACG CGGGCAGCAC GTTGGTGCTG CTGCCGCGCT TCGACGGGGC GGCCGCACTC 
GAGCTGATCG TGGGCGAGAG CGTGAACGTG TTCATGGGCG TGCCCACCAT GTACATCGGC 
CTGCTGGCCG CCGCCCGGGA GGACGAGCGT CGGCCGGTGC TGCGGCGGGC GGTCTCCGGC 
GGGGCGAGCC TGCCGGTGGC CGTCATCGAC GCGTTCAAGC GGGTGTTCGA GGCCGACATC 
TACGAGGGGT ACGGGCTGTC CGAGACCTCG CCGGTGGCCA CCTTCAACCA GGCCGTGTTC 
GGCCGCAAGC CGGGCACGGT CGGCCGCGCG ATCTGGGGCA CCGAAGCGGA GATCGCCGAC 
CCGGCGATCG AGGACCGGAT CGCGCTGCTG CCGCAGGGCG AGGTCGGCGA GGTGGTGCTG 
CGCGGCCACA ACATCTTCGC CGGCTATCTG AACAACCCGC AGGCCACCGC GGCCGCCGTG 
GTCGACGGCT GGTTCCGCAG CGGCGATCTG GGGGTCAAGG ACGCCGACGG GTTCCTCTCG 
ATCGTCGACC GGAAGAAGGA CCTGATCATC CGCGGCGGGT TCAACGTCTA CCCGCGCGAG 
GTGGAGGAGG TGCTGGCCAG CCACCCCGGG ATCGCCCAGG TCGCCGTCGT CGGGGTGCCC 
GACGCCACCC ACGGTGAGGA GATCTGCGCC GTCGTCGTGC GCTCGCCGGA GGGACAGGAC 
CTGGACGCCG ACACCCTGAT GACCTGGTCC CGGGAGAAGT TGGGCCGGCA CAAGGTGCCC 
CGGCGGGTCG AGTTCGTCGA GACGTTGCCG CTGGGCCCCA GCGGCAAGAT CCTCAAGCGG 
GAACTGATCA AGCAGCTGTA G

Protein sequence

MSLSLAAILS ESASRYPDRD AVVMGPQRIG YATLWQESRR YAAVLRERGV GPGDRVALLL 
PNVPDFPRVY YAVLSLGAVV VPVHALLVAR EIGFVLTDSQ ASLLVAAGPL LAQGLPGAEQ 
AGVPVLAVLG GPEGVDRLDL LAADVEPIRT YVQREPSDEA VILYTSGTTG SPKGAVLTQL 
NMAMNAMISA TTVLDLTPED VILGCLPLFH SFGQTCSMNA GFYAGSTLVL LPRFDGAAAL 
ELIVGESVNV FMGVPTMYIG LLAAAREDER RPVLRRAVSG GASLPVAVID AFKRVFEADI 
YEGYGLSETS PVATFNQAVF GRKPGTVGRA IWGTEAEIAD PAIEDRIALL PQGEVGEVVL 
RGHNIFAGYL NNPQATAAAV VDGWFRSGDL GVKDADGFLS IVDRKKDLII RGGFNVYPRE 
VEEVLASHPG IAQVAVVGVP DATHGEEICA VVVRSPEGQD LDADTLMTWS REKLGRHKVP 
RRVEFVETLP LGPSGKILKR ELIKQL