Gene Namu_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2040
Symbol
ID	8447649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2250281
End bp	2251261
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	71%
IMG OID	645041166
Product	3-oxoacyl-(acyl-carrier-protein) synthase III
Protein accession	YP_003201412
Protein GI	258652256
COG category	[I] Lipid transport and metabolism
COG ID	[COG0332] 3-oxoacyl-[acyl-carrier-protein] synthase III
TIGRFAM ID	[TIGR00747] 3-oxoacyl-(acyl-carrier-protein) synthase III

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0180217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0109261
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCA CCATTCGCAC CGCTGCCGGC TCCCCCGGGT CCAAGATCGT CGGTCTGGGT 
CACTACCGGC CCGACCGGGT GGTCACCAAC GACGATCTCG CCCAGATCAT GGACACCAAC 
GACGAGTGGA TCCAGGCCCG GGTCGGCATC GCCGAGCGCC GGTTCGCCGC CGCCGACGAG 
TCGGTGGCCT CGATGGGCGC CCAGGCCGGC GCCAAGGCCC TGGCCGAGGC GGGCCTGCAG 
CCCGAGCAGA TCGACACCGT GATCACCGCG ACCTGCAGCC TGGACTCCCC CGTCCCGCAC 
GCCTCGACCC AGATCGCCAG CCTGCTGGGC ATTCACGCGC CGGGTTCGTT CGACCTCAAC 
GCGGCCTGCG CCGGCTTCTG CTACGCGATC GCGGCCGCCG ACCAGGCGGT GCGCACCGGT 
GCCTCGCGCA ACGTGCTGGT GGTCGGCTCG GAGAAGCTGA CCGACTGGAC CAAGCGGGAC 
GACCGGGCGA CGGCGATCAT CTTTGCCGAC GGGGCCGGCG CCGTGGTGGT TTCGGCCGCC 
GACGAGCCGG GCATCGGCCC GGTCGTTTGG GGTTGCGACG AGGACCACAC CCAGACCATC 
CGGATCGAGG GCCGCAACGG CCATTTCATC CAGGAGGGCC AGACGGTCTT CCGCTGGGCC 
ACCTCCGCGA TCGCCCCGGT GGCGATCCGC GCGGCGGCGG CGGCCGGCGT CGCACTGGAC 
GAGATCGACG TGCTGGTCAC CCATCAGGCG AACCTGCGGA TCATCGACGG CATCGCCAAG 
AAGATCATCA GGGAAGGCGC GCGCCAGGAT CTCAAGGTCG GCCGGGACAT CGTCACCACC 
GGCAACACCT CCTCGGCGTC CATCCCGATC GCGCTGGACC GGATGCGCGC CGCCGGCGAG 
GTCTCCTCGG GCCAGGTCGT GCTCTCGGTC GCCTTCGGCG CGGGACTCAC CTACGCCAGC 
CAGGTGTTCG TCTGCCCCTG A

Protein sequence

MSATIRTAAG SPGSKIVGLG HYRPDRVVTN DDLAQIMDTN DEWIQARVGI AERRFAAADE 
SVASMGAQAG AKALAEAGLQ PEQIDTVITA TCSLDSPVPH ASTQIASLLG IHAPGSFDLN 
AACAGFCYAI AAADQAVRTG ASRNVLVVGS EKLTDWTKRD DRATAIIFAD GAGAVVVSAA 
DEPGIGPVVW GCDEDHTQTI RIEGRNGHFI QEGQTVFRWA TSAIAPVAIR AAAAAGVALD 
EIDVLVTHQA NLRIIDGIAK KIIREGARQD LKVGRDIVTT GNTSSASIPI ALDRMRAAGE 
VSSGQVVLSV AFGAGLTYAS QVFVCP