Gene Ndas_0357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0357
Symbol
ID	9244192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	432271
End bp	433458
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	73%
IMG OID
Product	acetyl-CoA acetyltransferase
Protein accession	YP_003678311
Protein GI	297559337
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGGTT CCGTCATCGT CGGTGGGGCA CGGACCCCCA CCGGCAGACT CCTCGGCTCC 
CTCGCCGGGT TCTCCGCCGC CGACCTCGGG GGCTTCGCGA TCAAGGCCGC GCTGGAACGC 
GCCGGCATCA CCGGCGAACA GGTCGGATAC GTGGTCATGG GACAGGTGCT CCAGGCGGGC 
GCGGGCCAGA TCCCGTCCCG CCAGGCCGCC GTCAAGGCGG GCATCCCCAT GAACGTGCCG 
TCGGTGACGA TCAACAAGGT CTGCCTGTCC GGCCTGGACG CGATCGCCCT CGCCGACCAG 
CTCATCTCCG CGGGCGAGTT CGACGTGGTG GTGGCCGGGG GCATGGAGTC CATGACCAAC 
GCGCCGCACC TGCTGCCCAA GTCGCGCAAG GGCTACAAGT ACGGGTCGGT CGAGGTCCTG 
GACGCGACCG CGCACGACGG CCTGACCGAC GCCTTCGAGG GCGACTCCAT GGGCGCCTCC 
ACCGAGCGCC ACAACGGCAA GCTCGGCATC GGGCGCGAGG AGCAGGACGC CTTCGCGGCC 
CGCTCCCACC AGCGCGCGGC CGCCGCGGCC GCCGCCGGGT ACTTCGACGC CGAGATCGTC 
CCCGTCCAGA TCCCGCAGCG CAAGGGCGAC CCCGTCGTCT TCTTCGCCGA CGAGGGCGTG 
CGGGCCGACA CCACCGCCGA GAGCCTGGCC CGCCTGCGCC CCGCCTTCGA CAGCGAGGGC 
ACCATCACCG CGGGCTCCTC CTCGCAGATC TCCGACGGCG CCGCCGCGGT GGTCGTGATG 
AGCCGCGCCA AGGCGGAGGA ACTGGGCGCC ACGGTCCTGG CCGAGATCGG CGCGCACGGC 
AACGTCGCCG GTCCGGACAA CTCGCTGCAC TCCCAGCCCT CCAACGCCAT CCGGCACGCG 
CTGGGCAAGG CGGGCCGCTC GGTCGAGGAC CTGGACCTGA TCGAGATCAA CGAGGCCTTC 
GCCGCGGTGG GCCTCCAGTC CACCCGCGAC CTGGGCGTCT CGGAGGACAT CGTCAACGTC 
AACGGCGGCG CCATCGCGCT CGGTCACCCG ATCGGCGCCT CCGGGGCCCG CATCGCCCTG 
CACCTGGTCC ACGAGCTGCG CCGCCGCGGC GGCGGGTTCG GCGCGGCCGC CCTGTGCGGC 
GGCGGCGGCC AGGGCGACGC CCTGCTGTTC ACGGTCCCCG CCGAGTAA

Protein sequence

MPGSVIVGGA RTPTGRLLGS LAGFSAADLG GFAIKAALER AGITGEQVGY VVMGQVLQAG 
AGQIPSRQAA VKAGIPMNVP SVTINKVCLS GLDAIALADQ LISAGEFDVV VAGGMESMTN 
APHLLPKSRK GYKYGSVEVL DATAHDGLTD AFEGDSMGAS TERHNGKLGI GREEQDAFAA 
RSHQRAAAAA AAGYFDAEIV PVQIPQRKGD PVVFFADEGV RADTTAESLA RLRPAFDSEG 
TITAGSSSQI SDGAAAVVVM SRAKAEELGA TVLAEIGAHG NVAGPDNSLH SQPSNAIRHA 
LGKAGRSVED LDLIEINEAF AAVGLQSTRD LGVSEDIVNV NGGAIALGHP IGASGARIAL 
HLVHELRRRG GGFGAAALCG GGGQGDALLF TVPAE