Gene Ndas_4162 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4162
Symbol
ID	9248036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4969359
End bp	4970501
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	73%
IMG OID
Product	acetyl-CoA acetyltransferase
Protein accession	YP_003682063
Protein GI	297563089
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGAGG CATACATCGT CGGCGCAGTA CGCACCCCCG TCGGGACGAA GAAGGGCGCC 
CTGGCCGCCG TGCACCCGGC GGACCTGGGG GCGCACGTGC TCAGGGAACT CGTCTCCCGG 
ACCGGGGTGG ACCCCGCCGC GGTCGAGGAC GTCATCATGG GCTGCGTCAG CCAGGTCGGG 
CCGCAGGCGC TCGACCTCGC CCGCACCTCC TGGCTCTCCG CGGGCCTCCC GGAGTCCGTC 
CCCGGCGTCA CCATCGACCG CCAGTGCGGC TCCTCCCAGC AGGCCGTCCA CTTCGCCGCC 
CAGGGCGTCA TGTCCGGCAC CCAGGACCTC GTCGTGGCCT CGGGCGTGGA GAACATGGGC 
ATGGTCCCCA TGGGGGCCAA CGTCCAGTAC GCCCTCGACA ACGGGCTCGG GCTGTACGGC 
GACGGCTGGG CCGAGCGCTA CGGCCACCAG GAGATCTCCC AGTTCCGCGG CGCCCAGCTC 
ATGTGCGAGA AGTGGGGCTT CAAGCGCGAG CAGCTGGAGG AGTTCGCCCT GGAGAGCCAC 
CGGCGCGCGG CCCGGGCGCT GGAGGCGGGT TACTTCGACG AGCAGATCGC CCCCCTGGCC 
GGGGTGGAGC GCGACGAGGG CGTGCGCCCC GACACCACCC TGGAGAAGAT GGCGGGCCTG 
AAGCCGCTGC GCGAGGGCTG GGCGCTCACC GCCGCCGTGG CCAGCCAGAT CTCCGTCGGC 
GCGGGCGCGG TCCTGATCGC CTCCGAGCGG GCGGTCGAGC GGCACGGCCT GACCCCGTTG 
GCCCGGATCG TGCAGCTCTC GCTGGTGGGC GACGACCCCG TGTACATGCT CACCGCGCCC 
ATCCCGGCGA CCCGGATCGC CCTGGAGAAG GCGGGCCTGG GCATCGACGA CATCGACGTC 
ACCGAGATCA ACGAGGCCTT CGCCCCGGTG CCGATGTCCT GGATCGAGGA GCTGGGCGCC 
GACCCGGCCA AGGTCAACCC CAACGGCGGC GCCATCGCCC TCGGCCACCC GCTGGGCGCC 
ACCGGCACCG TGCTCATGGC CAAGCTGGTC GCAGAGCTGC ACCGCACCGG CGGCCGCTAC 
GGCCTCCAGA CCATGTGCGA GGGCGGCGGC CAGGCCAACG TCACCATCAT CGAGCGGGTC 
TAG

Protein sequence

MAEAYIVGAV RTPVGTKKGA LAAVHPADLG AHVLRELVSR TGVDPAAVED VIMGCVSQVG 
PQALDLARTS WLSAGLPESV PGVTIDRQCG SSQQAVHFAA QGVMSGTQDL VVASGVENMG 
MVPMGANVQY ALDNGLGLYG DGWAERYGHQ EISQFRGAQL MCEKWGFKRE QLEEFALESH 
RRAARALEAG YFDEQIAPLA GVERDEGVRP DTTLEKMAGL KPLREGWALT AAVASQISVG 
AGAVLIASER AVERHGLTPL ARIVQLSLVG DDPVYMLTAP IPATRIALEK AGLGIDDIDV 
TEINEAFAPV PMSWIEELGA DPAKVNPNGG AIALGHPLGA TGTVLMAKLV AELHRTGGRY 
GLQTMCEGGG QANVTIIERV