Gene Sros_1697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1697
Symbol
ID	8664974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1811968
End bp	1813155
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	72%
IMG OID
Product	Acetyl-CoA C-acetyltransferase
Protein accession	YP_003337431
Protein GI	271963235
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.035668
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.106126
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGTT CCGTCATCGT CGCCGGAGCT CGCACCCCCA TCGGCCGGTT GCTCGGCTCG 
CTGGCCGGCC TGTCGGCCGT CGAGCTCGGC GGCATCGCCA TCAAGGCCGC GCTGGAGCGC 
TCCGGCGTCG CCCCCGAGTC CGTGCAGTAC GTGATCATGG GCCAGGTCCT CCAGGCCGGA 
GCGGGTCAGA TCCCCTCCCG CCAGGCGGCC GTCAAGGCCG GGATCCCGAT GACCGTGCCG 
TCGCTGACGA TCAACAAGGT CTGCCTGTCC GGGCTGGACG CCATCGCCTT GGCCGACCAG 
CTCATCAGGG CGGGCGAGTT CGACGTCGTG GTCGCCGGCG GCATGGAGTC CATGTCGAAC 
GCCCCCCACC TGCTGCCCGG CCTGCGCAGG GGAGTGAAGT ACGGCGACGC CGGCATCGTG 
GACTCGATGG CCTTCGACGG CCTGACCGAC GCCTACGACC AGGTGTCCAT GGGCGAGTCC 
ACCGAGCGGC ACAACGCGCG CCTCGGCCTG ACCCGCGAGG AGCAGGACGC GTTCTCCGCC 
CGTTCCCACG AGCTCGCCGC CGCCGCGATC AAGAACGGCG TGCTCGACGA CGAGATCGTT 
CCGGTGCCGG TCCCGCAGCG CAAGGGGGAG CCGGTGATGT TCGCCGCCGA CGAGGGCGTG 
CGCGGCGACA CCACGGTCGA GACCCTGGGA CGGCTGCGGC CGGCCTTCAG CAAGGACGGC 
ACCATCACCG CCGGGTCCGC CTCGCAGATC TCCGACGGCG CCTGCGCGGT GGTCGTGATG 
TCCAAGGCCA AGGCCGAGGA ACTGGGCCTG GAGTGGCTGG CGGAGATCGG CGCGCACGGC 
AACGTGGCCG GGCCCGACAA CTCGCTCCAG TCCCAGCCCG CCAACGCGAT CAAGCACGCC 
CTCGGCAAGC AGGGGCTCTC GGTCGAGGAC CTCGACCTGC TGGAGATCAA CGAGGCCTTC 
GCCCAGGTCG TCCTCCAGTC GGCCAAGGAC CTCGGCGTCC CGCTCGACAA GGTCAACGTC 
AACGGCGGCG GCATCGCCGT CGGCCATCCG ATCGGCGCCT CCGGCGCCCG CATCGTCCTC 
GCCCTCGCCC ACGAGCTCAG GCGCCGGGGC GGCGGGCTCG GTGCCGCGGG CCTGTGCGGC 
GGCGGCGGCC AGGGCGATGC GCTGATCATC CGGGTCCCCT CGGCCTGA

Protein sequence

MSGSVIVAGA RTPIGRLLGS LAGLSAVELG GIAIKAALER SGVAPESVQY VIMGQVLQAG 
AGQIPSRQAA VKAGIPMTVP SLTINKVCLS GLDAIALADQ LIRAGEFDVV VAGGMESMSN 
APHLLPGLRR GVKYGDAGIV DSMAFDGLTD AYDQVSMGES TERHNARLGL TREEQDAFSA 
RSHELAAAAI KNGVLDDEIV PVPVPQRKGE PVMFAADEGV RGDTTVETLG RLRPAFSKDG 
TITAGSASQI SDGACAVVVM SKAKAEELGL EWLAEIGAHG NVAGPDNSLQ SQPANAIKHA 
LGKQGLSVED LDLLEINEAF AQVVLQSAKD LGVPLDKVNV NGGGIAVGHP IGASGARIVL 
ALAHELRRRG GGLGAAGLCG GGGQGDALII RVPSA