Gene Sros_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2044
Symbol
ID	8665326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	2197361
End bp	2198443
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	75%
IMG OID
Product	acetyl-CoA acetyltransferase-like protein
Protein accession	YP_003337772
Protein GI	271963576
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGGCA GGGCGGCCGT CGCCGGCATC GGGATGACGG CTCTGACGCG GAGATCCGGC 
AGGACCGAGC TGGAGCTCGC GGTCGAGGCG TCCCGGGCCG CGCTGGCCGA CGCCCGCGTG 
GAGGCCGGGC AGATCGACGC CGTCCTCAGC TACCACATGA ACGACTCCGT CCCGGTGGTC 
CAGGTCGCCA GGGCGCTGCG GATCGAGCGG CTGGGCTGGC ACAACGACAT CACCGGCGGC 
GGCACCCAGG CGGCCTCCGT CCTGGGGGAC GCGGCGATGC TGATCGCCGC GGGCGTCGCG 
CGCAACGTGC TGGTCTACCG GGCGCTGAAC GGCCGCTCCG GCACGCGCAT GAACACGGTC 
TCCACCGGCC CGCAGGAACG CTTCACCGTC CCCTACGGCA TGGCCGGGCC GATCCCGATG 
TTCGCCCTGG CCGCCCAGCG CTACCTGCAC GAGACCGGCC TGACCGAGGA GCACCTGCAC 
GCGGTCGTCG CCCAGTCCCG CGACAACGCC GCGGCCAACC CGCGCGCCCT CCGGCGCGAT 
CCGCTGTCCC TGGAGGACTA CCTCGCCAGG CCGTACGTCT GCTCGCCGCT GCGGACCGTG 
GACTGCTGCC AGGAGACCGA CGGCGCCTGC GCGCTGGTGG TCCGTGACGC GCGGCTCGCG 
CCGCGGGCCC CCCGCATCCA CGCGGTGGTC AGGGGAGGCG GTCCCGGCTG CTCGTCCATG 
GACCGTTCGC CCGACGTCAG CGCGATCTTC TCCGCCCATG TCGCCCCGAT GCTGTGGGAG 
GCGTCGGGCA TGCGGGCGGC GGACGTGGAC GTCGCGCTGC TCTACGACGC CTACTCCTGG 
CTGGTGCCCC GGCAGCTGGA GGACTTCGGC CTGGCCGGGC GGGCCGAGCT GGGGGAGTTC 
CTGCTCCGGC GCCGCCACGC CACGGTCAAC CCGCACGGCG GCCTGCTGTC CGAGGGCTAC 
GTGCACGGGC TCAACAACGT GGCGCAGGCC GTACGGGAGC TCCGGGCGGG CCGCGGGACG 
GCGCTGGTGA CCGGGTTCGG CGGCAGCTAC GGCAGCGCCG CGCTCCTGGT CCGGCCGGAC 
TGA

Protein sequence

MRGRAAVAGI GMTALTRRSG RTELELAVEA SRAALADARV EAGQIDAVLS YHMNDSVPVV 
QVARALRIER LGWHNDITGG GTQAASVLGD AAMLIAAGVA RNVLVYRALN GRSGTRMNTV 
STGPQERFTV PYGMAGPIPM FALAAQRYLH ETGLTEEHLH AVVAQSRDNA AANPRALRRD 
PLSLEDYLAR PYVCSPLRTV DCCQETDGAC ALVVRDARLA PRAPRIHAVV RGGGPGCSSM 
DRSPDVSAIF SAHVAPMLWE ASGMRAADVD VALLYDAYSW LVPRQLEDFG LAGRAELGEF 
LLRRRHATVN PHGGLLSEGY VHGLNNVAQA VRELRAGRGT ALVTGFGGSY GSAALLVRPD