Gene Sros_8569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8569
Symbol
ID	8671903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	9455466
End bp	9456686
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID
Product	Acetyl-CoA C-acyltransferase
Protein accession	YP_003343954
Protein GI	271969758
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAGG CAGTCATCGT CGCAACCGCG CGCTCGCCGA TCGGACGCGC CTTCAAGGGA 
TCCCTCAAGG ACATCCGTCC CGACGACCTG ACCGCACAGA TGATCAAGGC CGCGCTGGCC 
AAGGTCCCCC AGCTCGACCC CACCGGCATC GACGACCTGA TGCTGGGCTG CGGCCTGCCG 
GGCGGCGAGC AGGGGTTCAA CATGGCCCGC GTGGTCTCCA CGCTGCTCGG GCTGGACACC 
GTGCCCGGCA CCACCGTCAC CCGCTACTGC TCGTCCTCGC TGCAGACCAC CAGGATGGCG 
CTGCACGCGA TCAGGGCGGG CGAGGGCGAC GTGTTCGTCT CGGCGGGCGT GGAGTGCGTC 
TCCCGCTTCG CCAAGGGCAA CTCCGACTCG CTGCCCGACA CGCAGAACAC GCTGTTCGAC 
GAGGCCCGCG GCCGTTCGGC CAAGGCCGCC GAGGGCGGCG GCGAGGTCTG GCACGACCCG 
CGCGAGGACG GCACCGTGCC CGACGTCTAC ATCGCGATGG GCCAGACCGC GGAGAACCTC 
GCCGGGTTGA AGGGCGTCTC CCGCCAGGAA CAGGACGAGT TCGGCGTCCG GTCCCAGAAC 
CTGGCCGAGA AGGCGATCGC CAACGGCTTC TGGGAGACCG ACATCACCCC GGTCACCCTG 
CCCGACGGGA CCGTGGTCAG CAAGGACGAC GGTCCCCGCG CGGGCACCAC CTACGACGCG 
GTCTCGCAGC TCAAGCCGGT CTTCCGGCCG GACGGGACGG TCACCGCCGG CAACTGCTGC 
GCGCTGAACG ACGGCGCCGC CGCGGTGATC GTGATGAGCG ACACCAGGGC CGCCGAGCTG 
GGCATCACCC CCCTCGCCCG GATCGTCTCC ACCGGCGTGA CGGGCCTGTC CCCCGAGATC 
ATGGGCCTGG GCCCGGTCGA GGCCTCCAGG CAGGCCCTGG CGCGGGCGGG CATGTCGATC 
GGCGACGTGG ACCTCGTCGA GATCAACGAG GCCTTCGCCG CCCAGGTCAT CCCGTCCTAC 
CAGGATCTCG GCATCGACCT CGACCGGCTC AACGTCAACG GCGGCGCCAT CGCGGTGGGC 
CACCCGTTCG GCATGACCGG TGCCCGGATC ACCTCCACGC TGATCAACAG CCTCCGGTTC 
CACGACCGGT CGATCGGCCT GGAGACCATG TGCGTGGGCG GCGGTCAGGG CATGGCCATG 
GTCCTGGAGC GCCTCAGCTA G

Protein sequence

MPEAVIVATA RSPIGRAFKG SLKDIRPDDL TAQMIKAALA KVPQLDPTGI DDLMLGCGLP 
GGEQGFNMAR VVSTLLGLDT VPGTTVTRYC SSSLQTTRMA LHAIRAGEGD VFVSAGVECV 
SRFAKGNSDS LPDTQNTLFD EARGRSAKAA EGGGEVWHDP REDGTVPDVY IAMGQTAENL 
AGLKGVSRQE QDEFGVRSQN LAEKAIANGF WETDITPVTL PDGTVVSKDD GPRAGTTYDA 
VSQLKPVFRP DGTVTAGNCC ALNDGAAAVI VMSDTRAAEL GITPLARIVS TGVTGLSPEI 
MGLGPVEASR QALARAGMSI GDVDLVEINE AFAAQVIPSY QDLGIDLDRL NVNGGAIAVG 
HPFGMTGARI TSTLINSLRF HDRSIGLETM CVGGGQGMAM VLERLS