Gene Sros_4191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4191
Symbol
ID	8667485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4666599
End bp	4668257
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	73%
IMG OID
Product	Acetyl-CoA carboxylase alpha subunit-like protein
Protein accession	YP_003339838
Protein GI	271965642
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.484421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.358768
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCCG GAGCGGCGGA GTGGGTCAGC TGTGCCCGGT GCCGAGAACT GACCTACGGC 
AGGCGCTTTG AACGCGACCT GCGAGTCTGC CCCGGCTGTG GCGCGCACAG CCGCCTCACC 
GCCTGGCAGC GCATCGGCCA GCTGCTGGAT GCCGGCTCGG TCCGGCAGTT CGAACAGCCG 
GTGGTGGCCG AAGATCCCCT CGGTTTCGTG GACTCCCGCC CCTACCCGGA ACGGCTGCGC 
CAGGCGCGCG AGCAGACGGG GATGGAGGAG GCCGTCGTCT GCGTCACGGG CACGCTGATG 
CGGCATCCGG TGGTGGCGGC TGTCATGGAC TTCCGCTTCC TGGGCGGCAG CCTCGGGGTT 
GGAGTGGGCG AAGCCATCGC GGTGGCCGCG GAGACCGCCC TGCGCGCGCG CACCCCTCTG 
ATCATCGTCA CCGCCTCGGG CGGCGCCCGC ATGCAGGAGG GCGCCTTCTC GCTGATGCAG 
ATGGTGAAGA CCAGCCAGGC GCTCGCGGAG CTGGACGAGG CGGGGATCCT CACCATCTCG 
CTCATCAGCG ACCCCACCTA CGGCGGTGTG GCCGCCTCCT TCGCGACGCT GGGAGACGTC 
ATCCTGGCGG AGCCCGGAGC GCGCATCGGC TTCGCGGGTC CGCGGGTGAT CGAGCAGACG 
ATCCAGGCCG ACCTCCCGAA GGGCTTCCAG ACGGCAGAGT TCCTGCTGGC CCGCGGCCTC 
GTGGACGCGG TGGTGCCGCG CTCCGCGCTC CGGCCGACGA TCGCGTGCCT GCTCGATGCC 
CAGGCGCCCG CGCAGCCCTC CGCGGCGACC ACCGCGGGGG AGTGCCTCGT CCGCGATCCC 
GGCGAGCTGC CCGAGCGGGA ACCCGGGCAG GTGGTGGAGA CCGCCCGCCA CCAGCAGCGG 
CCGACCGCGC TCGACTACAT GAACCAGCTG CTGGACAACT TCCAGGAACT GAAAGGCGAC 
CGGATGTCCG GCGACTGCCC GGCCGTCGTG GGCGGCATCG GCCGCTTCGA CGGCCGGCCG 
GTCGTCGTCC TCGGGCACCA GAAGGGCCGC GACACCACCG AACGGGTCCA GCGCAACTTC 
GGCATGGCGC TGCCCGAGGG GTACCGCAAG GCCGCGCGGC TGATGCGGCT GGCGGTCAAG 
CTGGGGCTGC CGATCGTCAC CCTGGTCGAC ACGCCCGGCG CCCATCCCGG CATCGGCGCG 
GAGGAGCGGG GACAGGCGTG GGCGATCGCG GAGAACATCC GGCTCATGTC CGGACTCCCC 
GTTCCGATCG TGGCGGTGAT AACGGGCGAG GGAGGCAGCG GCGGCGCGCT CGCCCTGGCC 
GTGGCCGACC GGGTGCTCGC CTGCTCCGGC GCGATGTACT CGGTGATCAG CCCGGAGGGC 
TGCGCGGCCA TCCTCTGGAA GGACCGGTCC GCGGCCCCGA TGGCGGCGGC GGCGCTCCGG 
CTCGGCGCGC GCGACCTGCT CCGGCACGAG ATCGTCGACG CGGTCGTACC GGAGCCGGAG 
GGCGGGGCGC ACCGAGACCC CGTGGCGGCC GCGGAGCTGC TGCGCGCGGC GCTCTCGGAG 
ACCTTGCGCG AGGTCGTCGC CATCTCCCCT GACGACCTGG TGGCACAACG CCGACGACGG 
TTTCGGCGAT ACGGCGTCGA GATGCCGAGG TGCATATGA

Protein sequence

MASGAAEWVS CARCRELTYG RRFERDLRVC PGCGAHSRLT AWQRIGQLLD AGSVRQFEQP 
VVAEDPLGFV DSRPYPERLR QAREQTGMEE AVVCVTGTLM RHPVVAAVMD FRFLGGSLGV 
GVGEAIAVAA ETALRARTPL IIVTASGGAR MQEGAFSLMQ MVKTSQALAE LDEAGILTIS 
LISDPTYGGV AASFATLGDV ILAEPGARIG FAGPRVIEQT IQADLPKGFQ TAEFLLARGL 
VDAVVPRSAL RPTIACLLDA QAPAQPSAAT TAGECLVRDP GELPEREPGQ VVETARHQQR 
PTALDYMNQL LDNFQELKGD RMSGDCPAVV GGIGRFDGRP VVVLGHQKGR DTTERVQRNF 
GMALPEGYRK AARLMRLAVK LGLPIVTLVD TPGAHPGIGA EERGQAWAIA ENIRLMSGLP 
VPIVAVITGE GGSGGALALA VADRVLACSG AMYSVISPEG CAAILWKDRS AAPMAAAALR 
LGARDLLRHE IVDAVVPEPE GGAHRDPVAA AELLRAALSE TLREVVAISP DDLVAQRRRR 
FRRYGVEMPR CI