Gene Sros_3462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3462
Symbol
ID	8666750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3807417
End bp	3808658
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	74%
IMG OID
Product	ECF subfamily RNA polymerase sigma-70 factor
Protein accession	YP_003339141
Protein GI	271964945
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.671193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000910596
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCATCG AGGGACTGCT GCAGGAGCTG GCGCCGCAGG TCCTCGGCGC GCTCCTGCGC 
AGGTACGGCA CGTTCGACAC CTGCGAGGAC GCCGTCCAGG AGGCGTTGCT CGCGGCGGCG 
ACGCAGTGGC CGGCCGAGGG TGTCCCCGAC AGGCCGCTCG CCTGGCTGGT CACCGTCGCC 
TCCCGCCGGC TGGTCGACGA GGTGCGCAGC CAGCAGGCTC GCCGGCGCCG CGAGGCGACC 
CTGGCGGCGC GGGAGGCGAC GGACGCCGAT CTCGTGGCGG CACCCGACGT CCGGAGGCCG 
GGTGACCGGG ACGACACGCT GATGCTGCTG TTCCTGTGCT GCCATCCAGC GCTGACGCCG 
GTCTCCCAGA TAGCGCTCAC CCTGCGCGCC GTCGGCGGCC TCACCACCGC CGAGATCGCG 
CGGGCGTTCC TCGTCCCAGA GGCCACGATG GCACCGCGGA TCAGCCGGGC CAAGCAGCGG 
ATCAGGGCAG CCGGAGCGAC CTTCCCGACG CCCACGACGC AGGAATGGGC CGACCGGCTG 
GACGCGGTCC TGCACGTGCT CTACCTGATC TTCAATGAGG GCTACACCGC CAGCTCCGGG 
CCCGACCTGC ACCGTGGCGA GCTCGCCGGA GAGGCGATCC GGCTCACCCG GACGGTGCAC 
CGGTCACTGC CCGGCAACGG TGAGGTCGCC GGGCTCCTCG CGCTGATGTT GCTGACCGAC 
GCCCGCCGTC CGGCCCGCGT CGGGCCGGAC GGTTCCCTCG TGCCGCTGGC CGAGCAGGAC 
AGGGGCCGGT GGGACGGCGT GGCGATCAAG GAGGGCACCG CGCTGGTCAC CGATGCCATG 
GCCAGGTCGC CCCTCGGCCC CTACCAGCTC CAGGCGGCGA TCGCCGCGCT GCACGTGCAG 
CCACCGCGGG CCGAGGACAC CGACTGGGGG CAGATCCGCG TCCTGTACCG GATCCTCGGC 
CGGATCGCGC CGAATCCGAT GGTCACGCTC AACCACGCCG TCGCGGTCGC GATGACCGCC 
GGACCGCGCG CCGGGCTGGA ACTGCTGGAG ACCCTCGACG GCGACGCGAG GATGGCCCAC 
CACCATCGCC TGCACGCGGT GCGCGGACAC CTGCTGGAGC TGGCCGGCGA GGAGGCCGGG 
GCGAGGGAGT GCTACGAGAT CGCGGCCCGG CATACCACGA GCATCCCTGA GCGGCGCCAC 
CTGCGCGAAC GGGCCGCCAG GCTCCGCTCG CCGGGGCGGT GA

Protein sequence

MAIEGLLQEL APQVLGALLR RYGTFDTCED AVQEALLAAA TQWPAEGVPD RPLAWLVTVA 
SRRLVDEVRS QQARRRREAT LAAREATDAD LVAAPDVRRP GDRDDTLMLL FLCCHPALTP 
VSQIALTLRA VGGLTTAEIA RAFLVPEATM APRISRAKQR IRAAGATFPT PTTQEWADRL 
DAVLHVLYLI FNEGYTASSG PDLHRGELAG EAIRLTRTVH RSLPGNGEVA GLLALMLLTD 
ARRPARVGPD GSLVPLAEQD RGRWDGVAIK EGTALVTDAM ARSPLGPYQL QAAIAALHVQ 
PPRAEDTDWG QIRVLYRILG RIAPNPMVTL NHAVAVAMTA GPRAGLELLE TLDGDARMAH 
HHRLHAVRGH LLELAGEEAG ARECYEIAAR HTTSIPERRH LRERAARLRS PGR