Gene Saro_3045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3045
Symbol
ID	3916657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3260186
End bp	3261085
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	63%
IMG OID	640445825
Product	RNA polymerase factor sigma-32
Protein accession	YP_498314
Protein GI	87201057
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02392] alternative sigma factor RpoH [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTGAGG AAAAGACCGC GCTGACCGTC CCCGCGCTGG GTGGGGAAGC CAGCCTCAAC 
CGCTATCTCT CGGAAATCCG CAAGTTTCCC GTGCTGACGG CAGAGCAGGA ATACATGCTC 
GCCAAGCGCT TTCAGGAACA TCAGGACCCC GAGGCCGCCG CACAACTGGT GACGAGCCAC 
CTGCGGCTCG TGGCGAAGAT CGCCATGGGC TATCGCGGCT ATGGCCTGCC GGTGAGCGAG 
CTGATCAGCG AGGGCAACAT CGGCCTGATG CAGGGCGTCA AGAAGTTCGA GCCGGACCGG 
GGTTTCCGTC TGGCGACTTA CGCGATGTGG TGGATCAAGG CCTCGATGCA GGAATTCATC 
CTGCGCAGCT GGTCGCTCGT GAAGATGGGC ACCACCGCCG CGCAGAAGAA GCTGTTCTTC 
AACCTGCGGC GAATGAAGAA GAACCTCGAG GCTTTCGAGG ATTCCGACCT TCATCCCGAC 
GACGTGAGGA AGATCGCGAC CGACCTCGGC GTACCCGAGC AGGAAGTGGT CAACATGAAC 
CGGCGCATGA TGATGGGCGG CGATGCGTCG CTCAACGTCT CGATGCGCGA GGACGGCGAA 
GGATCGTGGC AGGACTGGTT GACGGACGAC CGTCCGCTCC AGGATGAAAC CGTGGCCGAC 
GCCGAGGAAG CGCAGTATCG CCACGAACTG CTGGTCGAGG CGATGGAAAG CCTCAACGAG 
CGCGAGCGCC ACATCCTGAC CGACCGCAGG CTGATCGACG ATCCCAAGAC GCTCGAGGAA 
CTGAGCCAGG TCTACAACGT CAGCCGCGAA CGCGTGCGTC AGATCGAGGT GCGCGCCTTC 
GAGAAGCTGC AGAAGGCGAT CCAGCGCATC GCGGTGGAGC GCAAGCTCCT GCCGGCATAA

Protein sequence

MSEEKTALTV PALGGEASLN RYLSEIRKFP VLTAEQEYML AKRFQEHQDP EAAAQLVTSH 
LRLVAKIAMG YRGYGLPVSE LISEGNIGLM QGVKKFEPDR GFRLATYAMW WIKASMQEFI 
LRSWSLVKMG TTAAQKKLFF NLRRMKKNLE AFEDSDLHPD DVRKIATDLG VPEQEVVNMN 
RRMMMGGDAS LNVSMREDGE GSWQDWLTDD RPLQDETVAD AEEAQYRHEL LVEAMESLNE 
RERHILTDRR LIDDPKTLEE LSQVYNVSRE RVRQIEVRAF EKLQKAIQRI AVERKLLPA