Gene Sare_0952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0952
Symbol
ID	5704488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1075870
End bp	1076865
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	67%
IMG OID	641270469
Product	RNA polymerase factor sigma-70
Protein accession	YP_001535857
Protein GI	159036604
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02960] RNA polymerase sigma-70 factor, TIGR02960 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0742081
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGACG ATCGGTCCGT GGTTGCCAGT ATCGACTCTG CCTTGCTGTC GGCGGCGCAA 
GCCGGGGATT CGGACGCGTT CGCCGCTGTG GTCGACCCGT TCCAAGGGGA GTTGCACGCA 
TACTGCTATC GGATGCTGGG TTCCGTCCAT GACGCCGATG ACGCCGTTCA GGAGACGCTG 
GTCCGGGCCT GGCGGGCGTT TGACCGATTT GAGCCTCGTG GATCAATGCG GGCTTGGCTG 
TACCGGATCG CCACCAACCG GTGCCTGTCG ATTCTCAACG GGCGAGGCCG CCGGGAACTG 
CCGGCCGATC TCGAGCGCAT CGCGGGAGGC GACACCGAGA TCTCCTGGCT GGAGCCTTAC 
ACGGACGAGC GGCTGGGCCC GGAGCAACGC ACTGTCGCGA GGGAGAGCAT CGAGCTGTCG 
TTCGTTGCCG CGGTGCAGCG ATTGACCGGT AGGCAGCGTG CGGTGCTCCT GTTGCGGGAG 
GTGCTGGGCT TCACCGCCCG CGAGGTGGCT GACCAGCTCG ATACCACCGT GGCCGCCGTC 
AACAGCGCGC TGCAGCGCGC CCGCGCAGTT CTCGATCCGG GACTGCCCAC CGCGACCCAG 
CAGGCGACGA TGCGCCAGAT GGGTGACACC GCGGTTCGGG ACCTGGCCCG ACGGTACGCA 
CAGGCGTGGG AGGCGGCCGA TGTCGACACC ATCGTTTCGA TGCTGGTCGA GGACGCCCGC 
TACTCTATGC CGCCGGTGCC GACCTGGTTC ACCGGCCGGA AGGCCATCTG CGACTTTCTG 
CTCAGCGGCC CGCTGACGTG TGGCTGGCGG TTCGTGGCGA CCGAGGCGAA CAGTCAGCTT 
GCGTTCGGCA CGTATCGCTG GGACAGCGAC CACGCCGCTT ACCGTCCCTG CGGGCTGGAC 
GTCCTGACAC TGCGTCGAGA CGGCATCGCG GAGGTCGTGT CCTTCCTCGA AGCCGACTTC 
GCCGCGCACG GCCTGCCACC CAGCCTGCCG AACTGA

Protein sequence

MCDDRSVVAS IDSALLSAAQ AGDSDAFAAV VDPFQGELHA YCYRMLGSVH DADDAVQETL 
VRAWRAFDRF EPRGSMRAWL YRIATNRCLS ILNGRGRREL PADLERIAGG DTEISWLEPY 
TDERLGPEQR TVARESIELS FVAAVQRLTG RQRAVLLLRE VLGFTAREVA DQLDTTVAAV 
NSALQRARAV LDPGLPTATQ QATMRQMGDT AVRDLARRYA QAWEAADVDT IVSMLVEDAR 
YSMPPVPTWF TGRKAICDFL LSGPLTCGWR FVATEANSQL AFGTYRWDSD HAAYRPCGLD 
VLTLRRDGIA EVVSFLEADF AAHGLPPSLP N