Gene P9303_01641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_01641
Symbol
ID	4776823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	181490
End bp	182542
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	55%
IMG OID	640085663
Product	Type II alternative RNA polymerase sigma factor, sigma-70 family protein
Protein accession	YP_001016184
Protein GI	124021877
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02997] RNA polymerase sigma factor, cyanobacterial RpoD-like family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGACTGCT CGGGAGTAAG CTTTACAAAA CGCAATAGAG TTGTCGTGGT CGACTCCGCA 
GTCTCCAAAG CCCTTGTTAA ATCAGCGGTT GTGCCTGCTC GTCAGTTGCC CGCAGATGTC 
GACCTGGTGC GTTCATACCT GCGCGATATC GGTCGAGTGC CGCTACTGAG CCATGAGCAG 
GAGATCACGC TGGGTCGTCA GGTGCAGGAG TTGATGTCTT TAGAGCAGCT TGAGTCTGAA 
CTGGAAGGTA AAACAGGCGC GCCAGCGAGT CGTAAAGAAC TAGCGAAGGC AGCTGGATTG 
AGTGAGTTGC AGCTCAAGAA GAAGTTGCAG ATCGGACGAC GTGCGAAGGA GCGGATGGTG 
TCGGCGAACC TGCGCTTAGT GGTGAGTGTT GCCAAGAAGT ACACCAAAAG GAATATGGAG 
CTTCTTGATT TGATCCAAGA GGGAACGATC GGCTTGGTGA GGGGAGTGGA GAAGTTCGAC 
CCAACCCGTG GCTACAAGTT TTCGACCTAT GCGTATTGGT GGATTCGCCA GGGGATCACG 
CGTGCGATTG CGGAGAAGAG CCGGACGATC CGTCTGCCGA TCCACATCAC AGAGATGCTG 
AACAAGCTCA AGAAAGGCCA GCGAGAGTTA AGTCAGGAGA TGGGGCGCAC GCCAACAGTG 
AGCGAACTTG CAGAGTTTGT GGAGTTGCCC GAGGAGGAGG TGAAGGATCT GATGTGCCGT 
GCACGTCAGC CGATGAGTTT GGAGATGAAG GTGGGAGATG GGGATGAAAC GGAGTTGCTT 
GAGTTGCTTG CCGGGGAAGA GGAGTTACCG AGTGAGAAGG TGGAAGTGGA TTGCATGAAA 
GGCGATTTAC GTACCTTGCT GGAAAAGTTG CCCGAGTTGC AGGGTCGTGT GCTGCGGATG 
CGTTATGGAA TCGACGGAGG CGAGCCGATG AACCTCACCG GGATTGGTCG CATCCTCGAC 
ATCAGTCGTG ACCGTGTTCG CAATCTGGAG CGCCATGGAC TCAATGGTCT GCGCCAGTTG 
AGTGAAACGG TTGAGGCCTA TGCGGCTTGC TGA

Protein sequence

MDCSGVSFTK RNRVVVVDSA VSKALVKSAV VPARQLPADV DLVRSYLRDI GRVPLLSHEQ 
EITLGRQVQE LMSLEQLESE LEGKTGAPAS RKELAKAAGL SELQLKKKLQ IGRRAKERMV 
SANLRLVVSV AKKYTKRNME LLDLIQEGTI GLVRGVEKFD PTRGYKFSTY AYWWIRQGIT 
RAIAEKSRTI RLPIHITEML NKLKKGQREL SQEMGRTPTV SELAEFVELP EEEVKDLMCR 
ARQPMSLEMK VGDGDETELL ELLAGEEELP SEKVEVDCMK GDLRTLLEKL PELQGRVLRM 
RYGIDGGEPM NLTGIGRILD ISRDRVRNLE RHGLNGLRQL SETVEAYAAC