Gene P9303_19601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_19601
Symbol
ID	4777206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1724844
End bp	1725785
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	51%
IMG OID	640087470
Product	Type II alternative RNA polymerase sigma factor, sigma-70 family protein
Protein accession	YP_001017967
Protein GI	124023660
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02997] RNA polymerase sigma factor, cyanobacterial RpoD-like family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0713549
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTCAG CAGCGCCTAA ATCAGCAGAA ACACAGAGGC GTAGAAGTTC TGATCCTGTC 
AGCTGGTATC TCACAACGAT TGGGCGTATA CCTCTTCTTA CCCCTGCTGA AGAGATTGAA 
CTTGGCAATC AAGTTCAGAC GATGATGAGT CTCACTCAAG ACGGCTCAGT TGCGCCTGAT 
GATAAGGAGT TTACGACACA TCAGCGTCGC ATGATTCGCA TTGGCCGTCG TGCCAAAGAA 
CGCATGATGA AGGCCAATCT TCGTCTTGTT GTGAGTGTTG CCAAGAAATA TCAAGGCAAA 
GGACTGGAAC TCCTCGATCT CATCCAGGAG GGTTCACTTG GTTTAGAGCG TGCTGTTGAA 
AAGTTTGATC CAACCCGTGG CTACAAGTTT TCGACCTATG CGTTTTGGTG GATTCGTCAG 
AGCATGACAC GTGCGATTGC GTGCCAGTCG CGCACGATTC GCCTTCCTGT ACATCTCAGT 
GAAAGGCTGA CCACAATTCG AAAGGTTTCT CTGGATTTGG CTCACAAGCT TGGAGCAATG 
CCCAGTCGCT CCGAGATCGC TGAAGCGATG GATATCCCTG TTGATGAACT CGACTCTTTA 
TTGCGTCAGG CGCTAACAAC CAGCAGTTTG GATGCGCCAG TGAATGGCGA AGAAGGACGA 
AGTTTTCTTG GTGATCTGAT CGCTGATTCC TCTCTTGGTG AACCTCTCGA CAAGGTGGAG 
CAGCGTATTC ATCATGAGCA GCTCGGGCGT TGGCTCAGCC ATCTCAGTGA GCAGGAGCAG 
CATGTTCTTA AGCTCCGTTT TGGTTTGGAA ACCCATGATC GACACACCTT GGCTGAGATT 
GGTCGCTTGA TGGAAGTCTC GCGTGAGCGT GTTCGTCAAG TGGAACTAAA GGCCTTGCGC 
AAGCTGCGTA ACCTCACGCG TAGGGTGCCC AACGGGATCT GA

Protein sequence

MVSAAPKSAE TQRRRSSDPV SWYLTTIGRI PLLTPAEEIE LGNQVQTMMS LTQDGSVAPD 
DKEFTTHQRR MIRIGRRAKE RMMKANLRLV VSVAKKYQGK GLELLDLIQE GSLGLERAVE 
KFDPTRGYKF STYAFWWIRQ SMTRAIACQS RTIRLPVHLS ERLTTIRKVS LDLAHKLGAM 
PSRSEIAEAM DIPVDELDSL LRQALTTSSL DAPVNGEEGR SFLGDLIADS SLGEPLDKVE 
QRIHHEQLGR WLSHLSEQEQ HVLKLRFGLE THDRHTLAEI GRLMEVSRER VRQVELKALR 
KLRNLTRRVP NGI