Gene P9211_16551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_16551
Symbol	rpoA
ID	5730206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1491597
End bp	1492535
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	40%
IMG OID	641286035
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_001551540
Protein GI	159904196
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.271091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGCAAT ACCAGATTGA TCGGATCGAC CATCAAATTT CCGATGACCG CTCTCAAACA 
GGTTTATTCC TCATAGGACC TCTTGAAAGA GGTCAAGCAA CTACGTTAGG TAACTCTCTT 
CGAAGAGTTC TTATGGGAGG TCTTGAAGGA AGCGCTGTTA CGGCAGTTCG CATATCTGGC 
GTAAATCATG AATATGCAAC TATCCCTGGA GTGAGAGAAG ATGTTTTAGA TATTCTCCTA 
AATTGCAAGC AGCTTTCAGT AAATAGTAGA AGTCCAGAAC TTGAAATAGG CCGTTTAGTG 
GTTAATGGAC CTGCAGAAGT TAAAGCCCGT GATGTGCAAT TTTCTTCTCA GGTACAAGTT 
GTTGATGGAG ATAGACCAAT AGCCACTGTG CATTCAGGAC ATAGCCTTGA ATTGGAGCTG 
CATGTAGAAA GGGGAGTTGG CTATCGTCCA GTTGATCGTC ATAACGAAGA AACAACTTCA 
ATTGATTTGC TTCATATTGA TGCTGTTTTT ATGCCAATTA AGAAGGTGAA TTTCAATATT 
GACGAAACGG CTGTTGCTGA AGGTGGTTCA ACTAGAGAAA GATTGAAAAT GGAGATAGTA 
ACTGATGGAT CCATGTCTCC TGATGATGCT TTAGCAGAGG CGGCAAATCA ATTAATAGAA 
CTATTTCAAC CTTTAGCAAC AGTAACTATG GTTGAAGAAA TACCTCAAGA GCCAGAACCT 
TCTGCTGAGG CTCAAATTCC TTTAGAAGAA TTGAATCTAT CTGTTAGAGC CTATAACTGT 
TTGAAAAGAG CCCAAGTGAA TTCAGTTTCT GATTTGATGG GATTTAGCTA CGAGGATCTA 
TTAGAAATTA AGAATTTCGG GTCCAAGTCT GCTGATGAAG TTATTGAAGC TTTAGAACGA 
ATTGGAATTT CTATTCCACA GAGTCGGACT TCAGCGTAA

Protein sequence

MLQYQIDRID HQISDDRSQT GLFLIGPLER GQATTLGNSL RRVLMGGLEG SAVTAVRISG 
VNHEYATIPG VREDVLDILL NCKQLSVNSR SPELEIGRLV VNGPAEVKAR DVQFSSQVQV 
VDGDRPIATV HSGHSLELEL HVERGVGYRP VDRHNEETTS IDLLHIDAVF MPIKKVNFNI 
DETAVAEGGS TRERLKMEIV TDGSMSPDDA LAEAANQLIE LFQPLATVTM VEEIPQEPEP 
SAEAQIPLEE LNLSVRAYNC LKRAQVNSVS DLMGFSYEDL LEIKNFGSKS ADEVIEALER 
IGISIPQSRT SA