Gene PCC8801_0228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0228
Symbol
ID	7105285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	220052
End bp	221002
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	47%
IMG OID	643473341
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_002370487
Protein GI	218245116
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGTGG CGCAGTTTCA AATTGAGTGT ATAGAATCTA AGACTCAGAA AAATCAAAGT 
CAATATAGTA AGTTTGTCCT AGAACCTCTA GCGAGGGGTC AGGGAACCAC CGTCGGCAAC 
GCTTTACGAC GGGTGTTACT GGCTAACTTG CAAGGAGCCG CCGTCACAGC GATCCGGATT 
GCAGGGGTAA ATCACGAATT TGCTACCATT CCAGGGGTCA GAGAGGATGT CTTAGAAATC 
ATGTTAAACA TGAAAGAAAT CGTCCTAAAA AGCTATAGTG ATCAGGCGCA AATTGGCCGC 
CTGGTTGCCA CAAGTGCGGG GACGGTCACG GCAGCCAACT TTGAGTTACC CTCAGAAGTG 
GAAGTGGTTG ATCCAACCCA GTATGTGGCA ACGCTGACCG AAGGCTCGAA ATTAGAGATG 
GAGTTTCGGA TCGAAACAGG AACCGGGTAT AAAGGGGTTG AGCGAGGCAA AGATGACGGT 
ACATCCCTTG ACTTTCTAGA GATCGATGCC GTGTTTATGC CGGTGACTAA GGTCAATTAC 
ATCGTCGAGG ACATCAGGGG AGAACACGGG GAAGCCCAAG ATCGGCTAAT TTTGGAAATT 
TGGACGAATG GGAGTTTTAA TCCCAAGGAA GCCCTATCTG AAGCTGCTGA GATTGTGGTG 
GATTTGTTTA GTCCCCTGAA AGACCTGAAC CAGCTCGAAA CCACCACCCC TGACTATCAA 
GACGATGAGA ATCCGCAAAG TCAGATTCCC ATCGAAGAAT TACAGCTTTC GGTCAGGGCT 
TACAACTGTC TAAAACGGGC ACAAATTAAT ACAGTGGCCG ATTTATTAGA TTATAGCCAA 
GAAGATCTCT TGGAGATCAA AAACTTCGGT CAAAAATCGG CTGAAGAAGT GATCGAAGCT 
TTGCAAAAGC GGTTAGGCAT TACCCTACCC CAAGAAAAAG CGAAATCTTA A

Protein sequence

MVVAQFQIEC IESKTQKNQS QYSKFVLEPL ARGQGTTVGN ALRRVLLANL QGAAVTAIRI 
AGVNHEFATI PGVREDVLEI MLNMKEIVLK SYSDQAQIGR LVATSAGTVT AANFELPSEV 
EVVDPTQYVA TLTEGSKLEM EFRIETGTGY KGVERGKDDG TSLDFLEIDA VFMPVTKVNY 
IVEDIRGEHG EAQDRLILEI WTNGSFNPKE ALSEAAEIVV DLFSPLKDLN QLETTTPDYQ 
DDENPQSQIP IEELQLSVRA YNCLKRAQIN TVADLLDYSQ EDLLEIKNFG QKSAEEVIEA 
LQKRLGITLP QEKAKS