Gene PCC8801_4452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4452
Symbol
ID	7095829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011721
Strand	+
Start bp	5346
End bp	6539
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	45%
IMG OID	643467409
Product	putative RNA polymerase, sigma 28 subunit, FliA/WhiG subfamily
Protein accession	YP_002364705
Protein GI	218203850
COG category	[K] Transcription
COG ID	[COG1191] DNA-directed RNA polymerase specialized sigma subunit
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAC GTGGCAGCGT TCTGGAGATT TTTTCCACTT TTTTACAGTT TGAGAGTGAC 
TGGATCAGTC GTTGGATCGC CGATCCCAAA CTGCACCGGA GTATGCAGCA ATGTCTGTCT 
CAATCCTCAC AATCTCAAGA ATCTAACCAT TTTTGGGCTC TCTACTGGCA TAAAGTTTGG 
CAAACCCAAA AAAGTCCCCT AGCCTCCGCT CATCTTTGCG CCTATCTTCA GGAAGCGAGT 
TATTGGACGG CTAAAAAAAT GACCATGACC TTTGGCAGCA GTCTGTCTCT CATGGACTTA 
TTTCAAATTG CCCTGCTCAA AATTGACAAA ATTTTCCAAA CATTCAACCC GCAACAGGGC 
ACCAATTTAG AACAATATGC CAGCCTGGTT TTTCGCAGTA TTATTAAAGA CGAATTACGC 
CAACGACGGG AAATCGATCT CTGTACCAAT TGGGCACTAT TGCATAAATT GAGCCAGAAA 
AAACTCCTTG AAGCCCTGCA ATTTCAAGGA CTGAACCCAG AGGCGATCGC CGAATACCTC 
CTGGCCTGGA AATGTTTTCA AGCCCTTTAT GCCCCCAGCC AAGGGAGAAG CACTCGCAAG 
ATTCCTGAAC CTGACGCGAC TATGTGGGGG CAAATCTGTC AAGTTTATAA CCAACAGAGC 
TTTAAAAAGC CGTTAGAACC CGATATCCTC AAAAAAAGGC TAGAGACCTG TGCCAAAGCA 
GCGCGAGCCT ATTTATACCC CCAAATGCTG TCTGTTGATG CCCCTAAACC AGGACAGGAA 
GAGGGATCTT TCCTCGATAG CCTCTCCCTC GATCTGCAAC ATTCCTTAGA AAGCGAGATT 
ATTGCCCAAG AAGAAGAAGA AATAAGAAAA CAAGAGCGAG AACAAATTAA TGGCGTTTTA 
TTAAGAGCCT TAATTAAATT TGATGTTCAA TCCCAACGAT TGCTACAGAT GTATTATGGT 
CAAGGTCTCA CGCAACAGGA GATCGCCCAA CAACTAGAAA TCAAACAGTA TACCGTGTCT 
CGCCGTCTTG CTAGTCAGCG AAAAACCCTA ATTCTCACCT TAGGACAATG GGCGCAGAAC 
ACCCTGCATT ATTCTCTCGA TGCGGACGTA CTTAATAAAA TAAACACGAT TCTCGAAGAG 
TGGCTCAAAG TTCACTACCA TCACCCTGAC CTTAGTGCAA GAGAAGTAGA GTAA

Protein sequence

MQKRGSVLEI FSTFLQFESD WISRWIADPK LHRSMQQCLS QSSQSQESNH FWALYWHKVW 
QTQKSPLASA HLCAYLQEAS YWTAKKMTMT FGSSLSLMDL FQIALLKIDK IFQTFNPQQG 
TNLEQYASLV FRSIIKDELR QRREIDLCTN WALLHKLSQK KLLEALQFQG LNPEAIAEYL 
LAWKCFQALY APSQGRSTRK IPEPDATMWG QICQVYNQQS FKKPLEPDIL KKRLETCAKA 
ARAYLYPQML SVDAPKPGQE EGSFLDSLSL DLQHSLESEI IAQEEEEIRK QEREQINGVL 
LRALIKFDVQ SQRLLQMYYG QGLTQQEIAQ QLEIKQYTVS RRLASQRKTL ILTLGQWAQN 
TLHYSLDADV LNKINTILEE WLKVHYHHPD LSAREVE