Gene Cyan8802_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1778
Symbol	rpoB
ID	8391091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	1811965
End bp	1815276
Gene Length	3312 bp
Protein Length	1103 aa
Translation table	11
GC content	49%
IMG OID	644979765
Product	DNA-directed RNA polymerase subunit beta
Protein accession	YP_003137513
Protein GI	257059625
COG category	[K] Transcription
COG ID	[COG0085] DNA-directed RNA polymerase, beta subunit/140 kD subunit
TIGRFAM ID	[TIGR02013] DNA-directed RNA polymerase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAATC TAACCTATAA CTACAATCTG CTTCCCGACT TAATCGAAAT TCAACGGTCG 
AGTTTTCGCT GGTTCCTCGA AGAAGGACTC ATCGAAGAAC TCGATAGCTT CTCCCCCATT 
AGCGACTATA CGGGCAAATT AGAACTGCAT TTTTTAGGAG AAAACTATAA ATTAAAACAG 
CCAAAATATG ATGTAGACGA AGCAAAACGG CGTGATAGTA CCTATTCCGT GCAAATGTAT 
GTGCCGACTC GTTTAATTAA CAAAGAAACC GGAGAAATTA AAGAACAAGA AGTCTTTATT 
GGGGATCTAC CCCTGATGAC TGAACGGGGA ACCTTTATTA TTAATGGTGC CGAACGGGTC 
ATCGTCAATC AAATTGTCCG TTCTCCAGGG GTTTACTACA AAGCCGAAAT CGACAAAAAC 
GGACGGAGAA CCTATTCAGC CTCGTTAATT CCCAACCGAG GAGCCTGGTT AAAGTTTGAA 
ACCGACAAAA ATGGCTTAGT TTGGGTCAGA ATCGACAAAA CCCGTAAACT ATCAGCCCAA 
GTTTTACTCA AAGCCATTGG CTTAAGTGAT GCCGAAATTC TCGACGGGTT ACGTCATCCC 
GACTTCTATC AGCGTACCCT CGACAAAGAA GGAAATCCCA GCGAAGAAGA GGCATTATTA 
GAATTATATC GCAAATTACG CCCCGGAGAA CCCCCCACGG TAACAGGAGG ACAACAACTC 
CTCGATTCGC GCTTTTTTGA CAGCAAACGC TACGATCTAG GCCGCGTTGG TCGGTATAAA 
CTCAACAAAA AACTGCGCCT GAATGCCCCC GATACCATTC GGGTACTACG CCCGGCGGAT 
ATTATGGCAG CGATCGACTA TTTAATCAAC CTAGAATTTG ATGTAGGTAG TACCGATGAT 
ATTGACCACC TAGGAAACCG TCGCGTTCGT TCCGTCGGAG AACTCCTACA AAACCAAGTC 
AGAGTCGGCT TAAACCGCCT AGAACGGATA ATCCGCGAAC GGATGACCGT TAGTGAGTCC 
GATGGACTAA CCCCCGCGTC TTTGGTTAAC CCCAAACCCC TAGTAGCTGC CATTAAAGAG 
TTTTTCGGCT CATCCCAACT GTCCCAATTT ATGGATCAAA CCAACCCCCT AGCGGAATTG 
ACCCATAAAC GGCGGATTTC AGCCCTAGGA CCTGGCGGGT TAACGCGAGA ACGGGCGGGC 
TTTGCGGTGC GAGATATCCA TCCCTCCCAC CACGGGCGCA TCTGTCCGGT AGAAACGCCT 
GAAGGACCCA ACGCAGGATT AATTGGTTCT TTGGCAACCT ATGCACGGGT CAATCAATAC 
GGATTCATCG AAACACCCTA CTATAAGGCA GAAAATGGAC GAGTCAGACG AGATTTAGAC 
CCCGTTTACC TCACCGCCGA CGAAGAAGAC GATCTGCGGG TCTGTCCGGG GGATGCGGCC 
ACTGATGCCG AGGGCAATAT CCTAGGGGAA AGCGTCCCCA TCCGCTACCG TCAGGAATTT 
TCCACCACCA GTCCCGAACA AGTGGACTAT GTGGCCGTCT CTCCGGTACA GATTGTTTCG 
GTAGCTACGT CCATGATTCC CTTTTTGGAA CACGACGACG CTAACCGCGC CCTGATGGGA 
TCGAATATGC AGCGTCAAGC CGTTCCTTTA CTGCGGCCAG AACGTCCCTT AGTGGGAACT 
GGACTAGAAG CCCAAGCCGC GAGAGATTCA GGGATGGTGA TCGTCAGCCG TACCTATGGG 
ATCGTTACCT ATGTAGATGC CTCCGAAATT CGGGTACAGG TAACAGGTCC AGAAAACCAC 
GACAAATTAG GAACCGAGAT CACCTATCTG TTACAGAAAT ATCAACGGTC TAACCAAGAT 
ACCTGTTTAA ATCAGCGTCC TCTGGTGTAC GTTAATGAGG AGGTTGTCCC CGGTCAAGTC 
TTAGCCGATG GATCAGCCAC CGAAGGCGGA GAATTAGCCC TAGGACAGAA TATTCTCGTC 
GCCTATATGC CGTGGGAAGG CTATAACTAC GAGGATGCGA TCCTGATTAG TGAACGGTTG 
GTCTATGACG ACGTTTACAC CAGTATTCAC GTTGAAAAGT ACGAAATTGA AGCCCGTCAG 
ACTAAATTAG GACCAGAAGA GATTACCCGC GAAATTCCTA ACGTTGGGGA AGATTCCCTG 
AGAAACCTCG ATGAACAGGG CATTATCCGC ATTGGGGCTT GGACAGAAGC CGGGGATATC 
CTGGTCGGAA AAGTGACCCC CAAAGGAGAA TCGGATCAAC CCCCTGAAGA AAAGCTATTA 
CGCGCAATTT TTGGTGAAAA AGCCCGTGAT GTACGGGATA ACTCTTTAAG GGTTCCCAAC 
GGAGAAAAAG GCCGCGTGGT CGATGTTCGG GTGTTTACGC GGGAACAGGG AGATGAATTA 
CCCCCTGGGG CTAACATGGT CGTACGGGTG TATGTTGCCC AAAAACGCAA AATCCAAGTC 
GGGGATAAAA TGGCCGGTCG CCACGGGAAT AAGGGGATTA TTTCCCGTAT TTTGCCCATT 
GAAGATATGC CCTATTTACC TGATGGCCGT CCCGTGGATA TCGTTCTCAA CCCCTTGGGT 
GTGCCCTCGC GGATGAACGT CGGTCAGGTG TTTGAATGCT TATTAGGATG GGCAGGTGAA 
AACTTGGGCG TTCGCTTTAA AGTGACTCCC TTTGATGAAA TGTACGGCGA AGAAACCTCT 
CGTAAAACCG TTCATGGCAA ACTGCAAGAA GCCAGTCACA AACGCGGGAA AAGCTGGATT 
TATCAAGAAG AAAATCCAGG GAAGATTCAG GTCTTTGATG GCCGTACCGG AGAACCCTTC 
GATCGCCCCG TCACCGTAGG TCAAGCCTAT ATGCTTAAAT TAGTCCACTT GGTGGATGAT 
AAGATCCACG CCCGTTCGAC GGGTCCCTAC TCCTTGGTAA CACAACAACC TTTAGGTGGA 
AAGGCACAAC AAGGTGGACA ACGCTTCGGA GAAATGGAAG TTTGGGCGTT AGAAGCCTAT 
GGGGCAGCCT ATACCCTGCA AGAGTTGTTA ACGGTGAAAT CCGACGATAT GCAAGGACGG 
AACGAAGCCT TAAATGCGAT CGTTAAGGGT AAACCCATTC CTCAACCCGG AACGCCTGAG 
TCCTTTAAGG TACTGATGCG CGAATTGCAG TCCTTGGGCT TAGATATTGC CGTCCATAAG 
GTAGAAAATG CCGAAGATGG GACCAGTCGG GATGTGGAGG TTGATTTGAT GGTGGATACC 
CAACGTCGTA CTCCCAGTCG TCCTACTTAT GAGTCCTTAA CTAGCGAGGA TCTCGAAGAA 
GAAGAAGTGT AA

Protein sequence

MTNLTYNYNL LPDLIEIQRS SFRWFLEEGL IEELDSFSPI SDYTGKLELH FLGENYKLKQ 
PKYDVDEAKR RDSTYSVQMY VPTRLINKET GEIKEQEVFI GDLPLMTERG TFIINGAERV 
IVNQIVRSPG VYYKAEIDKN GRRTYSASLI PNRGAWLKFE TDKNGLVWVR IDKTRKLSAQ 
VLLKAIGLSD AEILDGLRHP DFYQRTLDKE GNPSEEEALL ELYRKLRPGE PPTVTGGQQL 
LDSRFFDSKR YDLGRVGRYK LNKKLRLNAP DTIRVLRPAD IMAAIDYLIN LEFDVGSTDD 
IDHLGNRRVR SVGELLQNQV RVGLNRLERI IRERMTVSES DGLTPASLVN PKPLVAAIKE 
FFGSSQLSQF MDQTNPLAEL THKRRISALG PGGLTRERAG FAVRDIHPSH HGRICPVETP 
EGPNAGLIGS LATYARVNQY GFIETPYYKA ENGRVRRDLD PVYLTADEED DLRVCPGDAA 
TDAEGNILGE SVPIRYRQEF STTSPEQVDY VAVSPVQIVS VATSMIPFLE HDDANRALMG 
SNMQRQAVPL LRPERPLVGT GLEAQAARDS GMVIVSRTYG IVTYVDASEI RVQVTGPENH 
DKLGTEITYL LQKYQRSNQD TCLNQRPLVY VNEEVVPGQV LADGSATEGG ELALGQNILV 
AYMPWEGYNY EDAILISERL VYDDVYTSIH VEKYEIEARQ TKLGPEEITR EIPNVGEDSL 
RNLDEQGIIR IGAWTEAGDI LVGKVTPKGE SDQPPEEKLL RAIFGEKARD VRDNSLRVPN 
GEKGRVVDVR VFTREQGDEL PPGANMVVRV YVAQKRKIQV GDKMAGRHGN KGIISRILPI 
EDMPYLPDGR PVDIVLNPLG VPSRMNVGQV FECLLGWAGE NLGVRFKVTP FDEMYGEETS 
RKTVHGKLQE ASHKRGKSWI YQEENPGKIQ VFDGRTGEPF DRPVTVGQAY MLKLVHLVDD 
KIHARSTGPY SLVTQQPLGG KAQQGGQRFG EMEVWALEAY GAAYTLQELL TVKSDDMQGR 
NEALNAIVKG KPIPQPGTPE SFKVLMRELQ SLGLDIAVHK VENAEDGTSR DVEVDLMVDT 
QRRTPSRPTY ESLTSEDLEE EEV