Gene PCC8801_2914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2914
Symbol
ID	7104459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3004707
End bp	3006362
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	35%
IMG OID	643475950
Product	pseudouridine synthase
Protein accession	YP_002373066
Protein GI	218247695
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAAG TAATTCTTGA GAAGATATCA GAATTTGTGA CAGAAAAGAC AGCTTTAAAG 
GATTTAGCGG TTAATTATTG GTATGAAGGA TATTGTCCCC AAAGTGGTGA ATTTTTAAGA 
CTTCCCCGTA ATAGAATGAT AGAAGCGATC GCCCTCGGTT TAATGAAACA ATTAGCTGAA 
GATAATCGCT ATAGTTATGA AGGAAAAATG TATGGTGTTT TATTAGTAGA AACCCCACAA 
GGAGAACTGG CAGTACTAAA AGCGTTTTCG GGTCTTCTTT TAGGAAAAAA TGTTGTTGAG 
GGATGGGTTC CTTCTCTATT GGGAAAGGAA AAAATAACTT TAGAAGAAAT TCAAACATTA 
GAACAACTAG AAAATCTCAA ACATCAGATA GTTGCCTTAC AAAAAATTTC CGAAAGACAG 
GATTATCAAG ACTTATCTAA AGAATGGAAA ACCCGTTTAA ACAATTTAGC AATTATTCAT 
CGTGAACGTA AATTAAAAAG ACAAGAAAAA CGCAAAAATT TACTAAAAAC CTTCCAAGAT 
AATGATTTAA AGCTTGTTTT GGATAATCTC AACAAAGAAA GTCAAAAAGA CGGCATAGAG 
AAGCGAAAAT TAAAACAAAA AAGAGATAAA ATATTAAACC CATTAAAGCA AAAAATTGAT 
CAAGCAGATG CTCAAATATT AGAATTAAAA CAACAGCGTA AAGAATTATC CCGTCAGCTT 
CAAGCACAGA TGAATCAAGT TTATTCTCTA AGCAATTTTG CGGGACAATC AAACTCATTA 
CAAAGCTTAA TACCCACAGG TGGTTTACTG ACAGGAACGG GAGAGTGTTG TGCGCCAAAA 
TTACTAAATT ATGCAGCACA ACATCACTTA AAACCTTTAG CTATGGCTGA ATTTTGGTGG 
GGAGAAGCGT CTAACAATGG AGATAAAATT CCTGGTCAAT TTTATCCTGC GTGTCAGGAA 
AGATGTCAGC CTTTGATGGG ATTTTTACTG TCTGGATTAG GGAACAATCA ATCTTTTTTT 
AAAAGTGAAA TCAAGGTAAT TTATGAAGAT CAATGGATAA TTGCTATTGA TAAGCCGAGC 
AGTTTATTAT CAGTACCAGG TCGTTATTTT GAGACCTTTG ATAGTGTCTT AACCCGCTTA 
CAAAATAGCT TACCTGATGC TCAAGAATTA AGAACTGTAC ATCGATTAGA TCAAGACACT 
TCGGGGATTC TTTTATTAGC ACGCGATCGC TACACCCATC GTCACCTTAG TCAACAATTT 
GCACAACGAA AAGTTGAGAA AATTTATGAA GCAATCTTAG CTGGATCGGT TATGATGAAT 
GAAGGAGTAA TTCAATTACC TTTATGGGGA GATCCCAATA ATCGTCCTTA CCAAAAAGTT 
GATTGGGAAC TGGGAAAACC TAGTATTACT CAGTTTAAAG TTATTACAAC ACAAGAAAAC 
TTGACCCGTA TTCAATTTAT TCCCCTAACA GGACGTACCC ATCAAATCAG GGTTCATGCA 
GTGGATACAC AAGGACTAGG AAGCGTCATT TTAGGCGATT ATCTTTATGG GTGTAATGCT 
GGTGTAAGTC GTTTACATTT ACACGCTAGA GAATTAAAAT TTGAGCACCC TCAGCAACAA 
AAGACTGTTC ATCTTTATTT AGAAACACCA TTTTAA

Protein sequence

MDQVILEKIS EFVTEKTALK DLAVNYWYEG YCPQSGEFLR LPRNRMIEAI ALGLMKQLAE 
DNRYSYEGKM YGVLLVETPQ GELAVLKAFS GLLLGKNVVE GWVPSLLGKE KITLEEIQTL 
EQLENLKHQI VALQKISERQ DYQDLSKEWK TRLNNLAIIH RERKLKRQEK RKNLLKTFQD 
NDLKLVLDNL NKESQKDGIE KRKLKQKRDK ILNPLKQKID QADAQILELK QQRKELSRQL 
QAQMNQVYSL SNFAGQSNSL QSLIPTGGLL TGTGECCAPK LLNYAAQHHL KPLAMAEFWW 
GEASNNGDKI PGQFYPACQE RCQPLMGFLL SGLGNNQSFF KSEIKVIYED QWIIAIDKPS 
SLLSVPGRYF ETFDSVLTRL QNSLPDAQEL RTVHRLDQDT SGILLLARDR YTHRHLSQQF 
AQRKVEKIYE AILAGSVMMN EGVIQLPLWG DPNNRPYQKV DWELGKPSIT QFKVITTQEN 
LTRIQFIPLT GRTHQIRVHA VDTQGLGSVI LGDYLYGCNA GVSRLHLHAR ELKFEHPQQQ 
KTVHLYLETP F