Gene PCC8801_0652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0652
Symbol
ID	7105711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	680668
End bp	682023
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	43%
IMG OID	643473752
Product	sun protein
Protein accession	YP_002370895
Protein GI	218245524
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase [TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAACT CAGATCAGAT AACCCATGCG CGTCCCTTGG CCTTGGTAAT TCTCCGTGAG 
ATTGAAAGAC GAGGAACTTT CACGGATATA GCGATTGATC GCGGTTTAAA ATCAACCGAT 
CTTAGTGGCA GCGATCGCGC TTTAGTCACC GAATTAGTCT ATGGGATCGT CCGACGCAAA 
CGAACCCTTG ATACCCTGAT TGATCAGTTG GGGAAAAAAG CCTCCCACCA ACAACCTCCG 
GATTTACGTC TGATCCTTTA TATTGGACTC TATCAACTGC GTTATTTAAG CCAAATTCCC 
CCTTCTGCGG CGGTGAATAC TGCCGTTAAC TTGGCCAAAG AAAATAGCTT ACAACGGCTT 
TCGGGGGTGG TTAATGGCAT TTTACGGCAA TATATTCGCC TTGCTCAAGA AAACAATGAC 
CCTCTAATCT TACCCGATGA TCCCATCTCA AGATTAGGGG TTCTCTATAG TTTTCCTGAT 
TTCATGATTA AACTGTGGTT AGAACAATGG GGACTAGAAA CCACCGAAGA ATTATGTAAT 
TGGTTTAATC AACCTCCTGT CTTAGATATC CGGATTAATC CTTTAAAAAC GACCTTAGAG 
GAAGTTAAAA CGACCTTAAG CCAAGGAAAT CTGACGCTAA TGCCGTTAGA GATCCCCCAA 
GGATTAAGAT TACAGGGTAA AACGGGAGCG ATTCAAGATT TACCCGGATT TAAAGAGGGA 
TGGTGGACGG TACAAGATAG CAGTGCTCAA TTGGTGAGCC ATTTACTTGA TCCTCAGCCA 
TCGGAGGTGA TTATCGATGC CTGTGCTGCA CCAGGGGGAA AAACCACCCA TATTGCTGAA 
TTAATGGGGG ATCAAGGAAC AATTTGGGCT TGCGATCGCT ATGCCTCCCG CTTGAAAAAA 
TTGTCAGCCA ATAAGGAACG ATTGCAGCTA AACTCAATTA AAATCGTTAC GGGAGATAGT 
CGTCAATTAG ACCAATTTCA GGGAATTGCT GATCGCGTCT TAGTGGATGC ACCCTGTTCA 
GGACTGGGAA CCCTACACCG ACACCCTGAT ATTCGTTGGC GACAAACCCC AGAAAAGATC 
GAAGAATTGG CTATTTTACA GAAAGAATTA TTAGAAACGA CAGCTAATTG GGTCAAACCC 
CAAGGGATTT TAGTCTATGC TACTTGTACT TTAACTTATC AAGAAAATGA AGGAGTTATT 
GAACACTTCC TTGCTTCCCA TCCCCATTGG AAGATTGATG TCCCCTCTCC TAATTCACCC 
GTAGCTAAGT GGATGACAGC ATCAGGATCG ATAAAAATTT TACCTCATCA ACAGGACATG 
GATGGATTTT TCATGGTGAA GTTAAAGAAA GGTTGA

Protein sequence

MSNSDQITHA RPLALVILRE IERRGTFTDI AIDRGLKSTD LSGSDRALVT ELVYGIVRRK 
RTLDTLIDQL GKKASHQQPP DLRLILYIGL YQLRYLSQIP PSAAVNTAVN LAKENSLQRL 
SGVVNGILRQ YIRLAQENND PLILPDDPIS RLGVLYSFPD FMIKLWLEQW GLETTEELCN 
WFNQPPVLDI RINPLKTTLE EVKTTLSQGN LTLMPLEIPQ GLRLQGKTGA IQDLPGFKEG 
WWTVQDSSAQ LVSHLLDPQP SEVIIDACAA PGGKTTHIAE LMGDQGTIWA CDRYASRLKK 
LSANKERLQL NSIKIVTGDS RQLDQFQGIA DRVLVDAPCS GLGTLHRHPD IRWRQTPEKI 
EELAILQKEL LETTANWVKP QGILVYATCT LTYQENEGVI EHFLASHPHW KIDVPSPNSP 
VAKWMTASGS IKILPHQQDM DGFFMVKLKK G