Gene PCC8801_0213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0213
Symbol
ID	7103547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	208470
End bp	209696
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	37%
IMG OID	643473326
Product	hypothetical protein
Protein accession	YP_002370472
Protein GI	218245101
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGAAA AATGGGAATT AAAGGAAAAT CCTTTCCGGT CTACTCCCCC CGATGATCCC 
GAAAAATTAG CCCAAATTTT CTATGGACGG GCTCAGATTT TAGATGTAGC TATTCCGACC 
CTTTATGAAG GAAGAAATAT CTTAATTAGG GGGGTTTGGG GAATTGGAAA AACCGCCTTG 
ATTTTCAATT TAATTAATCA GTTACAGCAG GAAGTAGCTG AAATAAAGGA AAAAATGTTA 
GTCCTGTATC TAAGTAGTAT TCCCGGAGAC AGTCCCCCAG AATTTTATCG TGCTTTATTG 
TTAGCTATAG CCGATAGTTT AGCAGAAATT GATGAGGAAG CGAGAGACAT TGCTAATACG 
CTTTTAGGCT ATTCTATTCA ACGGACTAAA ACCACCACAG AAGGACAAGT TAAACTTGGA 
ATAATATCCT TTGGAAGACG ACAAGAATCT CCCGCAAATT TAGTGAGTCC TACTGATAAA 
ATTGACCCCT ATCCCTTACT AATCAAACTC CTTAGTAAAG CAGAAGAAAA ATATCATCGT 
ATTGTCATTG CTATTGATGA TTTTGACAAA AAAGATCCCA TTATTGTCCA GACAATTTTA 
GAAAGTAGTT TAGATTTATT TCGCATGGGA AAGAATCGAG GATTTATTAT GACAGGAAGA 
GGGTTTACCG ATCTCCAAGA AGCTACCTTA AAAGCTTTAG GGATTTTTTC GGAAGATATC 
CCCCTCGAAC CCATGAGTCA AGATGATTTA CATCATATTG TCATTAATTA TCTTAATAGC 
GTTAGATATC AACCGCGAAA TGATACCTAT CCTTTTACAG AAGACGTAAT GAATCTAATT 
ACTAATTATG CCCAAGGAGT CCCTAGACAA CTAAATGAAA TTTGCGAAAA AGTCTTACGC 
AAAGCGGCTT CAGCAGGGTA TGAAACCATC GATCAACCTG CTTTTAATAC TATTTGGGAA 
ACCCTACAAA AAGAATTTAC GAACCAGCTA AGTCCCCAGT TTCGTCATCT ATTATATGTT 
GCCCATGAAG CAGGGGGAAT TAGTGAAAAT ATATCCGATC GCACCCTCGA TAAACTCGAC 
GCACTTACCT TTGTTGAACT GTTACCCCAA CTGAAATTAT TGGAAGAACA AGGAGTATTA 
ATTCGTCAAG AAGATCAAAA AGGATTTAAG TTTTTACCCT CTCAATTATT CCAACCGAAA 
TTAGTATCCG AAGCGCAGGA AGAATAA

Protein sequence

MLEKWELKEN PFRSTPPDDP EKLAQIFYGR AQILDVAIPT LYEGRNILIR GVWGIGKTAL 
IFNLINQLQQ EVAEIKEKML VLYLSSIPGD SPPEFYRALL LAIADSLAEI DEEARDIANT 
LLGYSIQRTK TTTEGQVKLG IISFGRRQES PANLVSPTDK IDPYPLLIKL LSKAEEKYHR 
IVIAIDDFDK KDPIIVQTIL ESSLDLFRMG KNRGFIMTGR GFTDLQEATL KALGIFSEDI 
PLEPMSQDDL HHIVINYLNS VRYQPRNDTY PFTEDVMNLI TNYAQGVPRQ LNEICEKVLR 
KAASAGYETI DQPAFNTIWE TLQKEFTNQL SPQFRHLLYV AHEAGGISEN ISDRTLDKLD 
ALTFVELLPQ LKLLEEQGVL IRQEDQKGFK FLPSQLFQPK LVSEAQEE