Gene PCC8801_4342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4342
Symbol
ID	7102695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4555977
End bp	4557167
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	30%
IMG OID	643477321
Product	hypothetical protein
Protein accession	YP_002374420
Protein GI	218249049
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTCTG AAGAAAGACC AAGAGATTTA AGCTATCGAG CTAGAAACGG AATATACTTT 
ACTCTGTTAA GTGGAGAATT TGAAGCTCAA TTTGAAACGA TTATTACAAA ATTATTACAA 
TGGATTAAAT CTGACTATGA CTCTAATTTG CCAGTTTCAA ACATTAATCA TGGTGGATTT 
AGAATACTTG ATACTTTTTT ATCTGATACT CTTAGCCAAG AATCCTTTAA AAGAATTTTT 
GAAATATCTT CTATAAAAAA AATTCCAATA AAAATCTTAT TAGCTAATCC AGATAGTCAA 
TTTGCTATTG CTCGACATAA CTCTTTAAGA CACTCAGTAC AACAAGAAAC TCAGCAAGAA 
ATGAATCGAA GAAGAGAAAT CAGAGCTAAA ATTGGATTTC AAAAAATTCT TGAGAGTTTT 
TTGAAATCAA AAAAAATAAA ATATGATGAT ATAGCAATTC AAGAACTGAG TTATGATAAA 
ATGGCTGAAA AGTTTAATCA AATTAAATCA AATAATGACA GTCATATAGA AATACAATTT 
TATACTGAGG TTCCTAGCGG ACCAATGCTC TTTTTTCAAG ATGTTCTTTT ATCAGGATTT 
TACTGTGCAG GAATTTCTTC AAGAGAATTA CCTTGGTTAG TGATTATTGA TGATCCTAAT 
ATTAACAATG ATATGTATGA TGTATTTAAT GCTGAATTTG AGAGGATATG GGAATTGAGT 
AGTACAAATA GAGAACGACC GAGTTCTGAG CTTTATAACT ATGCTCATAG CTATTTTATT 
AGCTATTCTA GTCAAGATAA AGAAATAGCG GATCACATAG AATTACTTCT TTGGAGAAAA 
AATCGTTTAG TGATTAGAGA TGAAAGAGAT CTAACCTCTG GTCAAAATTT ATCAGAAGAT 
ATTGAAAGTG TAATTGGTAA GTCACAAACA TTTTTATTTT TATGTAGTCA ATCTTCTAAT 
CAAAGCGATT ATTGTAGAGG AGAAATTGAT GTAGCTTTTG AATACAAAAA GCTAAAAGAA 
CAACAAGGTA ATAATGGACA AGAAGGAATA CAACGAATTG TTGTTATCTC TTTAGATGGA 
CAAAAACCGC AAGATTTACG ACTTAGATCT TATTTACGTT TGCAGGGAGA GAACAGAACT 
GAAAGAGAAT CATCAATTCG ACGAATTATA GATGAAGAGG AAAGGATATA G

Protein sequence

MFSEERPRDL SYRARNGIYF TLLSGEFEAQ FETIITKLLQ WIKSDYDSNL PVSNINHGGF 
RILDTFLSDT LSQESFKRIF EISSIKKIPI KILLANPDSQ FAIARHNSLR HSVQQETQQE 
MNRRREIRAK IGFQKILESF LKSKKIKYDD IAIQELSYDK MAEKFNQIKS NNDSHIEIQF 
YTEVPSGPML FFQDVLLSGF YCAGISSREL PWLVIIDDPN INNDMYDVFN AEFERIWELS 
STNRERPSSE LYNYAHSYFI SYSSQDKEIA DHIELLLWRK NRLVIRDERD LTSGQNLSED 
IESVIGKSQT FLFLCSQSSN QSDYCRGEID VAFEYKKLKE QQGNNGQEGI QRIVVISLDG 
QKPQDLRLRS YLRLQGENRT ERESSIRRII DEEERI