Gene PCC8801_2612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2612
Symbol
ID	7103603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	2701100
End bp	2702239
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	41%
IMG OID	643475653
Product	protein of unknown function DUF21
Protein accession	YP_002372772
Protein GI	218247401
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTCTTG ATCCCCCTTT TTACCAGATT ATCTTGCTAA CTCTAGATTA TCATTTCTTA 
GCGAGTACCG AACCTGCTCC TTTTTTAGGG CAGGTTTGGC TCGATTTAGC GGCAATCGTC 
TTAATGCTGC TGATGTCTGC TTTTTTTTCC GCCTCAGAAA CCGCTATTAC TGCCTTTGAT 
AATTTTAAAC TCAGGGGACT CATTGAGCAT CAAGGAGATC CTTCAGGAAT TTACCGCTTA 
GTTCTCGAAA ATCGACGGCG TTTTATTACA AGTCTTTTAG TCGGGAATAA TCTGGTTAAT 
AATTTTTCGG CTGTTCTTAC GAGTAATTTA TTTGCCATTT GGTTAGGTAA TGCAGGATTA 
GGCATAGCAA CGGCTATTAT TACGGTTTTT ATTTTGATTT TTGGAGAAAT AACCCCAAAA 
TCCCTAGCTA TTCTCCATAA TCGTGCTTTT TTTCGCCTTT CCGTTCGACC TGTTTTCTGG 
TTGTCTCAAA TACTAACGGC GATCGCCATT GTTCCCATTT TTGAAACCAT TACCCAAAAG 
ACCATTCAAA TTTTTCAAGG AAAATCCGAT AAAAATGCCC ATTCTGGAGA ATCTTTGCGG 
GATTTACACC TAATGATCAA GATTTTGGGA GGCAAAGGGA CATTAGATTT GTACCGACAC 
CAGTTACTGA ACAAAGCGTT AATGCTCGAT CAGTTAATAG CGAAGGATGT GGTCAAACCC 
CGTATCGATA TGACTACGAT TTCCCATGAA TCTAGTTTAC AGCAATTCAT CGATTTATCT 
CTCGAAACAG GCTATTCTCG CATTCCCGTC CAAGGAGAAT CGAAGGATCA GATAGTTGGG 
ATAGTCAATC TTAAACAGGC ACTCCAGAAG CTGCAATCTG TTCCAAAACA AAGACTTTCG 
GAGATAGCCG TCATTGAAGC GATGGATGCA CCGATTTATA TTCCTGAAAC TAAGCGGGTC 
ACAAATTTGC TCAAGGAAAT GCTCCAACAA CGGTTTCATA TTGTCATTGT CGTCGATGAA 
TATGGCGGAA CCGTTGGTTT AGTGACCTTA GAAGACATTT TAGAAGAATT AGTCGGCGAA 
ATCTATGATG AAAGCGATTA TCCCTCGGTT CAGGAGTCCT TAGTTCAGCG TGATCCCTAA

Protein sequence

MSLDPPFYQI ILLTLDYHFL ASTEPAPFLG QVWLDLAAIV LMLLMSAFFS ASETAITAFD 
NFKLRGLIEH QGDPSGIYRL VLENRRRFIT SLLVGNNLVN NFSAVLTSNL FAIWLGNAGL 
GIATAIITVF ILIFGEITPK SLAILHNRAF FRLSVRPVFW LSQILTAIAI VPIFETITQK 
TIQIFQGKSD KNAHSGESLR DLHLMIKILG GKGTLDLYRH QLLNKALMLD QLIAKDVVKP 
RIDMTTISHE SSLQQFIDLS LETGYSRIPV QGESKDQIVG IVNLKQALQK LQSVPKQRLS 
EIAVIEAMDA PIYIPETKRV TNLLKEMLQQ RFHIVIVVDE YGGTVGLVTL EDILEELVGE 
IYDESDYPSV QESLVQRDP