Gene PCC8801_4300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4300
Symbol
ID	7102662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4519656
End bp	4520753
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	38%
IMG OID	643477280
Product	metallophosphoesterase
Protein accession	YP_002374379
Protein GI	218249008
COG category	[R] General function prediction only
COG ID	[COG1409] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTATA ATCGTCGTCA ATTTATAATT TTTCTTTGTT GTCTTTTAGG GGTTGTTATG 
GCTACGGTTA GCCATCAAGT ATTTAGCCGA AATAATATTA CGTCTGAACC GCCATCTAAC 
GTCGTTGAAA ATCCAATAGA AACTCCTATT AATGAACCCG TAGCGGCTGC CCCTTCAGGA 
TTATTTGCCC CGGTTAAAGG GGATGTTAGA ATTGTTGTGA TTAGTGATTT GAATAGTCAG 
TATGGTTCAA CCAGTTATGA ACCGGAAGTT AAAGAAGCGA TCGCCCTAAC TCCCCAATGG 
AAACCAGACT TAGTATTATG TGGGGGAGAT ATGATTGCCG GACAAAAAAG ATCCCTAACT 
CAACAACAAA TTCAAGCCAT GTGGTCGGCG TTTGATGCTA ACATTAGTAA GCCCTTACGT 
CAAGCGAAGA TTCCCTTCGG GTTTACCATT GGTAATCATG ATGGATCAGG GGCAATCAGT 
CAAGGAAAAT TAATTTTTAA ATCAGAAAGA GACTTAGCTT CAACGTATTG GAATCAACCC 
CAAAATAATC CAGGGTTAAA CTTTGTTGAT CGGGGAAATT TTCCGTTTTA TTATAGTTTT 
ATACAAAAAG ATATTTACTA TTTAGTGTGG GATGCCTCTA CTCATATTAT TTCATCTGAA 
CAATTAGCTT GGGTAGAAAA AAATTTAGCC AGTCCTGTTG CTCAAAATGC CAAATTACGC 
CTAGTGATTG GACATCTTCC CCTCTATCCA GTTGCGGTAG GACGTAATGA CGGAGGGAAC 
TTTTTAAGTA ATGCTGAAAA ACTACAAGCC TTATTAGAAC GCTATCAAGT TCATACCTAT 
ATTAGTGGAC ATCATCATGC CTATTATCCC GGTAAAAAAG ATAACTTAGA ATTACTTCAT 
GCGGGGGCAT TAGGAGGGGG ACCCAGAAAG TTATTAAATA GTAATCTTTC TCCTCGCAAA 
ACCATAACAG TCGTTGATAT TAATTTAACG TCTCAGTCAA CCACTTACAC GACTTATGAC 
ATGAAAACCA AACAGGTTAT TGATATTAAA ACCTTACCTC AGTCTATTGG CAAAGTATGG 
CGAAGAGATC TTAAATAA

Protein sequence

MNYNRRQFII FLCCLLGVVM ATVSHQVFSR NNITSEPPSN VVENPIETPI NEPVAAAPSG 
LFAPVKGDVR IVVISDLNSQ YGSTSYEPEV KEAIALTPQW KPDLVLCGGD MIAGQKRSLT 
QQQIQAMWSA FDANISKPLR QAKIPFGFTI GNHDGSGAIS QGKLIFKSER DLASTYWNQP 
QNNPGLNFVD RGNFPFYYSF IQKDIYYLVW DASTHIISSE QLAWVEKNLA SPVAQNAKLR 
LVIGHLPLYP VAVGRNDGGN FLSNAEKLQA LLERYQVHTY ISGHHHAYYP GKKDNLELLH 
AGALGGGPRK LLNSNLSPRK TITVVDINLT SQSTTYTTYD MKTKQVIDIK TLPQSIGKVW 
RRDLK