Gene Cyan8802_4238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4238
Symbol
ID	8393590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	4374994
End bp	4376304
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	42%
IMG OID	644982150
Product	3-phytase
Protein accession	YP_003139861
Protein GI	257061973
COG category	[I] Lipid transport and metabolism
COG ID	[COG4247] 3-phytase (myo-inositol-hexaphosphate 3-phosphohydrolase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00408008
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACAAAG TTATTAATAG TCTTGCAGTA GCGTGTTTCT CCTTCGCATT CAGTCATCAA 
GCAGCGATCG CAATACAATT GACGACACCG ACAGCAGAAA CTCCCCCTGT ACTCGATGAA 
CTTGTTGATC CCCCTGGTGA CGCAGATGAT CCCGCGATCT GGCTTCATCC GAACGATCCA 
TCTCAAAGCT TAGTCTTGGG AACCTTGAAG AATGCGGGGT TAGGGGTCTA TGATTTGGGC 
GGAAATCTCT TACAATTAAT TCAACCCAAT AGTATCCGCT ACAATAACGT TGATCTCCTA 
TATGGCTTTT CTTTAGGGGG TAATTCGGTC GATTTAGCGA TCGCTTCAGA CCGTCAGAAT 
GATATCTTAG CGATCTTTAA AATTGACCCG ATGACTCGTT TATTAGAAAG CATCGTTTCC 
AACAACATCG GAACAATTTT TACCCCCGTC GGACAAGTTT CTAACGGGAC AACCACTGCT 
TACGGACTAG CAACCTATAC TGACTTATCG ACTGGGAAAA ATTATGTTTT TGTTTCTCAG 
CGAGAGACAG GGAACGTCGC TCAATTAGAG CTCTTTGATG ATGGTACGGG AAAAGTTAAT 
TACACTCAAG TGCGATCGCT CACCTTACCG ATTCCTCCAG GTGGCGTATT GGAAGATGCT 
CAAGTTGAAG GGATGGTCGC AGATCGGGAA TTGGGGTATG TTTATGTTGG GCAAGAAAAT 
CGGGGTATTT GGAAATTTTC AGCCTCTCCT AATGGCAGCA CCCTTGGTCA ACTCATTGAT 
GCTGTTAAAC CTGAAGGAAC GCATTTAGAA GCGGATGTAG AAGGATTAAC CATTTACTAT 
AGTGATAACG GAACAGGTTA TTTACTAGCA TCAAGTCAAG GAGACAATAC CTTTGCTATT 
TATGATCGCT TAGGCAATAA CAATTATTTA GGTAGCTTTT CTATTGTAGC ATCAGGGGGC 
ATTGATTCGG TTGAGGAATC GGATGGTGCT GATGTTATCA ATGTTCCTCT GGGATCTCAA 
TTTCCTTTTG GATTATTTGT GACACAAGAT GGTTCCAATG ACCCGCCAGA ACTGTTTTTT 
GATCCAGATG ATCAAGAATT TGTTAATGTT AGTTCTAACT TCAAATTTGT CCCTTGGGAA 
ACTATTGCTA ATGCTTTTGC ACCTAATCCC TTGCTGATTA ATACTAGCAG CTTTGATCCT 
CGAAATCCTT CCTCTATTAC CGTTCCAGAA CCGACCCTTT CTATTTGGGG ATTATTCGTT 
ATGTTAGGAG TTGGTTATCT GAAACGGGGA AAAAATCATC CTTTTCGTTA A

Protein sequence

MNKVINSLAV ACFSFAFSHQ AAIAIQLTTP TAETPPVLDE LVDPPGDADD PAIWLHPNDP 
SQSLVLGTLK NAGLGVYDLG GNLLQLIQPN SIRYNNVDLL YGFSLGGNSV DLAIASDRQN 
DILAIFKIDP MTRLLESIVS NNIGTIFTPV GQVSNGTTTA YGLATYTDLS TGKNYVFVSQ 
RETGNVAQLE LFDDGTGKVN YTQVRSLTLP IPPGGVLEDA QVEGMVADRE LGYVYVGQEN 
RGIWKFSASP NGSTLGQLID AVKPEGTHLE ADVEGLTIYY SDNGTGYLLA SSQGDNTFAI 
YDRLGNNNYL GSFSIVASGG IDSVEESDGA DVINVPLGSQ FPFGLFVTQD GSNDPPELFF 
DPDDQEFVNV SSNFKFVPWE TIANAFAPNP LLINTSSFDP RNPSSITVPE PTLSIWGLFV 
MLGVGYLKRG KNHPFR