Gene Paes_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_0101
Symbol
ID	6458577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	98669
End bp	99727
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	56%
IMG OID	642724088
Product	phytase
Protein accession	YP_002014808
Protein GI	194332948
COG category	[I] Lipid transport and metabolism
COG ID	[COG4247] 3-phytase (myo-inositol-hexaphosphate 3-phosphohydrolase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACC ACACGCTGAA ATACACGCTG GCAACACTCA TCGCGGCGCT CTCGCTCCCC 
GGGTGCAACA CCGGGACCTC CCCCCACGAA GCCCGACCGC TGATCGTTAC CGAACAGGTC 
CCGAACGACA GTGACGATCC TGCCATCTGG ATCAATCGCG AAGATCCGTC GAAAAGCCTT 
GTCCTCGGTA CCGACAAAGA TGCAAACGGA GGCGTCTATG TGTTCGACCT CAAAGGCCGG 
ATCCTGAAAG AAAAAACGGT AACAGGCCTT GCCCGCCCGA ACAACATCGA TATAGGTTAC 
GGCCTGATGC TTGGGGGAAA ACCGGTCGAT ATCGCCGTTG TCACCGAACG GCTGACATCA 
AAACTCCGGG TGTTCGCCCT TCCCGGCATG GAACCGATCG ACAATGGCGG CCTGCCGGTC 
TTTGAAAACC AGAAGCTTGC CGCCCCGATG GGCATCGCAC TCTATAAACG ACCATCCGAC 
AATGCCATGT TTGCCGTCGT CAGCAGAAAA CAGGGGCCTC AGGACGGAAC CTATCTCTGG 
CAGTACCTTC TGGAGGATGA CGGCAGCGGC CAAGTCATAG CGACGAAGGT GCGCGAATTC 
GGAGCATGGA GCGGAAAAAA GGAGATCGAA GCCGTAGCCG TCGACAACGA GGCAGGAAGA 
ATCTATTACT CGGATGAGGG TTTCGGCATC AGATCGTACC GCGCCGATCC TGAACATCCG 
GACGCCGGCG CTGAACTGGC TCTTTTCGCA ACTGAAGGGA TCACACGGGA CCACGAAGGA 
ATCGCCATTG TCTCTGACAG CAACAACGGG GGTTGGATCA TCGTCTCGGA CCAGTCCGCA 
GGAGAGCTCC ACCTCTACTC AAGAAACGGA GGCACTCCTG ATACAATGGA GCACCATACC 
CTGAAGCGTG TCGTGAAAAC CGCAGCCATT GAGACCGACG GCATTGAAGC CGCACCGAAA 
CTCAACGGAA CGGGCTTCCC GAAAGGTCTT TTCGTTGCCA TGTCTGACGA CAGGACATTC 
CAGTACTATT CGCTGGAGGA TATCATCGGA ACACAGTAA

Protein sequence

MKNHTLKYTL ATLIAALSLP GCNTGTSPHE ARPLIVTEQV PNDSDDPAIW INREDPSKSL 
VLGTDKDANG GVYVFDLKGR ILKEKTVTGL ARPNNIDIGY GLMLGGKPVD IAVVTERLTS 
KLRVFALPGM EPIDNGGLPV FENQKLAAPM GIALYKRPSD NAMFAVVSRK QGPQDGTYLW 
QYLLEDDGSG QVIATKVREF GAWSGKKEIE AVAVDNEAGR IYYSDEGFGI RSYRADPEHP 
DAGAELALFA TEGITRDHEG IAIVSDSNNG GWIIVSDQSA GELHLYSRNG GTPDTMEHHT 
LKRVVKTAAI ETDGIEAAPK LNGTGFPKGL FVAMSDDRTF QYYSLEDIIG TQ