Gene Tery_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0231
Symbol
ID	4242385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	359583
End bp	361217
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	38%
IMG OID	638105575
Product	Ppx/GppA phosphatase
Protein accession	YP_720192
Protein GI	113474131
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.448988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTACAT CAGTTCCTTT AGTTAGATTT CCTGCTCCAC TAGCAGGCCA AAACCCGATA 
TTAGCAGCAA TAGATATTGG TACAAATTCG TTGCACTTGG TTGTAGTAAA AATTGATCCT 
AATTTGCCGA CTTTTACTAT TATTGACCAA GATAAAGAAA CAGTAAGACT AGGAGAGTGC 
GGCACGAAAG GTAACTTAAA ACCAGAAGTG ATGGATAGAG CGATCGCTAC TTTAGAGCGT 
TTCCAACAAA TTGCTAAAAG TGCTAATGCT AAACAAATCA TTACAGTTGC TACTAGTGCT 
GTAAGAGAAG CACCTAACGG TAAAGAATTT CTCAATAGAA TAGCTGATGA GTTAAACCTA 
TATGTTGACT TGATATCTGG TCAAGAAGAA GCACGACGAA TTTATCTAGG GGTACTTTCA 
GCAATGGAAT TTAATAACCA ACCCCATGTT ATTATTGATA TTGGTGGAGG TTCCACAGAG 
TTGATCTTAG GTGATAGTGA TACACTGAGA ACTCTAAGTA GTACAAAAGT AGGTGCAGTA 
CGTCTGACTA AAGAATTTGT TACCACAAAT CCCGTTAGTA AGAGTGAGTT TGCCTATCTG 
CAAGCTTACA TTAGAGGCTT ATTAGAACGC CCGACCAAAA ACATATTAGC TAATATCAAG 
AAAGGTGAAA AACCTCAGTT AGTCGGAACT GCTGGTACTA TTGAAGCTTT AGCGACTATT 
AATGCTTATG AAAAATTGGG TAATGTACCA GCTCCCCTGG GTGGTTATCA GTTTAGTTTG 
ACAGAATTAG AGGAGTTGGT TAATAAGTTG AGGAAGTTAC CTATTTCTAA AAGACGAGAA 
ATTCTGGGAA TGTCCGAAAA GCGAGCAGAA ATTATTTTGG CGGGTGCTTT AGTGTTACAC 
GAAGCAATGA GTTTATTAGA GATGGAGTCG GTGACTGTGT GTGAAAGCAG TTTGCGAGAG 
GGGGTAATAG TTGATTGGAT GTTGAATCAT GGTTTGATTG AGGATCACCT TCGTTTCCAA 
AGTTCAATTC GCCAACGAAA TACTCTAAAA ATTGCGCAAA AATACCAGGT TAATTTGGAG 
TATAGCGAAC GGGTTGCTTT TTGGGCGTTA TATTTATTTG ACCAAACTAT GGGAGTTCTG 
CATAACTGGG GAAGTGAGGA ACGAGAATTG TTATGGTCAG CAGCAATTTT GCATAATTGT 
GGTATATATG TAAATCATTC AGAACATCAT AAACATTCCT ACTATTTGAT CAGAAATGGG 
GAGTTATTGG GGTATACTCA AATTGAAATT GAAGTTATTG CTAATTTAGC TCGTTATCAC 
CGCAAGAGTT TATGCAAGAA AAAACACGAC CATTATCAAA TTTTACCCAA AAGATATCAA 
GAAATGGTGT CTCAGTTGAG TTCATTGTTA CGTTTAGCGG TAGCTTTAGA TAGGCGACAA 
AAAGGGGCGA TAGCTAATTT GACCTGTTGG TTAAACACAA AGCAACAGGA ATTTCATCTC 
TGGTTACGGC CTGCTAACCC TAAAGATGAT TGTGCTTTAG AATTGTGGAG TTTGGAAAAT 
AAGAAGGAGG CCTTTGAAAA AGAGTTTGGT TTAAAATTAA TAGTAAATTT AGAATCTGCC 
TCGTTAGTAA CTTGA

Protein sequence

MITSVPLVRF PAPLAGQNPI LAAIDIGTNS LHLVVVKIDP NLPTFTIIDQ DKETVRLGEC 
GTKGNLKPEV MDRAIATLER FQQIAKSANA KQIITVATSA VREAPNGKEF LNRIADELNL 
YVDLISGQEE ARRIYLGVLS AMEFNNQPHV IIDIGGGSTE LILGDSDTLR TLSSTKVGAV 
RLTKEFVTTN PVSKSEFAYL QAYIRGLLER PTKNILANIK KGEKPQLVGT AGTIEALATI 
NAYEKLGNVP APLGGYQFSL TELEELVNKL RKLPISKRRE ILGMSEKRAE IILAGALVLH 
EAMSLLEMES VTVCESSLRE GVIVDWMLNH GLIEDHLRFQ SSIRQRNTLK IAQKYQVNLE 
YSERVAFWAL YLFDQTMGVL HNWGSEEREL LWSAAILHNC GIYVNHSEHH KHSYYLIRNG 
ELLGYTQIEI EVIANLARYH RKSLCKKKHD HYQILPKRYQ EMVSQLSSLL RLAVALDRRQ 
KGAIANLTCW LNTKQQEFHL WLRPANPKDD CALELWSLEN KKEAFEKEFG LKLIVNLESA 
SLVT