Gene Hhal_0215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0215
Symbol
ID	4710080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	248668
End bp	250197
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	73%
IMG OID	639854674
Product	Ppx/GppA phosphatase
Protein accession	YP_001001811
Protein GI	121997024
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGACG AGCAGGTGAT CGCAGCGGTC GATCTGGGCT CGAACAGTTT CCATATGGTG 
GTGGCGCGCA TCGATCCGGC CACCCGCACG CTGCGGGTGG TGGATCGGTT GCGCGAGACG 
GTCCGGCTCG GCGCCGGCCT GGGCGAGGGG CAGAAACGGC TGAGCGAGGA CGCCCGGGAG 
CGGGCGCTGG CTTGCCTGGC CCGCTTCGGG GATCGGTTGC GCCGCCTGCA GGCGCAGCGG 
GTTCGTGCCG TGGGGACGAA CACCCTGCGC AGGGCGCGGG ATGCCACGGA CTTCATGCAG 
GAGGCCGAGG GCGCCCTGGG GCACCCGATC GAGGTGGTTT CGGGCTATGA GGAGGCTCGG 
CTGATCTACC TCGGTGTGGC CCACAATCTG GGGTTCGACG AGCGCCGGCG GGTGGTGATC 
GATATCGGTG GGGGTAGTAC CGAGCTGATC CTCGGCCGCG GCCCGCGGGC CGAGCAGATG 
GAGAGCGTCC ATCTGGGGTG CGTCTCGCTC ACCGGACGCT GCTTCGCCGA CGGCCGCATC 
ACCGGGCGGC AGTTCCAGAA GGCCCTGGTC CTCGCCCGGC TGGAGCTGGA GCCGGTGGAG 
GGCGCCTTTC GCTCGCCGGC GTGGCAGGGG GCTGTGGGCG CCTCCGGGAC GGTGCGCGCC 
GCCGCCGACG CCTGCGCCAG CCGGGACTGG TCACCGCCCG GGTGGATCAC CGCCGAGGCG 
CTGGGCCGCC TGCGCCGGCT GGCGGTGGAG GCCGGCGACG CCGAGACCCT GGGCGAGTGG 
CTGGGGCTTT CCGGCGACCG GCGCCAGGTC TTCCCGGCGG GGCTGGCGGC CCTCTGTGCG 
GTCTTCGAGG CGCTGGGCAT CGAGCGTATG GAGGTGGCCG ACGGCGCCCT GCGCGAGGGG 
GTGATGTACG ACCTGGCGGG CCGCCTGGGG ATGCTCCAGC ACAGCGAGGA CGCCCGGGCC 
AATACGGTCT CGGCGCTGCG CCGGCGCTAT TCGGTGGAGG CCGGCCAGGC CGACCGGGTG 
GCGGCGACGG CGGCGGGGCT GCTCGATCAG GTGGCGCCGG GGTGGGGGCT GGCAGGACGC 
TTTTACCGCG ACATCCTCGA CTGGGCGGCC CAGCTCCACG AGATCGGTCT GGATATCTCC 
CACGCCCAGT ACCACAAGCA CGGTGCCTAC ATCCTGCGTA ACGCGGACAT GGCCGGCTTC 
TCCCGTCAGG AGCAGCAGCT GCTGGCCCTG CTGGTGCGGG TGCACCGCCG TAAGCTGGCC 
CGCGGGCAGT TGAAGGCGCT GCCCCGGCGC TGGCTGGACA CCGGCAAGCG GCTGGCCGTG 
GTGCTGCGCC TGGCGGTTCT GCTCCACCGT GGGCGGGCCG ACGGTCGGGT GGTGGAGCCG 
CGCCTGGAAC CGCTGACCGA CGGGCTGCGG CTGTGGTTCC CGTCCGGGTG GCTGGCGGAC 
AACCCCCTGC TCCAGGCCGA TCTGCTCCAG GAGCAGCGCT ACCTGGAGCG TGCCGGGATG 
ACCCTGGAAC TGGCCGAGGC CCCCGAGTAA

Protein sequence

MRDEQVIAAV DLGSNSFHMV VARIDPATRT LRVVDRLRET VRLGAGLGEG QKRLSEDARE 
RALACLARFG DRLRRLQAQR VRAVGTNTLR RARDATDFMQ EAEGALGHPI EVVSGYEEAR 
LIYLGVAHNL GFDERRRVVI DIGGGSTELI LGRGPRAEQM ESVHLGCVSL TGRCFADGRI 
TGRQFQKALV LARLELEPVE GAFRSPAWQG AVGASGTVRA AADACASRDW SPPGWITAEA 
LGRLRRLAVE AGDAETLGEW LGLSGDRRQV FPAGLAALCA VFEALGIERM EVADGALREG 
VMYDLAGRLG MLQHSEDARA NTVSALRRRY SVEAGQADRV AATAAGLLDQ VAPGWGLAGR 
FYRDILDWAA QLHEIGLDIS HAQYHKHGAY ILRNADMAGF SRQEQQLLAL LVRVHRRKLA 
RGQLKALPRR WLDTGKRLAV VLRLAVLLHR GRADGRVVEP RLEPLTDGLR LWFPSGWLAD 
NPLLQADLLQ EQRYLERAGM TLELAEAPE