Gene Haur_1163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1163
Symbol
ID	5733056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1335187
End bp	1337277
Gene Length	2091 bp
Protein Length	696 aa
Translation table	11
GC content	51%
IMG OID	641278303
Product	metallophosphoesterase
Protein accession	YP_001543939
Protein GI	159897692
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGTTTG GAACAATCGC TGAATATTTG GTTGCGTTGG GCATGCCAAG CTCGGCTCGC 
ACCTATTTAA TCATCACCAC AATCTTAGTG CTTAGTTTAA TTTGGATCGA AACCTCACAC 
TGGGCACATC GCACCATGAC AATGATGGAA TTGGCTGGGG CGGCCTTGCT GCTGATTAAG 
ATTTTTGCGG TCAGCACAAC CATGCTCACC CTCGCGCTGC TGCCGTTTCC TCAACTACGC 
ACGGTAATTG CCAGCTCATT AGCAATTATG GGCTTGCTGA CGCTCTATCG CGAGCTACGA 
CGACGCTTAC GCGCAGGCGA TCGTTCACCC TCAAGCTATA CTGGCGGCGT GCTAGTCGTC 
ATCCAATTTT TATGTATGGT CTTGCTGACC GTCAGCGGAA TTGCCATCAT ATTAGAATTA 
TTGCTGGTTC CAGCGCGAAT TCTCGATAGC GACACTCGTT TTATCGATGC GATTAAAAAT 
TGGGTTGAAT TGCTAGCAAC CCTGTGTGTG CTGCTCACCA TGTACTATTT GGGATTCTAC 
CTTGCGCGAC GTTTGCTCAA AAGTGGCAGC TTCTCGTGGA TCGATCCGCC GAACTGGCGC 
ACATTGTTGC CTCATTTGAA ATATAGCTTG ATGCCACGTT GGGGGATTCC ACCATTGGCC 
GAAAGCGATT TGGCTGATAC GGTGCGTATG GCCTATATCG AGCATATTGT GGGTAGCAAA 
GCGCCGCGTG ATGTGGCCAA AGCTGCCAAA ATTGAGCCAG TCGCCCACCC GCAACGCGGC 
TTTACCTTCG CGGTGATTGG CGATCCTGGT GAGGGCGACG AATCGCAGAT TGCCCCGCCA 
ATTGTGCCCG AGCAGAGCGC GTTGGCTCAA CAAGGCCCAG CCAATCCAGC GTATCCCACT 
TTTACCATCC TTAGCTCGGA TATTGTCTAT CCAGCTGGTG AGTTGATGGA TTATGAACGC 
ACGCTGTATC GGCCTTATGC GAGCGATAGT TCAACCTCGC CATTAATCTA TGGTTTGGCG 
GGGAATCACG ATTGGTACAA CGATTTAAAG GGCTTGATGC TGAATTTTGG TTATGCCGCC 
GCCCATGTCG AAAGCCGCGA TCCGCAGTTG CAACAATGGG CCAAAGCGCT CAAAACTGGG 
CCTTGGGCAC GCTATGGCTA TCCATGGGGG CAATTGCGCT GGAACGAAGT GCAAAGTTTG 
CGCCAACGTT ATGGCCTGAC GCGGCTTGGC GGTGACCTGA ATGAGCCGCG TACTCACCAA 
CGCTTACCAT TTTTTGAATT GAGCTTTGAT CCAGTGCCAT TTGTGTTGTT GGCCGTCGAT 
ACTGGCTGCA TCGGCAGCGT CGATCCCATT CAGCTGCAAT GGCTGGAAAC CTGTTTACTA 
ACAGCCTTCA ATCAACAAAA AATTATTGCG GTGGTGCTCA GCGAGCCGTT ATATGTTAAT 
GGAGCCTTTG CCGATCACCC TGGCATGCGC CAATTGTATG AATTGTTGCG GCGCTATGAA 
ACCCATGTGG TGATTGGCGG CGATACCCAT GCCTTTCAAC ATTACGAAGC CCGCTATATC 
ACGTTGCGCG GAACCCAACA TATTGCGCAT CATCTGGTCA ATGGCGGTGG TGGCGCGTAT 
CTGAGCAAGC CAGTTGATTT ACATTGGCAC ACGCCCAGCG GCATGACTCC TTTGGAATCG 
CGCTTTGTCT ACCGTGACGA TGAACAGGAT ATCGTTGATC AGGTGATGTT GCGCGAAGTA 
TTTCCGACAG CGCAACAGCT GCGGGCAAAA TTCAACGGCA AAATCGAGCT TGATGACCAA 
ATGTGGGGCT TGCGGCGCTG GCTTGTCGGC CAAGAGCCAA CTATTTTAAA TCGCGGCTAC 
ACCAATGCGC TTAACCATGA TCGTTCGCCA TTATTGCAAA GCCTTGTTAC CTTTAACATG 
GATGAAACCT TGAATGGTTG GCGCTTGCGC ATCACCCCTT GGTTTACAAC TGGCCCCGAC 
AATCAGCTCG AACCACAAGA ACCAATTGAT ATTTTGGCCC CTAATCGAGC AAACGAGCGC 
GTGGTTACCC GTGATTTAGT GCCTAGCCCC GCCAGCATTT TAGCCATCTA G

Protein sequence

MLFGTIAEYL VALGMPSSAR TYLIITTILV LSLIWIETSH WAHRTMTMME LAGAALLLIK 
IFAVSTTMLT LALLPFPQLR TVIASSLAIM GLLTLYRELR RRLRAGDRSP SSYTGGVLVV 
IQFLCMVLLT VSGIAIILEL LLVPARILDS DTRFIDAIKN WVELLATLCV LLTMYYLGFY 
LARRLLKSGS FSWIDPPNWR TLLPHLKYSL MPRWGIPPLA ESDLADTVRM AYIEHIVGSK 
APRDVAKAAK IEPVAHPQRG FTFAVIGDPG EGDESQIAPP IVPEQSALAQ QGPANPAYPT 
FTILSSDIVY PAGELMDYER TLYRPYASDS STSPLIYGLA GNHDWYNDLK GLMLNFGYAA 
AHVESRDPQL QQWAKALKTG PWARYGYPWG QLRWNEVQSL RQRYGLTRLG GDLNEPRTHQ 
RLPFFELSFD PVPFVLLAVD TGCIGSVDPI QLQWLETCLL TAFNQQKIIA VVLSEPLYVN 
GAFADHPGMR QLYELLRRYE THVVIGGDTH AFQHYEARYI TLRGTQHIAH HLVNGGGGAY 
LSKPVDLHWH TPSGMTPLES RFVYRDDEQD IVDQVMLREV FPTAQQLRAK FNGKIELDDQ 
MWGLRRWLVG QEPTILNRGY TNALNHDRSP LLQSLVTFNM DETLNGWRLR ITPWFTTGPD 
NQLEPQEPID ILAPNRANER VVTRDLVPSP ASILAI