Gene Haur_4617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4617
Symbol
ID	5736464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5902810
End bp	5904318
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	50%
IMG OID	641281781
Product	Ppx/GppA phosphatase
Protein accession	YP_001547376
Protein GI	159901129
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAAC ACGTTGGAAT TATTGACCTT GGCTCCAACA CCGCCCGCAT GATCGTGGTG 
CAATACCAGC CCTATTACTC CTTCAAACTG GTCGAAGAAG TTAAAGAAAA TGTGCGCTTG 
GCACATAATG TTGGCGCTGA TAATCAATTG CAAGCTGAGC CGATGGCCAT GGCAATTGAA 
ACCTTGCGCA TGTTTAGCAA TTTTTGCCGT GCCTTGGGGG TTAATGAAGT TGTGGCTGTG 
GCCACCAGCG CCGTGCGCGA TGCCGCCAAT CAAGCCAGCT TTTTGGCCCA AGTTAAAGAA 
GAAACTGGCC TCGATTTACG CGTACTCAGC GGCGATGAAG AAGCCTACTA CAGCTACCTC 
GGGGTGATTA ATACCCTTGG GGTCAGCAAT GGTTTTATGT TTGATATTGG CGGTGGCAGC 
GTCGAATTGG CCTTAGTTCG AGGCCGGGGC TTGGCGCATA CCACTTCATT ACCACTTGGT 
ACAGTGCGGC TCACCGAGCA AATTTTGCGC AGCGAAACCC CCAGCAAAGC CGAACTCAAA 
GCCCTCGATC GCCATTTAGA TGAGGCGTTA GCCGAACTAG ACTGGTTTCG ACCACAAGGT 
AGCAAATTGC CGTTAATTGG GGTTGGCGGC ACGGTGCGCA ACCTTGCCAA ACTCGAACAA 
CGTGCCCAGC GCTATCCACT CGATATTGTG CATGGCTATA CGATGTCGTT GCAACGGGTC 
GATGAATGGG CTACCCGTTT GAGCAAACTC AATCGTAATG AGCGCGAGCA GCTTGATGGC 
CTCAACAATG ATCGCGCCGA TGTTATTACC GCTGGTGTAC TGTTGATTCG AGCGTTGATG 
CAACGTTGTG GTGCTGATAG TTTGTGGATT TGTGGTCATG GTCTGCGTGA TGGTATCTTC 
TACGAGCAAT TTCTGCGTGG CTCACAACCG CCCTTGCTCG GCGATGTCCG CCAGTTTTCG 
GTCGAGAATT TGGCACGAAT CTATGGCTAC AATGTGGTAC ATGTTGCCAA AGTGCGCGAA 
TTAAGCCTCG CCTTGTTTGA TCAACTGCAA AGTTTGCATG GCTATGGAGC GTGGGAACGC 
GAATTACTCG AAGCTGCGAC GGTAGTCCAT GACATTGGGG TAGCAGTCAA TTTCTACGAT 
CATCATAAAC ATGGCTTATA TTTAATTCTC AACTCAATGC TGAATGGCTA TACCCACCGC 
GAAATGGCCA TGGTAGCCTT GCTCACTCGC CATCATCGTA AGGGCGGCGT GACTGATGCA 
GGCTTGGGTG GGGTTTTGGC TGAGGGTGAT CTTGAGCGGG TGGGCAAATT AAGTGCCTTG 
CTCAGAATAG CTGAATATCT AGAGCGCTCC AAGAGCCAAG TTGTGCAAAG TATCGTGTGC 
AAAATTGAGA AAAATCAGGT GCGGGTGAAG GTGCAGGCGG TTGGCGACGC TTCGATTGAA 
ATTTGGGATG CGAATCGCAA AACCAATCTA TTTCGCAAAG TCTATGGAGT TGAAATGTTG 
ATTGAATAG

Protein sequence

MTQHVGIIDL GSNTARMIVV QYQPYYSFKL VEEVKENVRL AHNVGADNQL QAEPMAMAIE 
TLRMFSNFCR ALGVNEVVAV ATSAVRDAAN QASFLAQVKE ETGLDLRVLS GDEEAYYSYL 
GVINTLGVSN GFMFDIGGGS VELALVRGRG LAHTTSLPLG TVRLTEQILR SETPSKAELK 
ALDRHLDEAL AELDWFRPQG SKLPLIGVGG TVRNLAKLEQ RAQRYPLDIV HGYTMSLQRV 
DEWATRLSKL NRNEREQLDG LNNDRADVIT AGVLLIRALM QRCGADSLWI CGHGLRDGIF 
YEQFLRGSQP PLLGDVRQFS VENLARIYGY NVVHVAKVRE LSLALFDQLQ SLHGYGAWER 
ELLEAATVVH DIGVAVNFYD HHKHGLYLIL NSMLNGYTHR EMAMVALLTR HHRKGGVTDA 
GLGGVLAEGD LERVGKLSAL LRIAEYLERS KSQVVQSIVC KIEKNQVRVK VQAVGDASIE 
IWDANRKTNL FRKVYGVEML IE