Gene Haur_1025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1025
Symbol
ID	5732929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1169697
End bp	1170845
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	50%
IMG OID	641278160
Product	metallophosphoesterase
Protein accession	YP_001543801
Protein GI	159897554
COG category	[R] General function prediction only
COG ID	[COG1408] Predicted phosphohydrolases
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTGCGTA AGCTTGGGTT TTGGGGTTTG AACATCGGCA TTTGGCTGGC TGGGATGGGC 
TTGCTGGGCG GCCTGTTTGG CTGGAATTTG GCGTGGCTCA AAGATTGGCA GTGGCTGGCT 
GAGCAAACAG GTTGGCGTTT TTGGCTGGCT CAATGGATAT TTCGAGCATT GGTCTGCTTG 
CCCTTAGTAT TTGGCTTGCT GTTATTGCTG CATCCCTTGT GGCTTGGCCG TCGTTTACTC 
GCTGCAACTA AAGCTAATTT AATGGTTGAA CCCTCTCCCA ATGCAGAAAC GTTAAGTCGG 
CGGCGTTTTA TGCTTGAAGC TGGCTTATTG GGTGGTTTGG TTGGTTATAG CAGTGTGATC 
GAGCCATTTA ACCCAGAAAT TGTTGAGCTT GAGTTACCGA TTGCCAATTT GCCAAGCCGT 
TTCGAGGGCT TTAAAATTGT CCAATTAAGC GATTTGCATG TTTGTGCTTA TACTCCCGCT 
GCTGATGTAG CCCGCGCTGT GGCCCTGATT AATCAACTTG ATGCTGATAT TGTAGCAATT 
ACTGGTGATT TTGTTGATCA GCATGCAAAA TTTGCTGATG ATGCAACTGT GCCCTTGCGT 
CAATTACAAG CTCGCGAAGG CATTTTTTCG GTGCTCGGCA ACCACGATTA CTACACTGGC 
GATATTGATC GCATGATTTG GGCGATTAAA CGGGCAGATC TTGGACTGTT GATCAATCAG 
CAAACGGTTA TTCGGCGTGG CGCTGATCGT TTGAATTTGG TGGGCTTAGA TGACCCAAAA 
CATGATGATG GTGATGGCTG GAGCCATAGC AGCATTGATC TGACCCGCGC ATTTGCTAAG 
CTATCGGCTG GTGATCCCTG CATCACGTTG TTGCATAACC CAATTTTTGC ACCAAGTGTG 
GTAAAGTCGT ATGGGCCACA GGTGATTCTG GCCGGGCATA CCCATGGCGG CCAGATCTGG 
GTTCCGATCT TGACCGAAAG CGCCGTGCGT TCGCGCGATC GTTTTGTGGC TGGGCGCTAT 
CAACTTGCCA ACAGCCAGAT CTATGTTAAT CGTGGTTGGG GATTTACTGG GCCGCCGCTG 
CGGTTTGGCA AGCGCCCCGA AATTAGCGTG ATTCGGTTGA CTGGACAGAA GATCGGGAAT 
AGTTTTTAA

Protein sequence

MVRKLGFWGL NIGIWLAGMG LLGGLFGWNL AWLKDWQWLA EQTGWRFWLA QWIFRALVCL 
PLVFGLLLLL HPLWLGRRLL AATKANLMVE PSPNAETLSR RRFMLEAGLL GGLVGYSSVI 
EPFNPEIVEL ELPIANLPSR FEGFKIVQLS DLHVCAYTPA ADVARAVALI NQLDADIVAI 
TGDFVDQHAK FADDATVPLR QLQAREGIFS VLGNHDYYTG DIDRMIWAIK RADLGLLINQ 
QTVIRRGADR LNLVGLDDPK HDDGDGWSHS SIDLTRAFAK LSAGDPCITL LHNPIFAPSV 
VKSYGPQVIL AGHTHGGQIW VPILTESAVR SRDRFVAGRY QLANSQIYVN RGWGFTGPPL 
RFGKRPEISV IRLTGQKIGN SF