Gene Htur_5149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5149
Symbol
ID	8745697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013747
Strand	+
Start bp	43684
End bp	44760
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	646515506
Product	glycerophosphoryl diester phosphodiesterase
Protein accession	YP_003406453
Protein GI	284176176
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.735215
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGATC CCAACGGCGA CGAGAGACGA ACCGGCCATC CAGACACCTC GGGGTCCGCG 
CTCCGGCGGC GGTCCGTTAT CGCCGCTGCG GGGGCGTCGG CGATCGGCAT GGTCGGCGCT 
GCGAGCGCCG ATCGCGGCCG CGGGACCGAG CGCGATCGAT CCGCCGGCTC CGACAATCGA 
CAGCGCAACC GATCGCGCGA ACGCGGGTTC GTCGATCGGA CCGACGAGCC GGATCTGATC 
GCCCACCGCG GATTCGCCGG ACTCTACCCC GAGAACACCG TCGGCGCCGT CGAGGCGTCG 
GCCCGCGGTA TCCGGTCGCC GTACGCGCCG TCCCGCGGGG CGAACATGAT CGAAATCGAC 
GTCGTTCCGA CCGCCGACGG CGACGTCGTC GTCTTCCACG ACGACCGTCT CGCCGAGCGC 
GACGGCGGCG AGCGCGGCCT CACCGACACC GAGGGCGTCG TCTGGGAGAC CGACACTGAG 
ACCGTCACGA GCGCCGAAGT GCTCGAGAGC GGCGAGACCG TTCCCCGACT GCGCGAGACT 
CTCGCGGCGA TTCCGTCCCA CGTCGGCGTC AACGTCGAGC TGAAGAACCC GGGCTCGTTC 
GACGTTCGAT TCGCCGAGTC GCTCTCGAGC GAGGAACTCG CGGGGCAGAA AGAGCTCTGG 
CAGCCGTTCG TCACCGACGT GCTCGCGGTC GTCGACGACT TCGACCACGA GTACCTCTTC 
TCGTCGTTCT ACGAGGCGGC GCTAGCGACG ACCCGCGAGG CGTCGGACTA CCCGGTCGCG 
CCGCTGCTCT GGGACTCCGT CGAAGCCGGC CTCGAGGTCG CCCGCCGCTA CGAGGCCGAG 
GCGATCCATC CGCCGTACGA TATGATCCGC GATACGCCGT TCTACGCCGA CCAGCACTAC 
GCGGAGGACG CCGGCTGGGA CGAGATCGAC CTCCTCGCGG TCGCCAACGA GGAAGGGCGG 
GACGTGAACG TCTTCACCCT CGAGACCTGG TACCAGGCCG ACCAGTTGGC GGCGGCCGGC 
GTTGACGGGC TGATCAGCGA CTACGCCGAC GTGCGCCGGT TCGGCGTGAC GAACTGA

Protein sequence

MSDPNGDERR TGHPDTSGSA LRRRSVIAAA GASAIGMVGA ASADRGRGTE RDRSAGSDNR 
QRNRSRERGF VDRTDEPDLI AHRGFAGLYP ENTVGAVEAS ARGIRSPYAP SRGANMIEID 
VVPTADGDVV VFHDDRLAER DGGERGLTDT EGVVWETDTE TVTSAEVLES GETVPRLRET 
LAAIPSHVGV NVELKNPGSF DVRFAESLSS EELAGQKELW QPFVTDVLAV VDDFDHEYLF 
SSFYEAALAT TREASDYPVA PLLWDSVEAG LEVARRYEAE AIHPPYDMIR DTPFYADQHY 
AEDAGWDEID LLAVANEEGR DVNVFTLETW YQADQLAAAG VDGLISDYAD VRRFGVTN