Gene Htur_1507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1507
Symbol
ID	8742098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	1565563
End bp	1566900
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	68%
IMG OID	646512083
Product	PBS lyase HEAT domain protein repeat-containing protein
Protein accession	YP_003403066
Protein GI	284164787
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATG ACGAGGCAGC CGAGGACGGA GCGGACGACG ATCAGCGAGA GCCGGTCGAC 
CTCGAGGCCA TCCGCGAGGC CCTCGCGGCC TTCGAGGACG ACGTCGAAGC CCTCGAGAGC 
GACCTCGAGG CCGCCGAAAC CGAGGATGAC CTCGACGTCG TCGAGGCCGA CATCGAGTCG 
TTCCGCGAGG AGTTCGAGGA GATCGAGATC CCCGACCCGC CGGAGACCGA GGACGAAGAC 
GACGAGGACG AGGAAGACGA AATAACGCCC GAGGAGGAAC TCCAGGAGCG CTACGACGAG 
ATCGAAAGCG ACGTCTCGGA CCTCGAGTCC GATCTGGAAG ACCAGCGCGG TCCCTACGGC 
GAGGACGTCG TCAGCGAGAT CAACAGCGCC AGCGGGACGA TCACGGGCAC CCGCTGGACC 
GAAGAGGGTA ACGCCGAACT GATCGAAGCC GTCGACGACT TCCTCGACGA CCTGAACGAA 
CTGCTCGGCA CCTCGGTCAC GCTGAGCAAC GAGGGCGAGG CGGTCCCCGA CCAGCTTGAT 
GCGACTCTCG ACCGCGCGGC CGAGGCCGTC GAGGACGCCG AACTCGACGC CGACGACGAC 
GCCGAGACGA TCGCCGGCCT GCTCGAGGCC ACGGACGACC TCGAGTCCGA TATCGACGAT 
GCGACCGAGT GGACCGACCT CGAGATCCGC GAGCAACTGC GCCGCGAGGG GTTCTACGAC 
GTGCTCGACC ACGTCAAGGA CTTCCCGCCG GAGTGGCACG CGCTGAAGGT CCACGAGAAA 
CGCGGTAACG TCGATCAGAT CCTGCTGGCC TACGAGACCT TCGACTCCGA CTACATGGAG 
GAGCACTGCC TCGAGGCATT GGAACGCATG GGCCCCGAGG AGGCCATGGA ACCCATGATC 
CAGAAGGCGG GTCGCCGCGA CCAGGCTGCG ATGCGCATCC TGGGCAAGAT CGGCATCGCC 
GACGACGAGG TCGTCGAGGC GCTGATCGAT TACGTCGACT CGAACCCCAA CCTCCAGCGG 
CCCGCGTTCC GCGCGCTCGG CGAGGTCGGC GCCGAGGACG CCGTCGAGCC GCTCGCCCAG 
CAGCTGGTCG CCGACGAACC GGACGTCCGC AGCTGGGCCG CCCGCGCGCT CGGCCTGATC 
GGCGACACCC GCGCCATCGA GCCGCTCGCG GATGTGCTGG CCGACGACGA GGAGGACCGC 
GTCCGCGCCA GTGCCGCCTG GGCACTCAAC CAGATCGGCA CCGCCGAGGC CCTCGAGATC 
GTCGCCGACT ACGGCGACGA CCGCGCGTAT CTCGTCCAGG CCGAGGCCGA GAAGGCCGCA 
ACCGAGCCCG CGGCCTGA

Protein sequence

MSDDEAAEDG ADDDQREPVD LEAIREALAA FEDDVEALES DLEAAETEDD LDVVEADIES 
FREEFEEIEI PDPPETEDED DEDEEDEITP EEELQERYDE IESDVSDLES DLEDQRGPYG 
EDVVSEINSA SGTITGTRWT EEGNAELIEA VDDFLDDLNE LLGTSVTLSN EGEAVPDQLD 
ATLDRAAEAV EDAELDADDD AETIAGLLEA TDDLESDIDD ATEWTDLEIR EQLRREGFYD 
VLDHVKDFPP EWHALKVHEK RGNVDQILLA YETFDSDYME EHCLEALERM GPEEAMEPMI 
QKAGRRDQAA MRILGKIGIA DDEVVEALID YVDSNPNLQR PAFRALGEVG AEDAVEPLAQ 
QLVADEPDVR SWAARALGLI GDTRAIEPLA DVLADDEEDR VRASAAWALN QIGTAEALEI 
VADYGDDRAY LVQAEAEKAA TEPAA