Gene Htur_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1803
Symbol
ID	8742397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	1873745
End bp	1874794
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	646512381
Product	diphthamide biosynthesis protein
Protein accession	YP_003403361
Protein GI	284165082
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1736] Diphthamide synthase subunit DPH2
TIGRFAM ID	[TIGR00322] diphthamide biosynthesis protein 2-related domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGG AGTCGGAGTA CACCGAGGGG GACCTCCGGA ACACCGGAAT GCAGCTCAAA 
CACGACCGCG AGTGGGACTA CGAACTCGAG CAGATCGTCG AAGCCATCGA GGAGCGAGAC 
GCGAAGAAGG TCGGCCTGCA GTTCCCGGAG GGACTGAAAC GGCGCGGCCC GGCCGTCGCC 
GACGACCTCC GCGAACTGTC CGACGACGAC GTGACGTTCA TGCTCTCGGG TCAGCCCTGT 
TACGGCGCCT GTGATCTCGA CACCTATCTG ATGAAGCGCA CCGACGTGTT CGTCCACTTC 
GGCCACTCGC CGATGAAGAA CACGGACAAG GTGATCTACG TGCCGCTGTT CTCGAACGTC 
GAGGTCACGC CGATCATGGA GGAGGCCCTC GACACCTTAG AGCCGCCCGA AGAGACCGAG 
GACGTCGGCC TCGTGACGAC CGCCCAGCAC ATGAACCGCT ACGAGGAGAT GAGCGAGTTC 
CTCGAGGAGC GAGGCTACGA CGTTCACAGC CGTCGCGGCG ACGAGCGGCT GACCCACGAG 
GGGCAGGTGC TCGGCTGCAA CTACGCGAGT GCGGACGTGC CCGCCGATCA GGTCCTCTAC 
GTCGGCGGCG GCAAGTTCCA TCCCCTCGGA CTGGCGATGG AATATCCCGA CAAACACGTC 
GTCATCGCCG ACCCCGTCAA CAACGTCGTC ACCGTCGCCG ACACGGAGAA GTTCATGAAA 
CAGCGGTACG GCGCGGTCCA CCGCGCGATG GACGCCGAGA AGTGGGGCGT CATCTTCTGT 
ACCAAGATCG GGCAGGGTCG CTGGGAGCAG GCGCAGGAGA TCCTCGCGGA CAACGACGAC 
GCCTACCTCA TCACGATGGA CGAGGTGACG CCGGACCGCC TGCGCAACTT CGACATGGAC 
GCGTTCGTCA ACACCGGCTG TCCGCGGATC ACGACCGACG ACGGCCCGCA GTTCCACAAG 
CCGATGCTCA CGCCCGGCGA GTACGAGATC GCCGTCGGCA ACAAGTCCCT CGAGGACCTC 
TCCTTCGACA CGTTCCACGG AACCTGGTAG

Protein sequence

MSQESEYTEG DLRNTGMQLK HDREWDYELE QIVEAIEERD AKKVGLQFPE GLKRRGPAVA 
DDLRELSDDD VTFMLSGQPC YGACDLDTYL MKRTDVFVHF GHSPMKNTDK VIYVPLFSNV 
EVTPIMEEAL DTLEPPEETE DVGLVTTAQH MNRYEEMSEF LEERGYDVHS RRGDERLTHE 
GQVLGCNYAS ADVPADQVLY VGGGKFHPLG LAMEYPDKHV VIADPVNNVV TVADTEKFMK 
QRYGAVHRAM DAEKWGVIFC TKIGQGRWEQ AQEILADNDD AYLITMDEVT PDRLRNFDMD 
AFVNTGCPRI TTDDGPQFHK PMLTPGEYEI AVGNKSLEDL SFDTFHGTW