Gene Hlac_0813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0813
Symbol
ID	7400778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	811472
End bp	812515
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	64%
IMG OID	643707878
Product	diphthamide biosynthesis protein
Protein accession	YP_002565482
Protein GI	222479245
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1736] Diphthamide synthase subunit DPH2
TIGRFAM ID	[TIGR00322] diphthamide biosynthesis protein 2-related domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.528127
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACT CCACGGAGGG CGACCTCACG AAGACGGGGA TGGCCCTGAA ACACGACCGC 
GAGTGGGACT ACGAACTCGA TCGGATCGTC GAGGCTATCG AGGAGCGCGA CGCGTCGAAG 
GTCGGCCTCC AGTTCCCCGA GGGACTCAAG CGCCGTGGCC CGAAGGTCGC CGACGATCTC 
CGCGAGGTCG CGCCCGACGA CGTGACCTTC ATGCTGTCCG GCCAACCCTG CTACGGCGCC 
TGCGACCTCG ACACGTACCT GATGCGCCGG ACCGACGTGT TCGTCCACTT TGGTCACACG 
CCGATGAAGG AGTCCGACAG CATCGTCTAC GTTCCCCTGT TCTCGAACGT CGACCCGTTC 
CCGATCATGG AGGACGCGCT GGAGGAAGAA CTCGCATCTC CAGAAGAGGA CGCCGACGTG 
GGGCTCGTCA CGACGGCTCA GCACATGAAC CGGTTCGAGG AGATGACCGA CTGGTTAGAG 
GAGCGCGGCT ACGAGGTCCA CACCCGCCGG GGCGACGACC GTCTCACGAA GGAGGGACAG 
GTGCTCGGCT GCAACTACGC CTCCGCGGAC ATCGACGCCG AGCAGGTGCT GTACGTCGGC 
GGCGGGAAGT TCCACCCGGT CGGCCTCGCG ATGGAGCACC CCGACAAGCG CGTCGTCATC 
GCCGACCCCG TCAACAACGC GGTCTCGGTC GCCGAACACG ACCAGTTCCT CAAGCAGCGC 
TACGCCTCGG TTCACAAGGC GATGAGCGCC GAGAAGTGGG GCGTCATCTT CTGTACGAAG 
ATCGGTCAAG GCCGCTGGGA GAAGGCCCAA GAGATCGTCG AGAACAACGA GAACGCCTAC 
CTGATCACGA TGGACGAGGT GACGCCGGAC CGCCTCCGAA ACTTCGACAT GGACGCGTTC 
GTCAACACCG GCTGTCCCCG GATCACGACT GACGACGGCC CCCGGTTCCA CAAGCCGATG 
TTGACCCCCG GCGAGTACGA GGCCGCGATC GGCGAGAAGC CGCTCGACTC GATCGAGTTC 
GACACGTTCC ACGACACCTG GTAA

Protein sequence

MSDSTEGDLT KTGMALKHDR EWDYELDRIV EAIEERDASK VGLQFPEGLK RRGPKVADDL 
REVAPDDVTF MLSGQPCYGA CDLDTYLMRR TDVFVHFGHT PMKESDSIVY VPLFSNVDPF 
PIMEDALEEE LASPEEDADV GLVTTAQHMN RFEEMTDWLE ERGYEVHTRR GDDRLTKEGQ 
VLGCNYASAD IDAEQVLYVG GGKFHPVGLA MEHPDKRVVI ADPVNNAVSV AEHDQFLKQR 
YASVHKAMSA EKWGVIFCTK IGQGRWEKAQ EIVENNENAY LITMDEVTPD RLRNFDMDAF 
VNTGCPRITT DDGPRFHKPM LTPGEYEAAI GEKPLDSIEF DTFHDTW