Gene Hlac_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1997
Symbol
ID	7402016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1991696
End bp	1992733
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	643709068
Product	putative deoxyhypusine synthase
Protein accession	YP_002566645
Protein GI	222480408
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1899] Deoxyhypusine synthase
TIGRFAM ID	[TIGR00321] deoxyhypusine synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.428923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.191458
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA GCGACGACGG GGGCGACCCG CCGCACGAGG AGTTCCACGA GGACCCGGTC 
GGACACACCC GCGCGACGGC CGGGATGACC GTCGGGGAGC TGGTCGAGGG GTACGGCGAC 
GCGGGGATCG GCGCAGCGTC GGTCAACGAG GCGGGCGACG TGCTCGCAGA GATGTTCGCG 
AACGACGACT GCACCGTGTT CCTCTCGCTG GCGGGCGCGA TGGTGCCCGC GGGGATGCGC 
CGGATCGTCT CCGATCTCAT CCGAGACGGC TACGTCGACG CGCTGGTGAC GACGGGCGCG 
AACCTCACCC ACGACGCCAT CGAGGCCATC GGCGGGAAAC ACCACCACGG TCGGACCCAC 
GACCCCGAGA AGAGTCTCCG CGAGCACGAC GAGGGGCTCC GCGACGAGGG CGTCGACCGC 
ATCTACAACG TCTACCTCCC GCAGGAGCAT TTCGCGGCCT TCGAGGGTCA CCTGCGCGAG 
GAGGTGTTCC CGGCGCTCGA AGCCGATCCG GACGACGACG GAAACGGCGC CGTCGGCATC 
GCAGATCTCA CACGCGAGCT CGGACGCGCC AACGCCGCGG TTAACGAACG CGACGACGTG 
GCCGAGGACG CCGGCGTCGC CGCCGCGGCC TACGAGTGCG ATGTGCCCGT CTACTGTCCC 
GCCGTGCAGG ATTCCGTGCT CGGGTTACAG GCGTGGATGT ACGCCCAGAC TGCCGACTTC 
ACGCTCGACG CCTTAGACGA CATGACGGAA CTGACCGACC TCGCGTTCGA CGCCGACGAC 
GCCGGCTGCC TGCTTGTCGG CGGCGGCGTC CCGAAGAACT TCACGCTCCA GACGATGCTC 
GTCACGCCCC GCGCCTACGA CTACGCCGTT CAGATCACGA TGGACCCGGA GGCGACCGGC 
GGGCTCTCCG GTGCCACCTT AGAGGAGGCT CGGTCGTGGG GGAAACTGGA GAAGGACGCG 
CGCAACGCCT CCGTCTACGG CGACGCGACC GTTATGCTGC CGATGCTTAT TGCTGCCGCC 
CGCGAGCGCG TGGAGTAG

Protein sequence

MSDSDDGGDP PHEEFHEDPV GHTRATAGMT VGELVEGYGD AGIGAASVNE AGDVLAEMFA 
NDDCTVFLSL AGAMVPAGMR RIVSDLIRDG YVDALVTTGA NLTHDAIEAI GGKHHHGRTH 
DPEKSLREHD EGLRDEGVDR IYNVYLPQEH FAAFEGHLRE EVFPALEADP DDDGNGAVGI 
ADLTRELGRA NAAVNERDDV AEDAGVAAAA YECDVPVYCP AVQDSVLGLQ AWMYAQTADF 
TLDALDDMTE LTDLAFDADD AGCLLVGGGV PKNFTLQTML VTPRAYDYAV QITMDPEATG 
GLSGATLEEA RSWGKLEKDA RNASVYGDAT VMLPMLIAAA RERVE