Gene Hlac_1456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1456
Symbol
ID	7400283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1463552
End bp	1464745
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	74%
IMG OID	643708517
Product	glycosyltransferase-like protein
Protein accession	YP_002566114
Protein GI	222479877
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.443232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTACG TACAAGAGCG CGTGACCACG CTGCACGCGT TGACCGACCA CCGGCCGGAC 
GCCCCGACCG GCCGGGCGGC GGTCGTCGTG CCGATGACGG AACGCGAGTA CGGGACGCTC 
GCGGCCGATC GGGTCCTGAC GGCGCTGGAG TCGGTCGATC CCGCCCGCGT CGTCGTCCCC 
CTCCGTGCCC CCGCCGAGCG CGTCGGCCCC TTCGCCGACT GGCTCGACGG CTTCGACGTG 
GACGTGGAGC CCCTCTGGTG TGGCGGCCCG CGGCTCACGG AGCTGCTCGC GACTCGCGGA 
CTCGACGGGG ACCGCGGAAA GGGTCGAGAC GTGTGGCTCG GGCTCGGCCG CGCCTTAGAG 
GAGGAGTTCG TCGTCGTCCA CGACGCCGAC ACGAAGACGT ACTCGCCCGC CTTTGTCACC 
CGGCTGCTGT TCCCGCTCGC GCGCGGCCAC GACTTCTCGA AGGGGTACTA CGCCCGCGTC 
GAAGACGGAT CGCTGTACGG GCGGCTGTTC CGGCTGTTCT TCCGGCCGCT GGTCCGCGCG 
CTCGCCGACG CGACCGAGCG CCGCGAGCCC GGCATCTTGG AGTACCTCGA CGCGTTCCGC 
TACGCGCTTG CCGGGGAGTT CGCGGCGACG ACCGACCTCG TCTCCAGACT TCGCATCCAG 
CGCGGCTGGG GGCTGGAGGT CGGGACGCTC GGCGAGGCGT TCGCGCACGC CGGCTTCGCG 
GGGAGCGCGC AGGTCGATCT GGGGCGGTAC GAGCACGACC ACCGCTCCGT CGACGGGCCG 
ACCGGGCTCG CCGACATGAG CCGGGCGGTC GGCGAGGCGA CCCTGCGCGC GGTCGAGGGC 
GCCGGCGTCG AGATCGAGTA CGACACGCTC GCCGACCGCT ACCGCGAGGC GGCCGACGGG 
CTGATCCGCG GCTACGAGAC GGACGCCGCG TTCAACGGCC TCGACTACGA CCGCGGGGCC 
GAACGCGAGC AGGTGGCGAC GTACGCCGAC GCCCTCGGCA AGCCAGAGCC GGACACCCGC 
TTGCCGGCGT GGCGAGACGC GCCCGTCACG CCCGCCGAAG TCGGCGACGC GGCGCGAGCC 
GACCTCGCGG TGGCGCGGGA TAAGGGGTCG AGGCGAACAG ACCGGAACCC GGGGAAGGCC 
AACCGCCAGC GGCCCGCGGA CCCGAGCGCC GACGCCGCGC CGGGGGAGGA TTGA

Protein sequence

MEYVQERVTT LHALTDHRPD APTGRAAVVV PMTEREYGTL AADRVLTALE SVDPARVVVP 
LRAPAERVGP FADWLDGFDV DVEPLWCGGP RLTELLATRG LDGDRGKGRD VWLGLGRALE 
EEFVVVHDAD TKTYSPAFVT RLLFPLARGH DFSKGYYARV EDGSLYGRLF RLFFRPLVRA 
LADATERREP GILEYLDAFR YALAGEFAAT TDLVSRLRIQ RGWGLEVGTL GEAFAHAGFA 
GSAQVDLGRY EHDHRSVDGP TGLADMSRAV GEATLRAVEG AGVEIEYDTL ADRYREAADG 
LIRGYETDAA FNGLDYDRGA EREQVATYAD ALGKPEPDTR LPAWRDAPVT PAEVGDAARA 
DLAVARDKGS RRTDRNPGKA NRQRPADPSA DAAPGED