Gene Hlac_1234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1234
Symbol
ID	7399502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1244583
End bp	1245614
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	643708298
Product	glycosyl transferase group 1
Protein accession	YP_002565896
Protein GI	222479659
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000428229
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACATCG GATTCTTCAC CGACAGTTAC TTCCCCGGTA TCGACGGGGT AACGTACACG 
ATCCGCGCGT GGCGGGATCG GCTCGAAGAC CGCGGCCACG AGGTGTACGT CGTCTACCCG 
GCGAGCAGCC ACGAGCCCGA CGATCGAGAG ATTCCCGTGC CGTCGCTGCC GAATCTCTTC 
TACAGTCAGT ACCGCGTTCC GCTGTACCGC CGGATCTCGA CGCTTCCCGA TCTGGACGTG 
GTCCACTGCC ACGGGCCGGC GTCGACCGGT CTGATGGGCC GCCGATACGC GAAGAAGCGC 
GACGTGAAGT CGGTGTACAC CCACCACACG CCCGTGGAAG ACTACTTCGT CCAGGGGTTG 
AAACTGGAGT TGCTGGCCGG GATCGCTGGC CGGGCGTACG TGGCCTACGA AAACCGGTTC 
CTCCAGTCGT TCGACTGCGT CACCGCGTCC ACCTCGCGAA TCCGGCGGGA CGTGACACCG 
CGGAAGCTCC CGGTCGGCAT CGAGATGGAC ACGTTCCGCC CGGTGACGGA CTCGCAGTTC 
GCAAGCGACG AGCCGACGGT GGGATACAGC GGTCGGATGA CTCGAAAAAA ACACGTCGAC 
GAGATCCTCC GGCTGGCCGA CCGGCTGCCC GACGTGCGGT TCGAACTGGT GGGCGAGGGA 
CCGGTCCGGG ACGACCTCGA ACGGGGCGCC CCGGGGAACG TCCGGTTCCG CGACTTCCTC 
CCGCGCGAGA ATCTTCCGGC GTTCTACTCC GCGCTCGACG TCTTCGTCAC CGCCTCGACC 
TGCGACACGC TCGGGCTCTC GACGCTGGAG GCGAACGCCT GCGGGACCCC GGTCGCCGCC 
GCCGACGTGC CCCCATTTGA CCGGACCATT GGGCCGGACA ACGGCACCCG GTTCGACCAC 
GGCGACCTCG ACGACATGGA GCGCGCCGTC GTCGACTGTC TCGACGGCGA CAGGCCGACC 
CGTGCGGCGG TCGAGGGGTT CTCCGTCGAG CGGACGATAG ACGACTTAGA GGAGATATAC 
GGGGTGTCGT AG

Protein sequence

MNIGFFTDSY FPGIDGVTYT IRAWRDRLED RGHEVYVVYP ASSHEPDDRE IPVPSLPNLF 
YSQYRVPLYR RISTLPDLDV VHCHGPASTG LMGRRYAKKR DVKSVYTHHT PVEDYFVQGL 
KLELLAGIAG RAYVAYENRF LQSFDCVTAS TSRIRRDVTP RKLPVGIEMD TFRPVTDSQF 
ASDEPTVGYS GRMTRKKHVD EILRLADRLP DVRFELVGEG PVRDDLERGA PGNVRFRDFL 
PRENLPAFYS ALDVFVTAST CDTLGLSTLE ANACGTPVAA ADVPPFDRTI GPDNGTRFDH 
GDLDDMERAV VDCLDGDRPT RAAVEGFSVE RTIDDLEEIY GVS