Gene Hlac_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1080
Symbol
ID	7400152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1080575
End bp	1081750
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	71%
IMG OID	643708146
Product	Nucleotidyl transferase
Protein accession	YP_002565745
Protein GI	222479508
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.380619
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA CTCCCGTGAC TGCGGTGGTC CTCGCCGCGG GCGAGGGACG GCGGTTAGAA 
CCGCTGACGA ACCGGCGGCC GAAGCCGATG GTCCCCGTGG CGAACCGTCC GCTGCTCGAA 
CACGTCGTTG AGGCCGTCGC CGCGGCCGGG ATCAATCGGA TCGCCCTCGT CGTCGGGTAC 
AGACAGGAGC GCATCCGGAA CCACTTCGGC GACGGCGACG ACTGGGGCGT GACGATCGAG 
TACGTCGAGC AGTCGACCCA ACTGGGAACC GGTCACGCCG TCTTGCAGGC CGAGCCCGTC 
GTCGACGGCC CCTTCGTCGT GCTCAACGGC GACCGGATCG TCGACGCCGC GGTCGTCTCG 
CGGGTCCGTG ATCTCGCGCG CGACGGCGAC CACCCGGCGA TGGCGGTCAC GACCGCGGAA 
CGCCCGCGCG AGTACGGCGT GGTAACACTC GATGGTGACC GGGTGACGGG GATCGACGAG 
AAGCCCGAGG GGCCGGTTGA GACGAACCGG ATCAACGCCG GCGTCTACGC CTTCTCGCCG 
GCCGTGTTCG ACGCGATCCG CGAGACGCAC ACGACGGGCG AACTGGCGAT CACGGCGACG 
CTCAACGAGC TCGCGTCGGC GGGCGACCTG ACCGCGGTCG GGTACGATGG CCGCTGGCTC 
GACGTATCGA ACCTTTGGGA CCTGCTGGGT GTCAACGCCG CGCTGATCGG TGAGTCCGAA 
CAGACGGAGC CTACCGACGC CGCCTTCGGC GCGTCGGTGA CCGTCGCCGA CGACGTGGCG 
CTCGCGGGCA ACGTCCGAAT CGGACCGAAC GTCACGGTCG GCGGGAGCAC CGCGATCGGG 
AGCAACGCGA CGATCGAGGC GGGAGCGGTC GTCGAGAACG CGGTGATCTT CCCCGACGCC 
GTGATCGGTG CCGGAGCCGT CGTCCGCGAC GCGATCGTCG CCGGGAACGC CCGAATCGGG 
GCGAACGCGA CGATCGCCGG GGGTCCTGCG ACCGTCGTCG TGGGCGATGC GGTCCACCAC 
GACGTGGCAC TCGGCGGCGT GGTCGGCGAC AACACGACCG TCGGCGGCGG CGCGACGCTC 
ACGGACGGTG CGGTCGTCGG CGACGACGTG CGGGCCGACG CCGGCGTCGT GATCGACGGG 
CGCGTTGAAT CTGGCGCGGT CGTCCGGAGG GGGTAA

Protein sequence

MSDTPVTAVV LAAGEGRRLE PLTNRRPKPM VPVANRPLLE HVVEAVAAAG INRIALVVGY 
RQERIRNHFG DGDDWGVTIE YVEQSTQLGT GHAVLQAEPV VDGPFVVLNG DRIVDAAVVS 
RVRDLARDGD HPAMAVTTAE RPREYGVVTL DGDRVTGIDE KPEGPVETNR INAGVYAFSP 
AVFDAIRETH TTGELAITAT LNELASAGDL TAVGYDGRWL DVSNLWDLLG VNAALIGESE 
QTEPTDAAFG ASVTVADDVA LAGNVRIGPN VTVGGSTAIG SNATIEAGAV VENAVIFPDA 
VIGAGAVVRD AIVAGNARIG ANATIAGGPA TVVVGDAVHH DVALGGVVGD NTTVGGGATL 
TDGAVVGDDV RADAGVVIDG RVESGAVVRR G