Gene Hlac_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1083
Symbol
ID	7400155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1082608
End bp	1083816
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	67%
IMG OID	643708149
Product	Nucleotidyl transferase
Protein accession	YP_002565748
Protein GI	222479511
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.39401
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGGAG TCGTGCTCGC GGCCGGCCGC GGGACCCGCA TGCGACCGCT AACGGACCGT 
CGTCCGAAGC CACTTCTTCC GGTCGGCGAT CGGTCGCTGC TCGAACGGGT GTTCGACACC 
GTGGCCGGTG TCGTCGACGA GTTCGTCGTC GTAGTCGGAT ACCGCGGCGA CGCGATCCGC 
GACGCGATCG GCGAGTCGTA TCGAGGCTAT CCGGTCCACT ACGTCGAGCA GGCGGAGGCG 
TTGGGGACCG CTCACGCCGT CGCGCAGGCC GAGCCCGTCG TCGACGAGGA CTTCCTCGTG 
CTCAACGGCG ACGTGGTCGT GGATGCATCG CTCCCCCGCT CCCTTGCCGA CGCCGACGGG 
ACGGCAGTCG CGGCCACGGA GGTCGTCGAT CCTCGGGCAT ACGGTGTGCT TTCGACGACT 
GAGGACGGCT CGCTCGCCGG GATCGTCGAG AAGCCCGACG ACCCGCCGAC GAATCTCGCG 
AACGTCGGCT GTTACGCGTT TCCGCCCGAG GTCTTCGAGT ATATCGATAG AACCCCCGAG 
AGCGAACGCG GCGAGTACGA GATCACGACG ACGATCGAGC TCCTCCTCGA CGACGGCCAT 
CCTATCGACG TGGCGCCCTA CGAGGGGACG TGGCTCGACG TCGGTCGTCC CTGGGAGCTG 
CTGAAAGCCA ACGAACTAGC GCTCACCGAG TTCACGGATG CCGTCGAGAA CGCTGGGACC 
GTCGAGGAAG GCGTCCACCT CCACGGCCCG ATCGTCATTG AGGAAGGAGC GCTGGTCCGG 
TCTGGAGCGT ATGTCGAGGG GCCGGCGCTG ATTCGCGAGG GCGCGGAAGT CGGGCCGAAC 
GCGTACGTTC GCGGGTCGAC GGTGGTCGGT CCGGACGTGC ACGTCGGACA CGGCGTCGAG 
GTGAAGAACT CGGTACTCAT GGCCGACGCG TCGGTCGGGC ACCTCTCGTA CGTCGGTGAC 
TCCGTGCTGG GTCGCGGCGT GAACTTCGGC GCCGGGACGA ACGTCGCGAA CCTCCGACAC 
GACGACGGGA ACGTCCGGAT GACCGTTAAA GGCGACCGCG TCGACACCGG CCGCCGGAAG 
CTCGGGGCGA TCGTCGGCGA CGGCGCGAAG ACGGGGATCA ACACGTCGCT GAACGCCGGC 
GTCAAACTGG GTGCAGCGGA GACGACCGGT CCCGGAGAGG TTCTGACTCG CGATCGAGTG 
TCGGAGTAG

Protein sequence

MYGVVLAAGR GTRMRPLTDR RPKPLLPVGD RSLLERVFDT VAGVVDEFVV VVGYRGDAIR 
DAIGESYRGY PVHYVEQAEA LGTAHAVAQA EPVVDEDFLV LNGDVVVDAS LPRSLADADG 
TAVAATEVVD PRAYGVLSTT EDGSLAGIVE KPDDPPTNLA NVGCYAFPPE VFEYIDRTPE 
SERGEYEITT TIELLLDDGH PIDVAPYEGT WLDVGRPWEL LKANELALTE FTDAVENAGT 
VEEGVHLHGP IVIEEGALVR SGAYVEGPAL IREGAEVGPN AYVRGSTVVG PDVHVGHGVE 
VKNSVLMADA SVGHLSYVGD SVLGRGVNFG AGTNVANLRH DDGNVRMTVK GDRVDTGRRK 
LGAIVGDGAK TGINTSLNAG VKLGAAETTG PGEVLTRDRV SE