Gene Hlac_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2006
Symbol
ID	7402025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2000174
End bp	2001763
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	71%
IMG OID	643709077
Product	polysaccharide biosynthesis protein
Protein accession	YP_002566654
Protein GI	222480417
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.300214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.433718
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAGTC GATACGTGAA CGACGGACTC GGTGCCGGTG GCGACGGCGA GCGCGAGGCG 
GCGAGCGACG ACGACAGCGT CCCCGACGCC GAGCGCGAGG CGCTCCTGAC GATCGCGGGC 
GGAGCCGTGA TCACCGCCGG CGGTGTCTCC GGCCAGCGCG CGCTCACGGC CGTGACGGAG 
TTCGCGCTCG CTCGCGGACT CGGCCCGGCC GCCTACGGCG TGTACGCACT GGCGTGGCGG 
ATCGCCCAGT TGCTCTCGCG GCTCGTCACG TTCGGGAGCG TGCCGGCGCT CCAGCGCTAC 
CTCCCCGAGT ACGCGGACGA CCCCGACCGA CAGGGGGTCG TCGCCGGGCT CGCGTACGCC 
ACGACGCTCG GATTCGGTGC CGCCATCGCC GCCGGAATCT GGGTGGCAGC ACCGCGGATC 
AACGCGCTCA CCGTCGAGGC CCCCGCGTTC CCGCCGACGA TGCGCGCGTT CGGCTTCCTC 
GTCGGATCGC TCGGCGTCGT GATGGTCGCG TCGGCGATCT TCCGCGCGGT CGGGTCCGCG 
CGCGGCGAGA TCGCCTTCAA CAAACTCCTC CGCCCGGGCG TCCGGCTCGT GGGCGCGCTT 
ACGGCGCTGG CGCTCGGCTA CTCGGTCGTC GGCGTCGCCG GCGGCATCGT CGTCGCGACC 
GCGCTGCTCG CGGCCGTCGC CGCGCCCCTC TCCGCGCGGG TGACCGGGAT CGTCCCGTCG 
CTGCGGGGAG TCCGTGGGGA GGCGGGGCGG TTCTACAACC ACGCGGCGCC GGTCGCGATG 
AGCAGCCTCG GGAAGGTGTT CCAGAACCGC GTTGACGTGT TGCTCGTCGG AGCGCTGTTG 
ACGGCGACCG CCGCGGGCGT GTACAACGTC GTCCTCGTGT TGATCGCGAT CGCGTGGATC 
CCCCTCATCG CGTTCAACCA ACTGCTGCCG CCGGTCGCCT CGGATCTGTA CGCCGACGAT 
CGGATCGAAA CGCTCAACGC GGTGTACACG TCGGTGACCC GTCAGATCGT CACGAGCGTG 
ATCCCGATCC TCGCCGTGCT CGTGGTGTAC GGCCGGGAGC TACTCGGGCT GTTCGGCGAG 
CCGTACGTCG CAGGGTACGC CCCCCTCGTC GTCTACCTCG GCGGGGTGTT CGTCGGCAGC 
GCGGTGGGCG CGACCGGCTG GCTCCTGATG ATGACCGACC ACCAGTACGC CCGGATGGCG 
CTCGACTGGC TGCTCGCCGT CCTCAACGTC GCCTTAACGT ACGCATTCGT GGTCCGGTAT 
GGGCTCGTCG GCGCCGCGCT CGGCACCTCG CTCGCGATCG CGGTGCAAAA CGCGATTCAG 
GTCATCCTGT TGCGCCGCTT CGAGGGGCTG TGGCCGTTCG ACCGCACCTA CCTCACCCCG 
CTGGTGGCCG GCGGCGTGAC GTTCCTCGCG ATGCGAGCAA TTCGGGAGGT TGCCCCCGGG 
CGAGCCGCGG TCGTCGTCGG GGCCGCGGGC GGGCTCGTGG TCTACGCGGG CACGCTACAC 
GTCCTCGGCG TTGATCCCCG AGACCGGCTC GTCGCACGAG AGCTTGCGGG GCGGTACCGT 
GGGGCCCTCG CCGAGTGGCT CGGTCGGTAA

Protein sequence

MSSRYVNDGL GAGGDGEREA ASDDDSVPDA EREALLTIAG GAVITAGGVS GQRALTAVTE 
FALARGLGPA AYGVYALAWR IAQLLSRLVT FGSVPALQRY LPEYADDPDR QGVVAGLAYA 
TTLGFGAAIA AGIWVAAPRI NALTVEAPAF PPTMRAFGFL VGSLGVVMVA SAIFRAVGSA 
RGEIAFNKLL RPGVRLVGAL TALALGYSVV GVAGGIVVAT ALLAAVAAPL SARVTGIVPS 
LRGVRGEAGR FYNHAAPVAM SSLGKVFQNR VDVLLVGALL TATAAGVYNV VLVLIAIAWI 
PLIAFNQLLP PVASDLYADD RIETLNAVYT SVTRQIVTSV IPILAVLVVY GRELLGLFGE 
PYVAGYAPLV VYLGGVFVGS AVGATGWLLM MTDHQYARMA LDWLLAVLNV ALTYAFVVRY 
GLVGAALGTS LAIAVQNAIQ VILLRRFEGL WPFDRTYLTP LVAGGVTFLA MRAIREVAPG 
RAAVVVGAAG GLVVYAGTLH VLGVDPRDRL VARELAGRYR GALAEWLGR