Gene Hlac_0107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0107
Symbol
ID	7401625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	112378
End bp	113943
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	64%
IMG OID	643707168
Product	DNA-directed RNA polymerase subunit beta''
Protein accession	YP_002564783
Protein GI	222478546
COG category	[K] Transcription
COG ID	[COG0085] DNA-directed RNA polymerase, beta subunit/140 kD subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.397905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.532786
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGGC AAGACCGACG CGTGGTGTCA CGTGAGTATT TCTCGGACGA ACGGCTCGCC 
GAACACCACT TCCGATCGTT CAACAACTTC CTGGACCGCG GCATGCAGGA GGTCGTCGAC 
GAGAAGGAGA CGATCGAGAC CGATATCGGC GACAAAGAGG GCCAAGAGCC CGTCTACGTC 
GAACTCGGCG ATGTGCGGAT GGTCACTCCG CGCGTCCGCG AGGCCGACGG CTCCGAAGAG 
CTGCTGTACC CCCAAGAGGC CCGGCTTCGG AACATCACCT ACTCGGCGCC CGTGTTCATG 
GAGATGTCCA TCGTGCGCGG CGGCGAAGAC GAGCCCGAGC AGGTCGTCGA CACGACCGAG 
ACGAAGGTCG GCCGGATGCC GATCATGGTC GGCTCGAACA AGTGCAACAT GGCCGGCTTC 
TCCGACGACG AGCTCATCGA CATCGGTGAA GATCCCGTCG ACCCCGGCGG CTACTTCATC 
GTCAACGGCT CCGAGCGCGT GCTGATGACC TCGGAGGACC TCGCGCCGAA CAAGATCCTC 
GCCGAGTACG ACTCGAAGTA CGGCGACGAG ATCCAGGTCG CAAAGACGTT CTCCCAACGC 
CGCGGGTACC GTGCGCTGGT GCTTTGCGAG CGCAACCGTG AAGGGCTGCT CGAAGTGTCG 
TTCCCGTCCG TCTCGGGCTC GATTGACTTC GTGACCCTCG TTCGCGCCCT CGGGCTCGAA 
TCCGACGAGG AGATCGTTCA CCGCGTCTCG GACGACCCCG AGATTGTGAA GTTCATGCTG 
GAGAACTTGG AGGAGGCCGA GGTGCAGACG ACCGAGGGGG CCATCGAAAC CCTCGGCGAG 
CGCGTCGCCT CCGGACAGGG GAAGAACTAC CAGCTCAAGC GGGCCAACTA CGTCATCGAC 
CGCTACCTCC TCCCGCACCT CCACGAGGAG GGCGTCGACG AGGAGGACGT GCGGATCAAC 
AAGGCGTACT ACCTCTGCCG GATGGCCGAG GCGTGCTTCG AACTCGCCTT GGAGCGCCGC 
GAGGCCGACG ACAAGGACCA CTACGCGAAC AAGCGCCTGA AGGTCTCCGG CGACCTGATG 
CGCGACCTGT TCCGGACCGC GCTGAACAAG CTGGCACGCG ACGTGAAGTA CCAGCTTGAG 
CGCGCGAACA TGCGGAACCG CGATCTCACG GTCAACACGG TTGTCCGCTC CGACGTACTG 
ACCGAGCGGC TCGAACACCC GATCGCGACG GGGAACTGGG TGGGTGGTCG CTCCGGCGTC 
TCCCAGCTCG TTGACCGGAC GGACTACATG GGTGTGCTCT CGCACCTCCG GCGCCTGCGC 
TCGCCGCTGT CGCGGTCGCA GCCGCACTTC AAGGCGCGAG ACCTCCACGC GACCCAGTGG 
GGTCGCATCT GTCCCTCCGA GACTCCGGAG GGGCCGAACT GTGGACTCGT GAAGAACTTC 
GCGCAGGCGA TGGAGCTCTC ACAAACCGTA GACGACGAAC AGGGGCTGAA ACGAGAACTG 
GCGTCGATGG GTGTCGAGGG GATTCCCGGC ATCGAGGGCG TCGACCGACA GACGGCGGAC 
GACTAA

Protein sequence

MNRQDRRVVS REYFSDERLA EHHFRSFNNF LDRGMQEVVD EKETIETDIG DKEGQEPVYV 
ELGDVRMVTP RVREADGSEE LLYPQEARLR NITYSAPVFM EMSIVRGGED EPEQVVDTTE 
TKVGRMPIMV GSNKCNMAGF SDDELIDIGE DPVDPGGYFI VNGSERVLMT SEDLAPNKIL 
AEYDSKYGDE IQVAKTFSQR RGYRALVLCE RNREGLLEVS FPSVSGSIDF VTLVRALGLE 
SDEEIVHRVS DDPEIVKFML ENLEEAEVQT TEGAIETLGE RVASGQGKNY QLKRANYVID 
RYLLPHLHEE GVDEEDVRIN KAYYLCRMAE ACFELALERR EADDKDHYAN KRLKVSGDLM 
RDLFRTALNK LARDVKYQLE RANMRNRDLT VNTVVRSDVL TERLEHPIAT GNWVGGRSGV 
SQLVDRTDYM GVLSHLRRLR SPLSRSQPHF KARDLHATQW GRICPSETPE GPNCGLVKNF 
AQAMELSQTV DDEQGLKREL ASMGVEGIPG IEGVDRQTAD D