Gene Hlac_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0040
Symbol
ID	7401393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	42396
End bp	43853
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	73%
IMG OID	643707099
Product	protein of unknown function DUF402
Protein accession	YP_002564716
Protein GI	222478479
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1530] Ribonucleases G and E
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.708501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0289003
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCCC GCGTTCGCGG CATCTACGCG ACGGCGCTCA CCGAGGCCCT GCTCGACGCG 
GGCCACGAGG TCGTCGGCGC GTCGACCCCG ATCCGACGGC GCTTCGACGC CGAGTTCGAA 
AGCGCACCGC CCGACGCACG GATCGCGACG ACAGAGGATC GGCAGGGTGT CGGCGCGCAC 
GGGGATCCGG ACGCGATAGG GACCCTCCGG GGCCTCCTGA CCGACACGGG ACTCGACGCG 
CTGGCGTGGA CCGATCCGAC CCCGCCCGGG ACCGTCTGCG ACGGGACGGT GACCGAGACG 
CTCGGCGGTG GGGCGGTCGT ACGGCTTCGC GTTGGCGGGG GCGAGAGCGA GGGCGACGCC 
ACCACCGAGG GGTACCTCCC GTACGGGAGC GTCGACGACC GAATCGAGAC CGGCGATCCG 
GTCCGGGTGC AGGTCCGGGA GTCCGCGGCG CCATGGACGG ATCGCCGCCC CGAGTTGGAC 
GGGTCGCTGC GAGCGGGCGG CGGGCTCGTC ACGCTCGAAC CCGGCTCGGG CACCCGCGTC 
GACGCGCGGA ACGACAAGGA CGCGCGAGAG CTGTCGGGAA TGCTCGACCT GCTCGGACTG 
AAGCCGCCGG AGGGGTGGCG CGCCGTCTGG AAGCCGCCCG CGGTCGACGC CGACACCGAG 
GAGCTGCAGG CCGGACTCGA CCGGGCGGTC GCGGCCGTCG AGGGGCTGGA CGACGCCGTC 
GACGCGGCGG GAGGCGCCGG CGTTCTCGAC GGTTCGGACA GCGTTCGCGA GGAGCCGTTG 
ACGCGCCCGA ACGCCGGCGT CTGGGTGTGG TTCGGCCGCG AGAGCCGGTT CGCGCTCGAC 
GACCGCCGAC GCGAGGCGAC CGCGACGATG CCGGGTCACC ACCGGGTGAA GGCGGGGTCG 
GCGGACGCAT CTTCGGGCGT TGACCTCGCA GAGGCGCTGT GCGAGCCCGA CGCGGACGCC 
TCATTCCCGT TCGGGGTCGT GACGGACGCG TTCGGGCCGG CCGAGGGCGA CGCGCTCCGG 
CTCGAACACG GCAAGCCCGA CGGGCGACTG ATCACGCTGG GCGAGGCGAC GGTGACCACA 
GTCGACGCCG ACGGCTCGGT CGCGGTCGAG CGCGAGATGA CCGGCGGCGG CTCTTACGAC 
GGGTTGGACG TGCCCCGCGA GGCCGGCGAC ATCGCTGAGA CCAGCCTGAA GGAGGGCCGA 
TGGTGGTACC CGACGACGTA CCGCGGGCGC GATGGGACGG TGCGCGGGAC GTATGTCAAC 
GTCTGCACGC CGGTCGAGGT GTTCCCGGAC GCCGCCCGCT ACGTCGACCT TCACGTCGAC 
GTGATGAAAC ACCCCGACGG GACCGTCGAG CGCGTCGACG ACGACGAACT GCGGGACGCA 
GAGGCGGCCG GAGACGTGCC GGAGCCGCTG GCGGAGAAGG CTCGGAGCGT GGCGTCGGCG 
CTGGAGAACG CGCTGTGA

Protein sequence

MKARVRGIYA TALTEALLDA GHEVVGASTP IRRRFDAEFE SAPPDARIAT TEDRQGVGAH 
GDPDAIGTLR GLLTDTGLDA LAWTDPTPPG TVCDGTVTET LGGGAVVRLR VGGGESEGDA 
TTEGYLPYGS VDDRIETGDP VRVQVRESAA PWTDRRPELD GSLRAGGGLV TLEPGSGTRV 
DARNDKDARE LSGMLDLLGL KPPEGWRAVW KPPAVDADTE ELQAGLDRAV AAVEGLDDAV 
DAAGGAGVLD GSDSVREEPL TRPNAGVWVW FGRESRFALD DRRREATATM PGHHRVKAGS 
ADASSGVDLA EALCEPDADA SFPFGVVTDA FGPAEGDALR LEHGKPDGRL ITLGEATVTT 
VDADGSVAVE REMTGGGSYD GLDVPREAGD IAETSLKEGR WWYPTTYRGR DGTVRGTYVN 
VCTPVEVFPD AARYVDLHVD VMKHPDGTVE RVDDDELRDA EAAGDVPEPL AEKARSVASA 
LENAL