Gene Hlac_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2202
Symbol
ID	7401137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2186157
End bp	2187296
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	64%
IMG OID	643709274
Product	hypothetical protein
Protein accession	YP_002566849
Protein GI	222480612
COG category	[R] General function prediction only
COG ID	[COG5271] AAA ATPase containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.161577
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACC GATCGCGGAC GACAGACGAC GACCGCTCAC AGGACACTTC CACCGACGGC 
TTCCGGCGAC GGGAGTTCGT GGCGCTCGGC GCGGGCGTGA GCGCGACGAT GCTCGCGGGC 
TGCGCCGGAG ACGGGGGGGC CACCTCGTCC GACGGGTCCG ACGGGTCGGA CGGATCGGAG 
ACGCTTACCG GCAACTTCAG ACTGCTCATT AGCGACGCGC CGGCCGACAT CGGCGACTTC 
GACCAACTGA ACGTCACTCT CGACGAGGCT CGGATCTTCG AGGCGAATGA GGGAGGAGAC 
GACGACGAAG AGGCGGACGA CGACGAAGAG GCGGACGACG AGGAGGAGAC CGATGAAGAG 
GAGGAAGACG ACGCGGATGC GGACGACGAA GACGACGAGA GCAATCAGAC CGGCAACGAG 
ACCGAAGAGG ATGACCCCAC GAACGGAACC GCGGACGAAG AAGACGATGC GGACGTGGAG 
GACGAGGACG ACGCTGGCGA CGACGACGAG GAAGCGGACG ACGACGACGA GGAAGCGGAC 
GACGACGACG AGTCCGACCG CGGCTTCACC GTCGTCGAAC TCGACGGTGC GACGGTCGAT 
CTCACACAGG TGATCGAGGA CGACGCGATC GCCGTGTTCG ACGGCGAGAT CTCGGCGGGA 
AGCTACGAGA AGATCGAGCT CTCCGTCACC GACATCGAGG GGATCGTCGA CGGCGAGGAG 
GTCGACGTGA AGCTCCCGAG CGAGAAGCTC CAGATCACGA ACGACTTCGA GGTCACGCCC 
GACGAGCCCG TCAGCTTCGT CTTCGACATC AACGTCGTCA AGCGTGGTCC GAACAACGGC 
TACATCCTCC AGCCCGTGAT CTCCGGGAGC GGGGTTGCCG GTCGAGATAT CGATGTGAAC 
GAAATCGACG AGGACGGTGA CGACGGAGAT GATGAAGATG GCGACGAGGG CGACGACGAC 
AACGAAGACG ACGACGACAG CGAAGACGAC GACGACAGCG ACGACAGCGA CGACGACAGC 
GACGACAGCG ACGACGACAG CGGCGAGAGC GACGGATCGA CCACCGGCGG AAGCGAGACC 
GACGACGGGT CGAGCGGCAC CGAAAACGAA ACGGCCACTG GGAACGTAAG CGAGAGCTGA

Protein sequence

MTDRSRTTDD DRSQDTSTDG FRRREFVALG AGVSATMLAG CAGDGGATSS DGSDGSDGSE 
TLTGNFRLLI SDAPADIGDF DQLNVTLDEA RIFEANEGGD DDEEADDDEE ADDEEETDEE 
EEDDADADDE DDESNQTGNE TEEDDPTNGT ADEEDDADVE DEDDAGDDDE EADDDDEEAD 
DDDESDRGFT VVELDGATVD LTQVIEDDAI AVFDGEISAG SYEKIELSVT DIEGIVDGEE 
VDVKLPSEKL QITNDFEVTP DEPVSFVFDI NVVKRGPNNG YILQPVISGS GVAGRDIDVN 
EIDEDGDDGD DEDGDEGDDD NEDDDDSEDD DDSDDSDDDS DDSDDDSGES DGSTTGGSET 
DDGSSGTENE TATGNVSES