Gene Hlac_3294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3294
Symbol
ID	7402440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	34809
End bp	35897
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	53%
IMG OID	643709851
Product	hypothetical protein
Protein accession	YP_002567417
Protein GI	222481181
COG category	[R] General function prediction only
COG ID	[COG5271] AAA ATPase containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGGAG GAAGCGGTGG ATATGAGCGA CCGTCTGATA GCGGCGGATC GGGAGGAGAA 
TCTAGTGAAT CGGATAGTGT ACCCCCACCC GAGTCAGACA CTGAAGAAGA GACAGACGAA 
GATCAGTCTG ATGAGTCAAA TGAAACAAGT GACGGAACGA CTCCAGAGAG CCCACCAGTT 
ACTGGTGGCG GGGGCGGTAG CGGCGCACCA GAATCTGGTT CTGGGGACGG TTCTAGCGGT 
GCATCTGGAG AGGATGATTC AGAGCCGGAG CGAGACGAAC CATCACCAGA TGAGGGCACT 
GAAGATGGAG AACCGGAGGA ACAAGAAGAC AACAGCGGGC ATAATGACGA AGAGTCAGAG 
AAGCAGAACC CGGCAGATTC AGGTCCCGAA GACGACTCGG ATGATGCGGA CTCTAATAAC 
GCTGAGCAGG AGGGCAGTCA GGAGAACCAT GAGGAGGATC AAGAAGACCA AGAACACGAG 
AGTGACAATG AGGATGCCGA AGATGATGAC GAGGATCGGG AGGAAGACGA AGATGATGAC 
GAGGACGATG ATGAAGAAGA CGAGTGCCTG ATTGCAGAAT CAGCTCTTCT CCATTCACCG 
AACCCAGAAC CGTTAGAAGA TGTAGACGAG GGTGATGTCT GTTCAGTACG CCTTCGAGAG 
GAAGCGATCT GTATTGTAGA TTCACTAGGC AGAACTATCG GTGCCATCGC TGAACCGTGG 
GTTGGTACAC TGAAGGAGTG TATCGAGCAG GGCCGACAAT ATCGTGCTCG GGTTCTCAAC 
ATCGACGGAG GGAAATGCGA AGTTCGAGTA ACCAACAAGT GCCTCGTTAA CCAGGACGTC 
AATCTGACCG CGACCAATAC TGCAGTACGG GACCAACTTC ATCCGGAACT TTCCCTATCA 
GTCGAAAAAA CGACCGAAGA AGTAGTTGTC CTCACGGATG ACGGAGCTAG AGTCGGTGAC 
GTTCCTGACC CATGGGCTCG TCTTCTCAAC GAGTGTATCG ACCAAGGACG GTCATACCAG 
GCAGAGGTTC GTGAGGTTAC ACCGGAGTAT TGCAGAGTCA ATATTCAGAC GGGTGCTAGT 
GACGAATGA

Protein sequence

MGGGSGGYER PSDSGGSGGE SSESDSVPPP ESDTEEETDE DQSDESNETS DGTTPESPPV 
TGGGGGSGAP ESGSGDGSSG ASGEDDSEPE RDEPSPDEGT EDGEPEEQED NSGHNDEESE 
KQNPADSGPE DDSDDADSNN AEQEGSQENH EEDQEDQEHE SDNEDAEDDD EDREEDEDDD 
EDDDEEDECL IAESALLHSP NPEPLEDVDE GDVCSVRLRE EAICIVDSLG RTIGAIAEPW 
VGTLKECIEQ GRQYRARVLN IDGGKCEVRV TNKCLVNQDV NLTATNTAVR DQLHPELSLS 
VEKTTEEVVV LTDDGARVGD VPDPWARLLN ECIDQGRSYQ AEVREVTPEY CRVNIQTGAS 
DE