Gene Hlac_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1904
Symbol
ID	7399856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1906566
End bp	1907762
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	67%
IMG OID	643708975
Product	multicopper oxidase type 3
Protein accession	YP_002566552
Protein GI	222480315
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2132] Putative multicopper oxidases
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAG ACGGCGACGA CACCGGGCGA CGCATCGCTT CCAGACGCGG CTTCCTCTCG 
GCGGCCGCCG CACTCGGCAC CGTCGGGCTC GCGGGGTGTG GCGCTCCGCG AGCGGATGCC 
GGGGAGGGCG CGGAGAACGC GGTCACCGAC GAGACGGTCC AACAGCAGGT CGAGGAGTGG 
TCAGGAAGCG ACTCTACGGG CGTGGAGACG GATCACCCGT ACACGTCCCC GCGAACGACG 
ATCGACCTCG ACGAGCGGGA CGGGCAGATC ACGGTGTCCA CGACCCCGTG TCGCCACCAG 
CTGCTCGGCG AGGACACGCA GGGCGGTCCG TGGGAGCTCC CCGAGGTCTG GGCGTGGCAG 
ACGCCGGACA CGGATCCGAG CGTCCCCGGC CCGTTGCTCC GGGTAACCGA GGGAACCCAA 
CTGGAGATCA CCTACGACAA CTCGGCGCAC AACCGCCCGC ACACCTTCCA CGTCCACGGG 
CTCAGCAAGG ACTGGATGGA CGACGGCGTC CCGACGACGA CGGGCCAGCA GGTCGCGCCC 
GGCGAGGAGT ATACCTACGA GATTGACGCG AACCAGCCGG GCACCCACTT TTACCACTGC 
CACTACCAGA CGCAGAACCA TCTCGATATG GGGATGTACG GGATCCTTCG CGTCGACCCG 
GAGGGGTACG AAGCCCCCGA CAAGGAGGCG TTCATGACGA TCAAAGACTG GGACACTCGC 
CTGTCCGCCT CGACGGCTGG CGGCGACGTG GACTTCAGCC ACCGCGACCG CAACCCCGAC 
GCCTTCACCG TGAACGGTCG TTCCGCGCCG TACACATTCC ACCCCGAACA GGGCTCCCCC 
TTGATCGTCG AGGAGGGCGA TCAGGTGCGG ATCCACTTCG TCAACGCCGG CTACGAGTCA 
CACGCGATGC ACAACCACAA CCACGGCTTC ACCGTGGTCG AGAAGGATGG CGGCGTCATC 
CCCGAGGCCG CCAGGCACCG TGAGGACGTG ATCCCCATCG CACCCGCCGA GCGGAAGACG 
ATCGAGTTCA CCGCCGACGC CGACCCGGGT GTCTACGCGC TCCACTGTCA CAAGGTGAAC 
CACGCGATGA ACGGCGACAG CTACCCCGGC GGCATGATCG GCGGGATGGT GTACGAGAGC 
GCGATGGACT CAGAGCAGTT CGCCTCCGTG ATGGAGATGG CGGGCTACGA AGCCTAG

Protein sequence

MTRDGDDTGR RIASRRGFLS AAAALGTVGL AGCGAPRADA GEGAENAVTD ETVQQQVEEW 
SGSDSTGVET DHPYTSPRTT IDLDERDGQI TVSTTPCRHQ LLGEDTQGGP WELPEVWAWQ 
TPDTDPSVPG PLLRVTEGTQ LEITYDNSAH NRPHTFHVHG LSKDWMDDGV PTTTGQQVAP 
GEEYTYEIDA NQPGTHFYHC HYQTQNHLDM GMYGILRVDP EGYEAPDKEA FMTIKDWDTR 
LSASTAGGDV DFSHRDRNPD AFTVNGRSAP YTFHPEQGSP LIVEEGDQVR IHFVNAGYES 
HAMHNHNHGF TVVEKDGGVI PEAARHREDV IPIAPAERKT IEFTADADPG VYALHCHKVN 
HAMNGDSYPG GMIGGMVYES AMDSEQFASV MEMAGYEA