Gene Hlac_0465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0465
Symbol
ID	7400345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	482258
End bp	483604
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	76%
IMG OID	643707529
Product	conserved repeat domain protein
Protein accession	YP_002565137
Protein GI	222478900
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID	[TIGR01451] conserved repeat domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG GAACCGCCGA CGGCGACTCG CCCGACGATG ACGCCGCGAA CCGCGGGGGT 
GATCAGACCG AGCGCACGCC TCTCCGACGG TCCGAGACCG GACGGTGGGA CGGGATCGCC 
GGGGTCGCCC TCGCGCTCGT CGGGGTCGGC GTCGTCGCCC GGCAGCCCGG GCTCGTGCTG 
ACCGGGGCCG TCGGCGTGGG ATACGCCGTC TACGCCCGGA TCGGCGAGGC GCCCGAGGCG 
ACGATCGAGG TCGAGCGGAC CGTGAGCGAC GACACCCCGG CACCGGGCGA CGACGTGGTC 
GTCACGGTCC GGGCGCACAA CGTCGGCGAC GCTGCCCTCC CGGACCTCCG ACTCGTCGAC 
GGGGTGCCGC CCGGACTGGA GGTCGTCGAC GGCCCGGCGC GGATCGGGAC CGCGCTCCGG 
CCGGGGGCGA CGGCGGTCTT CGAGTACACC GTCCGGGCGA GCCGCGGGGA ACACGAGTGG 
GAGCCGATGC GCGGGATCAC GCGAGACGCC GCCGGCTCTC AAGAGCGCAC GACCGAACTC 
GCGGCACCGA CCCGGATCGT CTGTACCCCG GAGCTCTCGG CGGGCGGCGA CCTCCCCTTG 
CGAGGGTTGA CGACGAAATA TCACGGTCGC GTACCCACCG ACGTGGGCGG CGCCGGCGTC 
GAGTTCCACG CCACCCGCGA GTACCGCCGC GGCGACCCCG TCAAGCGGAT CGACTGGAAC 
CGGCGGGCGC GGACGGGCGA GCTGGCGACG CTCGAACTCC GCGAGGAGCG CGCCGCGACC 
GTCGTGCTCC TGATCGACGC CCGCGAGTCG GCGTACGCCG CGAGCGAGCC CGACGCCGAC 
ACCGCCGTGG AGGCGAGCGT CGAGGCCGCC GGACAGGCGT TCACCGCGCT GCTCGACGGC 
GGGGACCGGG TCGGGATCGC GACGCTGGGT CCGCGCGACT GCTGGCTCTC GCCGGGAGCC 
GGCACGGCGC ACGCCGCCCG CGGGCGCGAG ACGCTGGCGA CCGACCCCGC GCTGGCGCCG 
ACGCCGGTCG AGGGGGGGTT CTACCAGTCG CTGTGGTTCC GGCGGTTCCG CCGGCGGCTT 
CCGGCCGACG CGCAGGTGCT CTTTTTCACC CCGCTCCTCG ATGACTCCGC GGCGTCGCTC 
GCGCGCCGGA TCGACGCCCA CGGTCACCTC GTCACCGTCC TCTCGCCCGA CGTGACCGCC 
GGCGACACGC CGGGAACGCG GCTGGTCGCG TTCGAGCGCC GCGAACGGCT CCGCGAACTG 
CGCGGGGCGG GGATCCGCAC GACCGAGTGG GGAGACCGGT CCTTCCCCGT CGCGGTCGCG 
CGGGCCACCG GGAGGTGGTC GCGGTGA

Protein sequence

MSAGTADGDS PDDDAANRGG DQTERTPLRR SETGRWDGIA GVALALVGVG VVARQPGLVL 
TGAVGVGYAV YARIGEAPEA TIEVERTVSD DTPAPGDDVV VTVRAHNVGD AALPDLRLVD 
GVPPGLEVVD GPARIGTALR PGATAVFEYT VRASRGEHEW EPMRGITRDA AGSQERTTEL 
AAPTRIVCTP ELSAGGDLPL RGLTTKYHGR VPTDVGGAGV EFHATREYRR GDPVKRIDWN 
RRARTGELAT LELREERAAT VVLLIDARES AYAASEPDAD TAVEASVEAA GQAFTALLDG 
GDRVGIATLG PRDCWLSPGA GTAHAARGRE TLATDPALAP TPVEGGFYQS LWFRRFRRRL 
PADAQVLFFT PLLDDSAASL ARRIDAHGHL VTVLSPDVTA GDTPGTRLVA FERRERLREL 
RGAGIRTTEW GDRSFPVAVA RATGRWSR