Gene Hlac_2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2014
Symbol
ID	7402033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2007186
End bp	2008265
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	65%
IMG OID	643709085
Product	peptidase M29 aminopeptidase II
Protein accession	YP_002566662
Protein GI	222480425
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCAC GCGTTCGCGA ACACGCGGAG ATCATCGCCG ACCACTCCAC CGACATCCAG 
TCGGGCGACG ACGTGGTCAT CCAGATGCCG AAGGAGGCCG AGGACCTCGC GGTCGCCCTC 
CACGAGATCT GCGGGGATCG CGGTGCCAAC CCCGTCTACC TCAACTACTC GAAGCGCGCC 
CAGCGCGCCT TCAAGCGCTC ATCGGACGAC TTCACCGAGC CGAGCCACCG ACGCGCGCTC 
TACGAGGAGG CCGACGTGTT CATCATCGCG CGCGGCGGCT CGAACGCCAC CGAGGACGCC 
GACATCGACC CGGAGACCAA CGCGGCCTAC AACCGGGCGA TGGAGGACGT CAAGCGGACG 
CGGCTCTCGA AGACGTGGTG TCTCACGCAG TACCCGACCG CGAGCCACGC CCAGCTCGCC 
GGAATGAGCA CCGAGGCGTA CGAGAACTTC GTGTGGGACG CCGTCTCGCT CGACTGGGAC 
GAACAGCGCG AGTTCCAGTC GAACATGGTC GAGATCCTCG ATACCGCCGA CGAGGTCCGG 
ATCACATCCG GTGAGGAGAC CGACCTGACG ATGGACCTGT CGGGTAACTC CACGCTTAAC 
GACTACGGCG AGGCCAACCT TCCCGGCGGT GAAGTGTTCA CCGCGCCCGT GCGCGACGGC 
GTCGACGGCG AGGTTCACTT CGATCTACCA CTCTATCGCT ACGGCCGCGA GATCGAGGGG 
GTCCGGCTCC GGTTCGAGGA CGGAGAGGTC GTCTCCCACT CCGCCGAACG CAACGAGGAC 
CTGCTGACGG GGATCCTCGA CACCGACGAG GGATCTCGGC ATCTCGGGGA ACTCGGCATC 
GGGATGAACC GCCAGATCGA CCGGTTCACC TACAACATGC TGTTCGACGA GAAGATGGGC 
GACACCGTCC ACATGGCGGT CGGTTCCGCG TACCCGGAGA CGGTCGGCGA AGGCAACGAG 
GTCAACGAGT CCGCCGAGCA CGTCGACATG ATCGTCGACA TGAGCGAGGA CTCCGTCATC 
GAAGTCGACG GCGAGGTTGT CCAGCGCAAC GGGACGTTCG TCTTCGAGGA CGGGTTCTAA

Protein sequence

MDARVREHAE IIADHSTDIQ SGDDVVIQMP KEAEDLAVAL HEICGDRGAN PVYLNYSKRA 
QRAFKRSSDD FTEPSHRRAL YEEADVFIIA RGGSNATEDA DIDPETNAAY NRAMEDVKRT 
RLSKTWCLTQ YPTASHAQLA GMSTEAYENF VWDAVSLDWD EQREFQSNMV EILDTADEVR 
ITSGEETDLT MDLSGNSTLN DYGEANLPGG EVFTAPVRDG VDGEVHFDLP LYRYGREIEG 
VRLRFEDGEV VSHSAERNED LLTGILDTDE GSRHLGELGI GMNRQIDRFT YNMLFDEKMG 
DTVHMAVGSA YPETVGEGNE VNESAEHVDM IVDMSEDSVI EVDGEVVQRN GTFVFEDGF