Gene Hlac_0268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0268
Symbol
ID	7401194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	291089
End bp	292255
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	73%
IMG OID	643707331
Product	peptidase M24
Protein accession	YP_002564943
Protein GI	222478706
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.798559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGAAG ACGTCCACGC GGAACGGCGC GAGCGCGCGG CGGCGCGGCT CCGGGAGACC 
GGCGCCGACG GGCTCGTCTG TTTCCCCAGT CGGAACCTCC AGTACCTCAC CGGCTTCGCC 
GAGGAGCCGG GCGAGCGACA CCTCCTGCTC GTCGTGCCGG CGGCCGATCG GAGCTCTGAC 
ACCCCCGACG GTGGCGACCA GACCGCCGCC GAACCGACCC TCCTCGTGCC GGCCCTCCTC 
GTGCCGGCCC TCTACGAGAC GCAGGTCAAG GAGGAGACCA CGGTCGGTGC GGTGCGGACG 
TGGGCCGACG GCGACGACCC GACCGCCGCC GTCCAGGACC TCCTCGGCGA CCTCGGACTC 
AGCGAAGGGC GGCTCCTCGT CGACGACACG ATGTGGGCGA CGTTCACGCA GGACCTCCGG 
GCCGCCGCGC CCGACGCGGA GTGGGGACTC GCGAGCGAGG CGCTCGCCGA CCTCCGCGTG 
CGGAAGGACG AGGCCGAGTT GGACGCGATG CGCGCCGCCG CGGCGGCCGC CGACGAGACG 
GTCCGGGACC TCCGCGATCT CGGCGCGGAC GCGGTCGGGA TGACCGAACG CGACCTCACC 
GACTGGATCG CGGACCGACT GGCCGCCCAC GGCGGCGAGG GAACCTCCTT CGAGACGATC 
GTCGGGTCGG GGCCGAACGG GGCGAAGCCC CACCACGGCT GTGGCGACCG CGAGATCCGG 
GCGGGCGAGC CGGTCGTACT CGACTTTGGC ACCCGAGTCG ACGGCTACCC CTCGGATCAG 
ACGCGGACGC TCGTCTTCGA CGGCGAGCCG CCCGCCGAGT ACGAGCGTGT CCACGAGACC 
GTCAGGGCGG CGCAGGCCGC CGCGGTCGAG GCGGTCGAAC CGGGCGTCGC CGCCGAGGCG 
ATCGATCGGG CCGCCCGCGA TGTCATCGAG GACGCCGGGT ACGGCGACGC GTTCTTCCAC 
CGCACCGGCC ACGGGGTCGG GCTCGACGTC CACGAGGAGC CGTACATCGT GGCCGGCAAC 
GACCGGGAAC TGGAGCCGGG GATGGTGTTC TCGGTGGAGC CGGGGATCTA CCTCGACGGG 
CGGTTCGGCT GTCGGATCGA GGACCTCGTC GTCGTCACCG AGGACGGGTG TGAGCGGCTG 
AACGACACCG ACCGCGGCTG GCGGTGA

Protein sequence

MTEDVHAERR ERAAARLRET GADGLVCFPS RNLQYLTGFA EEPGERHLLL VVPAADRSSD 
TPDGGDQTAA EPTLLVPALL VPALYETQVK EETTVGAVRT WADGDDPTAA VQDLLGDLGL 
SEGRLLVDDT MWATFTQDLR AAAPDAEWGL ASEALADLRV RKDEAELDAM RAAAAAADET 
VRDLRDLGAD AVGMTERDLT DWIADRLAAH GGEGTSFETI VGSGPNGAKP HHGCGDREIR 
AGEPVVLDFG TRVDGYPSDQ TRTLVFDGEP PAEYERVHET VRAAQAAAVE AVEPGVAAEA 
IDRAARDVIE DAGYGDAFFH RTGHGVGLDV HEEPYIVAGN DRELEPGMVF SVEPGIYLDG 
RFGCRIEDLV VVTEDGCERL NDTDRGWR