Gene Hlac_1137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1137
Symbol
ID	7400946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1143927
End bp	1145237
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	64%
IMG OID	643708202
Product	hypothetical protein
Protein accession	YP_002565801
Protein GI	222479564
COG category	[R] General function prediction only
COG ID	[COG1913] Predicted Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATG GTGCTCGGTC AACAGATTCC AAGCCCACTG GTGTCGATCA AGAGTCCGCT 
GGCAGTGCAA TCACGAATGG CGATGGGGCC GAGCGGCTCG ACCCGCTGAC AGTGGACGAC 
CAGCGTGGCG ACGAGGCTGC GCCGCAAATC GACGTCGGGG TTCTCATCGC GCACTCGCCG 
GGGACGAACG CCGAGCCACT GCAATCGTTC GCCGAGCAGA TGACCCGCGA TGGCGTCGAT 
GAGCTAGCGG CGGCCACGGA CGCGACCTGG CGAGTTCACT GTGCCGAACC GGATCCGCTT 
ACCGACGCTG CCCCCCGGCG ACCGTCTGAG TTCCTCGATG AGGCCGCACT TCACATGGTG 
AAGCGTCCGT ACGACCTCGT CGTCGTCGTG ACCGACGTGC CACTGACCAC GCGTGAGGAG 
CGAACCGTCG AGGGACTCGC GTCCCCGATC GCGCGTGTGG TCGTCGTTTC GACGCGGCGA 
CTCCGTCGGA GACCCGGCCG AGAGACGGTC CAAGCACTCG ATTCGGCGGC CGTCCACTGG 
AACGCCGCAA CCCTCCTCGT GCATCTCTTC GGACACGTGT TCGGTGCGGA CCACGATGAC 
GGCGGCGTGA TGATGCCGTT CTCGTTCGAT CCCTCTCGCC GGAGCGTCCC GCGATTTGAC 
GCGGACATCA CGCAACACCT CAGGAAGATC ACCACCCGTA TCCCCGAAGA AGGCGTCTCA 
CGTGGGCGGC TTCGACGGCT GGCGTTTCAC GCGCTGAGTC TTGCGCGGAA CCCGTGGACC 
GTCGTCTCGA CGCTCCTGCA GAGTCGCGCA CCGCTGCTTC CGTTTTCACT CCCGCGCCTC 
TCGACGGCCG CGGTGACGCC GACGCTAATT TTAGTGTTCA GTGCCGAGGC GTGGGACGTC 
GGACTGAACC TGACCAACCG GACCACCACG CTGTTCGCCA TCGGGAGTAT CATCGCCGCC 
GCTGTCCATC TCTTGTACGT TCAGCGGCTG TCCTTCCCGC GCGAGCGGAG CCAAGTGATC 
ACCGAACACA TGGCGCTGGT GAACGTGACG GTGTTCTGTA TTCTCGTCGT GGCGATGATG 
GGACTCTTCG TCCTCGTCGG GTCGATCATG CTCCTGATCG AACTCGCCGT CTTCCCGCCG 
AACCTGATGA CGAACTGGCC GAGCCTCGAG GAGCCCACTG TCGGGTTCAC CGACCTCATC 
CGCGTTGGTG GCTTCATCAG CACGCTGGGT GTGCTGTCGG GGGCACTCGC AGGCGGGATC 
GAGAACCGAA TGGCGCTCCG CCATCTCGCA CTCTTTCGTG ACCACCCGTA G

Protein sequence

MSDGARSTDS KPTGVDQESA GSAITNGDGA ERLDPLTVDD QRGDEAAPQI DVGVLIAHSP 
GTNAEPLQSF AEQMTRDGVD ELAAATDATW RVHCAEPDPL TDAAPRRPSE FLDEAALHMV 
KRPYDLVVVV TDVPLTTREE RTVEGLASPI ARVVVVSTRR LRRRPGRETV QALDSAAVHW 
NAATLLVHLF GHVFGADHDD GGVMMPFSFD PSRRSVPRFD ADITQHLRKI TTRIPEEGVS 
RGRLRRLAFH ALSLARNPWT VVSTLLQSRA PLLPFSLPRL STAAVTPTLI LVFSAEAWDV 
GLNLTNRTTT LFAIGSIIAA AVHLLYVQRL SFPRERSQVI TEHMALVNVT VFCILVVAMM 
GLFVLVGSIM LLIELAVFPP NLMTNWPSLE EPTVGFTDLI RVGGFISTLG VLSGALAGGI 
ENRMALRHLA LFRDHP