Gene Hlac_1051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1051
Symbol
ID	7400123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1045437
End bp	1046618
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	66%
IMG OID	643708119
Product	creatinase
Protein accession	YP_002565718
Protein GI	222479481
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACGAG AACACATCTT CGACGAGGCC GAGTACGAGC GGCGGGTGGC TCGGACGAAA 
GAGCGGTTGC GCGAGCAGAA CCTCGACGCG ATCGTGGTCG CCGATCCGGC GAACATGAAC 
TACCTGACCG GCTACGACGG CTGGTCTTTC TACGTCCATC AGGCGGTCGT GGTCACGCCC 
GATCGCGACG AGCCGATATG GATCGGTCGC GACATGGACG GCGACGGCGC GCGGGCGACG 
ACGCACCTCT CCGACGACAG CATCCGCGCG TACAGCGACG ACCACGTTCA CTCACCGCAC 
GACCTCCACC CGATGGACTA CGTCGCCGGC GTTCTCGAAG AGTTAGATGT CGCGGACGGC 
CGGATCGGAT TGGAGATGGA CGCCGCCTAC TTCACCGCGA AGTCGTACAT GCGACTCCAG 
CAGAACCTCC CGGACGCCGA GTTCGAGGAC GCGACGCTGC TCGTCGGCTG GATCCGTGTC 
AAGAAGTCGG ACCAAGAGCT GGAGTACATG GAGCAGGCCG CGCGGATCTC CGAGAACGCG 
ATGCGTGCCG GCCTCGACGC CATTGAGGAA GGAGTCCCGG AGTACGAGGT CGCCGCTGCG 
ATCTACGAGC AGTTGATCGA GGGGACAGAG GAGTACGGCG GCGACTACCC CGCGATCGTC 
CCGCTAATGC CGTCGGGCGA TCACACCGGG ACGCCACACC TCACGTGGAC GGATCGACCG 
TTCGAGGAGG GCGACCCGGT CATCATCGAA CTCTCCGGCT GTCGGCACCG CTACCACTCG 
CCGCTGGCCC GAACGACCTT CGTCGGCGAC CCGCCGGCCG AGCTGCAGGA GACCGCGGAC 
ATCGTCGTCG AGGGGTTGGA GGCGGCGCTC GACGCCGCGG AGCCCGGCGT CAAATGCGAG 
AGCGTCGAGA AGGCGTGGCG GACCACCATC GAGCAGTACG GGCTCGAAAA GGAGGATCGC 
ATCGGGTACT CGATGGGGCT CGGCTACCCG CCGGACTGGG GCGAGCACAC CGCGAGCATC 
CGGCCGGGCG ACGAGACCGT CCTCGAAGAG GACATGACGT TCCACATGAT CCCGGGCATC 
TGGACCGACG AAATCGGCAT GGAGATCAGC GAGACGTTCC ACGTCACGTC TACCGGGGCG 
GAGACGCTGG CCGAGTTCCC TCGCGAGCTG TTCACGGCCT GA

Protein sequence

MPREHIFDEA EYERRVARTK ERLREQNLDA IVVADPANMN YLTGYDGWSF YVHQAVVVTP 
DRDEPIWIGR DMDGDGARAT THLSDDSIRA YSDDHVHSPH DLHPMDYVAG VLEELDVADG 
RIGLEMDAAY FTAKSYMRLQ QNLPDAEFED ATLLVGWIRV KKSDQELEYM EQAARISENA 
MRAGLDAIEE GVPEYEVAAA IYEQLIEGTE EYGGDYPAIV PLMPSGDHTG TPHLTWTDRP 
FEEGDPVIIE LSGCRHRYHS PLARTTFVGD PPAELQETAD IVVEGLEAAL DAAEPGVKCE 
SVEKAWRTTI EQYGLEKEDR IGYSMGLGYP PDWGEHTASI RPGDETVLEE DMTFHMIPGI 
WTDEIGMEIS ETFHVTSTGA ETLAEFPREL FTA