Gene Hlac_1639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1639
Symbol
ID	7399588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1660291
End bp	1661412
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	72%
IMG OID	643708705
Product	hypothetical protein
Protein accession	YP_002566294
Protein GI	222480057
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.264137
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGATC TCGCCGCCCG CACCGAGAGG CTCGACGCGT ATCTCGACGA GCGCGGGCTC 
GAAGCGGTCT GGTTCGCCAA GCCGAACGGG TTCGCGTGGC TCACCGGCGG CGACAACGTC 
GTCGACGCCG ACGCCGACTT CGGGGTCGGG GCCGCCGGCT ACGACGGCGA TCTCCGGGTG 
ATCACAGACG ACATCGAGGC GGACCGCCTC GCCGACGAGG AGCTCCCCGA CGCCGTCGCC 
GTCGAGTCGT TCCCGTGGCA CGCGAACTCG CTGGCTGAGG CGGTCACTGA GCGCTCTCCC 
GCGCCAGCGG CCGCCGACTT CGACGTACCG GGCTTCGAGC GCGTCGACGG GAGCCGGCTT 
CGGCAGCCCC TCACCGACGA TGATGTCGAG CGCTACCGCG AACTCGGTCG GGAGGCCGCC 
GCCGCCGTCG AGACCGTCTG CCGCAACCTC GAACCTGAGG ACCCGGAGTA CGAAGTGGCC 
GCCGGCATCG ACATCTCGCT CGCGTCCCGC GACGTCGACA CCCCGGTCGT GCTCGTCGGC 
GGCGCTGAGC GCGCCCAGCG CTACCGCCAC TACACCCCGA GTGACGCGAC GCTCGGCGAC 
TACGCGCTCG TGTCCGTCAC CGCCGAGCGG GCCGGCCTCT ACGCCTCGCT CACCCGAACC 
GTCGCGTTCG ACGCCCCCGA CTGGCTAGAG GAGCGCCATC GCGCGGCCGC GCGCGTCGAG 
GCAACCGCGC TCGCCGCGAC CGAGGCCGCC GCGGCCGGAG AGCTAACGGG CTCCGATGGC 
CCGGACACCG CCGGCGACGT GTTCGATACG ATCCGAACAG CGTACGACGC CGTCGGCTTC 
GCCGGAGAGT GGCGCGAGCA CCACCAGGGC GGCGCGGCGG GCTTTGCGGG CCGCGAGTGG 
ATCGCGACAC CCGAGAGCAA CGAGCCGGTT CGGTGGCCCA TGGGCTACGC GTGGAACCCC 
ACCGTACAGG GAGCCAAAAG CGAGGACACC CACCTCGTGG CGCCCGACCG GACCGAGACG 
CTGACGAAGA CCGGGCAGTG GCCGACACAC GAGGTTGAAC CGGTCGACAT CGAGGGAGTC 
GCGACGGAGC CGCGAGAGCT GTCCGCACCG GTCATTCGGT AG

Protein sequence

MVDLAARTER LDAYLDERGL EAVWFAKPNG FAWLTGGDNV VDADADFGVG AAGYDGDLRV 
ITDDIEADRL ADEELPDAVA VESFPWHANS LAEAVTERSP APAAADFDVP GFERVDGSRL 
RQPLTDDDVE RYRELGREAA AAVETVCRNL EPEDPEYEVA AGIDISLASR DVDTPVVLVG 
GAERAQRYRH YTPSDATLGD YALVSVTAER AGLYASLTRT VAFDAPDWLE ERHRAAARVE 
ATALAATEAA AAGELTGSDG PDTAGDVFDT IRTAYDAVGF AGEWREHHQG GAAGFAGREW 
IATPESNEPV RWPMGYAWNP TVQGAKSEDT HLVAPDRTET LTKTGQWPTH EVEPVDIEGV 
ATEPRELSAP VIR