Gene Hlac_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0046
Symbol
ID	7401399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	47675
End bp	48769
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	70%
IMG OID	643707105
Product	hypothetical protein
Protein accession	YP_002564722
Protein GI	222478485
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.56451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0146014
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTCA GGTGTCTGCT CGGGCACGAC TTCGGCGAGC CCGAACTACG GCGCGAGCGC 
GAGGAGGACG GGAACGAGGT TGTCACCACC GTCACCGAGG TAAAGACCTG CGCTCGCTGC 
GGCGAGACGC AGGTGGTCAG CGAGAACACT GAGGTCACGA CGATGAAACA GCTGACCGAT 
GAGGCCACCG TCGTGGGCGA CGAGCCGACG GGGCCCGACG CCGATTCGGA CCGCGAGACT 
CCGGTAACCG GCGTCGAGGG GACCGGTCCC GACGGCGATA TCGACGGCGA CGACGCCGTG 
ATCATCGGCA ACAGCCCCGA GGACGGCGAC GACACGGCCG ACATCCCCGC AGAGCCGGGA 
GCGGCCGACG CCAGGACACC GGAGACGAAA CCGGGCGATA CGACCGCGTC GGAGTCGGAA 
ACAGAAGCGG ACGTGGAGGC GGGAGCGGCC GGCGATGACG GCGGGGCAGA GCTGATCGAC 
GAAGGGCCGT CGGGCGCGGG CGACGACGAC AGCAACGGCA GCCTCGAACG CGACGATGGT 
GAGTACGCGG CGTACCCGGA GGCCGAGACG ACGGAGCCGA CCGCCGACGA GGAGCGCGCC 
GAGACCGACG ACGGCGTGAT TCTCGACGAG GAGGGCGAAG ACGCTGACGA CCGCGAGCGC 
GGCGCGTGGC CCGACGTGGA CGAGTCGGAC GAGGGTGGTG AGGAGCCGAC CCCGTGGCCC 
GAACACGGCG GCGAAGACGA GGGGTTCAGC GCCGAGCTAG ACGACGGCAA CACGGGCGAC 
GTGGAGTTCG GCGGGGGGCT CACGCCCGAG GCCGCCGACC AGCCGACCGA CGGTGAGGAC 
GCGGACTACG TCGAGGCACC GGCGCAGACA GCGGTCGAAG CGAACGGTGC GGCCGAGACC 
GGCAGCGCAG TCGACGACGG CGTCGGGATC ACCCGCGGCG ACAGCCCGGA CCTCGAAACG 
TCGACCTCAG AGGTGACGAC AGAGTACTAC TGTCCCGAGT GCGAGATGAC TCGCGCCGCC 
GACGGCAACT CCATGCGCGC GGGCGATATC TGTCCGGAGT GCAAGCGCGG GTACGTCGAC 
GAGCGACCAA TCTAA

Protein sequence

MGLRCLLGHD FGEPELRRER EEDGNEVVTT VTEVKTCARC GETQVVSENT EVTTMKQLTD 
EATVVGDEPT GPDADSDRET PVTGVEGTGP DGDIDGDDAV IIGNSPEDGD DTADIPAEPG 
AADARTPETK PGDTTASESE TEADVEAGAA GDDGGAELID EGPSGAGDDD SNGSLERDDG 
EYAAYPEAET TEPTADEERA ETDDGVILDE EGEDADDRER GAWPDVDESD EGGEEPTPWP 
EHGGEDEGFS AELDDGNTGD VEFGGGLTPE AADQPTDGED ADYVEAPAQT AVEANGAAET 
GSAVDDGVGI TRGDSPDLET STSEVTTEYY CPECEMTRAA DGNSMRAGDI CPECKRGYVD 
ERPI