Gene Hlac_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1089
Symbol
ID	7400161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1092273
End bp	1093598
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	73%
IMG OID	643708155
Product	MmgE/PrpD family protein
Protein accession	YP_002565754
Protein GI	222479517
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCTG AGCCCGAACG CGATCTGGCG GCGTTCGCCG CGGAGCTTGA GACGGAAGCG 
ATTCCCGACC GGGTCCGCGA CCGGGCGGGA CTCACAATCG CCGACACGCT CGGCGCAATC 
GTCGCGGGGT CGACCGACGA CGCGGTCGTC GCGCTCGCGC GGCGCTGGAC CGACGGCGTC 
TCCGGCGGGG CGACGGTGCT CGGCGCCGAC GGCGGCGAGA CGGTCCCGCC GCTGGCGGCG 
CTCTGCAACG GCGCGGCGGG CACCGTCCTC GAACTCGACG AGGGGCATCG GTTCGCCGCC 
GGCCACCCGG CGATCCACGT GTTGCCCGCG CTGTTGGCCG ACGCCGAGAT CGGCTACGGC 
GACAGTGACG CGTTCGTGCG CTCGTTCGTC GCGGGCTACG AGGTCGCCGT CCGAACCGCC 
CGCGCGGTCG GGACGCTCGA ATCGGGGTAC CACCCGCACG GCGTGTGGGG GGCGGTCGGC 
GGCGCGGCCG CAGTGGCACG CTCTCGCGGA CTCGACCCGG AGACGACGCG CTCGGCCATG 
GCCATCGCGG CGAACTACGC GCAACACACC CGGTTCGAGG CGGCGACGGA GGGCGCGACC 
GTGCGGAACG TCTACGCCGG CATGAGCAAC CTCGCGGCGC TGGTCGCCGT CGATCAGGCG 
GAAGCCGGGT TCGGCGGCTT GGAGAACGGC GTCGCGCGGC ACCTCGAATC CGCCGCCGAC 
GGGGTCGACG AGGCAGCCCT CTCGGCGGGA CTCGGCGAGC GCTGGGAGCT GGAACACGGC 
TACTTCAAGA TCCACGCCGC GTGTCGGTAC ACCCACCCGA CGCTGGATGC CATCGCGGCC 
CTCCCGGACG GGTTGGATGC GGCCGCGGTG GAGTCGGTCC GCGTCGAGAC GTATCCGGCG 
GCCGCACGGC TGACGGAGTC GCGACCGCAA AACCAACTGC AGGCGAAGTT CTCGATCCCG 
TTCGCGGTCG CGACGGCGCT GCTGCGCGGC GAGACCGGAC CGACCGCGTT CGTGGACGAG 
GCGATAACTT CAGAAGCGAT CGCGCTCGCC GAACGCGTCA CGGTCGCTGT CGACGACGAG 
ATCGCCGCCC GGGCTCCCGA ACAGCGGGGC GCACGGGTGA TCGTCGAGAC GGCGAACGAG 
CGCTTCTCGC GAGAGGTCGT CGCCCCGCGA GGCGGCGAGC ACGACCCGTT CGACGAGGGG 
CGGCTCGAAT CGAAGTTCCG AGAGCTGGTC GCGCCCGTGA TTGGCGCGGA CCGGGCGGCC 
ACGCTCTGGG AGAGCGCCAG GGCGCCGGAG CCGCCGCGCG TGCTCTGTAC GCTCGCCCGG 
CGCTGA

Protein sequence

MPPEPERDLA AFAAELETEA IPDRVRDRAG LTIADTLGAI VAGSTDDAVV ALARRWTDGV 
SGGATVLGAD GGETVPPLAA LCNGAAGTVL ELDEGHRFAA GHPAIHVLPA LLADAEIGYG 
DSDAFVRSFV AGYEVAVRTA RAVGTLESGY HPHGVWGAVG GAAAVARSRG LDPETTRSAM 
AIAANYAQHT RFEAATEGAT VRNVYAGMSN LAALVAVDQA EAGFGGLENG VARHLESAAD 
GVDEAALSAG LGERWELEHG YFKIHAACRY THPTLDAIAA LPDGLDAAAV ESVRVETYPA 
AARLTESRPQ NQLQAKFSIP FAVATALLRG ETGPTAFVDE AITSEAIALA ERVTVAVDDE 
IAARAPEQRG ARVIVETANE RFSREVVAPR GGEHDPFDEG RLESKFRELV APVIGADRAA 
TLWESARAPE PPRVLCTLAR R