Gene Hlac_1088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1088
Symbol
ID	7400160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1090782
End bp	1092200
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	71%
IMG OID	643708154
Product	MmgE/PrpD family protein
Protein accession	YP_002565753
Protein GI	222479516
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATAC GACACACACG ACAGTGGGAG CGAGCGGTCG CCGAGTTTCT CGCGTCGCCC 
GTCGACGACG TGGCCCGCAA GCACGGACGG GCAGTGGTCG CGGACGTACT GGCGGCCGCC 
GTCGCCGGAT CGGCGGCACC CGGGGTCGCC GGCGTCGCGA GAGACGGTGC GTTCGTCGAC 
GGCAAGGCGT CAATACTCGG GACTGATCGA CGAGTCGCGC CACCGCAGGC CGCCATGACC 
AACGCAGCGG CCGCCATCGC ACAGGAGATC GAGGAGGGGC ACAACACGGG GGGCCACGTC 
GGTGCCGGGA TCGTCGCCGG CGGGCTCGCC GCCGCGGAGG CGAACAACGT CGACGGCGAG 
GCGTTCGTCG ACGCGTGTAC TCGGGCCTAC GATATCTGTG TCCGGCTGGA ACGGGCGATC 
TTCGCGATGA AAGACCGGAT GAACGACGCG ATCCCGTGGC TCGTTCGGAA CCCGCACTCG 
ACGTGGACGA CCGTGGGGCC GGCCGTGACG AGCGCCCTCT GTCTGGACGC GACCCCCGAG 
GAGCTCACGG AGACGTTCCG GATCGCTGCG AACCTCGCGG TGGTCTCGAT GCACGACCCG 
TACGCGGAGG GCGCGCCCGC GCGGAACTTC ACCGCTGGCT TCTCGGCGCA GGCCGGCGTG 
ACCGCAGCGC TGACCGCGCT CGCGGGACTG GAGGGCTCGC GCGCGGCGAT CGAGGAGGTG 
TACGACCCCT TCGAGGAGCT GCTGCCGGAC GGATTCGCCA GCCAGTTCGA GACGCTCGGC 
GAGGAGTGGG CGATCGCGGA ACACTACTTC AAACCGTACC CGTCCTGCCG GTACACCCAC 
CCGCCGCTCG ACGCGCTCCG CGAGGCGATC GACGGGCGGG CGGGAGACGG CAGCGAGCGA 
TCGGGCGACA GGCAGGCGAT CGACCCGGCC GACGTGGAGG CGATCACGGT CAGGACGTTC 
GCCAACGCGA CCGACATGTC TCACGCCGAG CCCGAGACGA TGACCGCCGG GAAGTTCTCC 
GCACCGTACG TGCTGGCGAC GTACCTCTGT CGGGGGAGCG TCGACCTCGA CCACTTCACG 
GCCGAGGCGC TGGCCGACGA GACGGTTCAG TCCGTGGCCG CACGCGTCGA ACTCCGCGAA 
GACGACGGGT ACGAGGCGGC GTTCCCCGAG TCGTGGGGAG CGAGTGTCGT CGTCGAACTG 
CGCGACGGGA CGACTCTGAC CGGTGCGCGC GACTACCCCC GGGGAGACTA CCGCGACCCC 
ATTCCCGACG CGGAGTATCG CGCTCGGAAC CGTGCGCTCC TGGCGCACGG GCTCGGCGGG 
GGGCGGGAAC ATAACGCCCG AGTCGACGAG GCGCTCGACG CCCTCGACGC GGTCGCGGAG 
CGCCCGGTCC GGTCGACGGT CGACACGCTC CGACCGTAA

Protein sequence

MAIRHTRQWE RAVAEFLASP VDDVARKHGR AVVADVLAAA VAGSAAPGVA GVARDGAFVD 
GKASILGTDR RVAPPQAAMT NAAAAIAQEI EEGHNTGGHV GAGIVAGGLA AAEANNVDGE 
AFVDACTRAY DICVRLERAI FAMKDRMNDA IPWLVRNPHS TWTTVGPAVT SALCLDATPE 
ELTETFRIAA NLAVVSMHDP YAEGAPARNF TAGFSAQAGV TAALTALAGL EGSRAAIEEV 
YDPFEELLPD GFASQFETLG EEWAIAEHYF KPYPSCRYTH PPLDALREAI DGRAGDGSER 
SGDRQAIDPA DVEAITVRTF ANATDMSHAE PETMTAGKFS APYVLATYLC RGSVDLDHFT 
AEALADETVQ SVAARVELRE DDGYEAAFPE SWGASVVVEL RDGTTLTGAR DYPRGDYRDP 
IPDAEYRARN RALLAHGLGG GREHNARVDE ALDALDAVAE RPVRSTVDTL RP