Gene Hlac_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2016
Symbol
ID	7402035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2009401
End bp	2010708
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	68%
IMG OID	643709087
Product	Acetamidase/Formamidase
Protein accession	YP_002566664
Protein GI	222480427
COG category	[C] Energy production and conversion
COG ID	[COG2421] Predicted acetamidase/formamidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.62129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACAAC AAGGCGTTCA AGAGGAGCTG TACGTCGACC AGTACACGCT CGGGCTGGTC 
GGTCCCGATC AGGAGTGGGC CGGCACAGTC GCTGACGGCG GAAGGGTGGA GACGTACACG 
CCGCCGGGGT GCTGGGGGCC GATGGTCACG CCGTCGTTCC GCGGCGGCCA CGAGGTGACC 
CGCCCGATCC GCGTCGAGGG CGCCGAGGTC GGCGACGCGA TCGCGATCCA CATCCGCGAC 
GTCGAGGTGA CAAGCATGGC CACCAGCACG GGCTCGATGG CCGAGCGCGA GGGTGCGTTC 
GGCGACGATC CCTTCGTCGA CCACCGCTGT CCCGAGTGCG GGACGACGTG GCCCGACTCC 
ATCGTCGAGG GCACGGGCGA AGACGCGATC CGCTGTGCCG AGTGCGGCGC TAACGCCTCC 
TCGTTCGGCT TCGAGTACGG GTACACCGTC GCGTTCGACC ACGAGAACGC GGTCGGCGTC 
ACCCTCGACA AGGAGGGCGC TCACGAGCTC GCGCTCGACG CCGAGCGCGT GATGGACATC 
CCCGAGAACG CCCGGCAACA CCCGATCCTG CTGTACGAGC CGGACGGGAT GCCCGGCACG 
CTCGGTCGCC TCCGACCCTT CATCGGGAAC ATCGGAACGA CGCCGTCGGT GACGATGCCC 
GATTCGCACA ACGCGGGCGA CTTCGGCCAG AGTCTCATCG GCGCCGACCA CGACTACGGC 
GTCGAGACCG AGGCAGATCT CGAAAAGCGC ACCGACGGCC ACATGGACAT CTCCGAGGTC 
CGTGCGGGTG CCACGCTGAT CTGCCCCGTC GAGATCGACG GCGGCGGGGT GTACGTCGGC 
GACCTCCACG CGAACCAGGG CGACGGCGAG CTCTCCCTCC ACACGACCGA CGTGAGCGGC 
ACCGTCACGA TGGACGTAGA GGTGATCGAG GGCCTCGATA TCGATGGTCC CGTGCTGCTC 
CCGAACGAGG AGGATCTGCC CTTCATCAGC AAGCCCTACA CTGACGCGGA GCGCGAGTCC 
GGCCAGAACC TCGGCGCAGA ACACGGCGTC GACGTCGAGG ACGACATGGC CCCGATTCAG 
GTCGTCGGCT CCGGCGCCAC CGTCAACGAC GCCACGCAGA ACGCCTTCGA CCGCGCCGGG 
AAACTCCTCG ACATGAGCGA GGGCGAGATC CGCGCTCGGT GTACCTTCAC CGGCGGCGTC 
CAGATCGGTC GACTCCCCGG CGTCGTCCAG CTCGATATGC TGGCGCCGCT GGACCTGCTC 
GACGAGCGGG GGCTCGGCGA CGCGACACGG GAGCAGTACG GGCTGTAG

Protein sequence

MSQQGVQEEL YVDQYTLGLV GPDQEWAGTV ADGGRVETYT PPGCWGPMVT PSFRGGHEVT 
RPIRVEGAEV GDAIAIHIRD VEVTSMATST GSMAEREGAF GDDPFVDHRC PECGTTWPDS 
IVEGTGEDAI RCAECGANAS SFGFEYGYTV AFDHENAVGV TLDKEGAHEL ALDAERVMDI 
PENARQHPIL LYEPDGMPGT LGRLRPFIGN IGTTPSVTMP DSHNAGDFGQ SLIGADHDYG 
VETEADLEKR TDGHMDISEV RAGATLICPV EIDGGGVYVG DLHANQGDGE LSLHTTDVSG 
TVTMDVEVIE GLDIDGPVLL PNEEDLPFIS KPYTDAERES GQNLGAEHGV DVEDDMAPIQ 
VVGSGATVND ATQNAFDRAG KLLDMSEGEI RARCTFTGGV QIGRLPGVVQ LDMLAPLDLL 
DERGLGDATR EQYGL