Gene Acry_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1960
Symbol
ID	5160852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	2150176
End bp	2151018
Gene Length	843 bp
Protein Length	280 aa
Translation table	11
GC content	72%
IMG OID	640553881
Product	HAD family hydrolase
Protein accession	YP_001235080
Protein GI	148260953
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01459] HAD-superfamily class IIA hydrolase, TIGR01459 [TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA [TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCCG ATACGATGAG CGTCGAAACC CTCGCCCATG ATCACGACGG CTTCATCGTC 
GATCTCTGGG GCGTGGTGCA TGACGGCGTG CGCCCCTATC CCGGCGTTCC CGCCTGCCTG 
CGCCACCTGC GCGAGGCCGG CAAGCGCGTC GTCTTCCTCT CCAACGCGCC CCGCCGCACC 
GCGCCGGTCG CCGCCGCCCT GGCCGCGATG GACATCGGCC CCGAGCTATA CGACGGCATC 
ATGACCAGCG GCGAAGCCGT CCGCGCTGCG CTGGTCTCAC GCACCGAGCC CGATTTCGCG 
GCCCTGGGCG ACCGTCTGTT CCATCTCGGC CCGCCGCGTG ACCGCAACCT GTTCGATGAT 
CTCGGCCTCG CCGAGGCCGA CCGCCCCGGC GCCGCCGATT TCCTGCTCAA CACCGGCCCG 
GACGATCTCG CGCCGCCCGA CGATCCCGCC GCCTTCGATC CGTTGCTGCG TGAGGCCCTC 
GGGGCCGGGT TGCCGATGGT CTGCGCCAAC CCGGACCTGG AGGTGATTCG CGACGGGCGC 
CGCATCATCT GTGCCGGCAC GCTCGCCCAG CGCTACGCCG CCTGGGGCGG GCGGGTGATC 
TGGCGGGGCA AGCCCGATCC CGCCGTCTAT CGCCCGACCC TCGACCTGCT CGGCACCGAA 
CCTGGCCGGA CCATCGCGTT CGGAGATTCG CTGCGCACCG ACATCGCCGG CGCGAAGGCG 
GCCGGCATCG CCTCGGTGCT CGTGCTGTCC GGCATCCACG TCGCCACGCC GGCCGAGGCG 
CGGGCCGATT GCGCGGCCGC CGGGCTCGAT CCGCGCGCCA TCATCGGCGG GTTCCGCTGG 
TAA

Protein sequence

MTADTMSVET LAHDHDGFIV DLWGVVHDGV RPYPGVPACL RHLREAGKRV VFLSNAPRRT 
APVAAALAAM DIGPELYDGI MTSGEAVRAA LVSRTEPDFA ALGDRLFHLG PPRDRNLFDD 
LGLAEADRPG AADFLLNTGP DDLAPPDDPA AFDPLLREAL GAGLPMVCAN PDLEVIRDGR 
RIICAGTLAQ RYAAWGGRVI WRGKPDPAVY RPTLDLLGTE PGRTIAFGDS LRTDIAGAKA 
AGIASVLVLS GIHVATPAEA RADCAAAGLD PRAIIGGFRW