Gene Acel_0883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0883
Symbol
ID	4485715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	975092
End bp	976222
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	63%
IMG OID	639729658
Product	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Protein accession	YP_872642
Protein GI	117928091
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.583201
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACTGGG AGGTGCGGAT GGGTGATGAA TACCCGACCG TGCATGCCGC GGCTGTCCAG 
GCGGCCTCCG TCTTCCTCGA CCGGGAACGG TCGACGCAGA AGGCTTGTCG ACTGATCCGG 
GAGGCGGGTC GCGGAGGCGC TGACATCATT GGTTTTCCGG AGGGATTCAT TCCGGCGCAT 
CCCATCTGGT TTCACTTCCA CCCCGCAACG GGGTCGATCG CGACCGAGCT GAGCGTCGAA 
TTATTCAAGA ACGCCGTTGA AATCCCGGGA CCGGAGGTAG TCGAGCTGCA GCGGGCAGCG 
GCTGATGCCC GCGCCTACGT TGTCGTTGGC GTCTGCGAGA AACGCCCCAA TACGTTCGGC 
ACGCTGTACA ACAGCCAACT GTTCATCGGA CCGGACGGTA CACTTCTTGG CTGCCGCCGT 
AAGATCACGC CCACCGTGGG AGAGCGTCTC GTGCACACCG GCGGCAGCGG GGACGGTTTG 
TCGGTGTTCC GGACGGATTT CGGGCCGGCG AGTGCACTCA TCTGCGGAGA GAACTCCAAT 
CCGCTGGCCA TTTTTGCGCT GACCGCGCAA TACACCCAGG TGCACGTCAT GAGCTGGCCG 
TGTCACTTTC CGACAACCGG CGCCCCGATG CGCGACCGGG TCTCGGTGGA TTCCCGGGCC 
TTCGCTCAGA TGACCAAGGC ATACGTCATG AGCTGCTGTG GAACAGTCGA CGAGACCGCT 
CTCGCGAAGC TTCGTCTCAG CCCGGACGAC GAGGAACTCA TCCGCCGCCC CGACTTTTGC 
GGCGGATCCC TCATCGTCGC ACCGGATGGT CGGGTGATTG CCGGACCACT CGGCAACGAG 
GAAGCCATCC TCTACGCGGA TTTGGATCTG GAACTCGGGA TTCGGATGAA ATTGCGTCAC 
GATTTCGCCG GGCATTACAA CCGCCCGGAC ATTTTTGAGC TTCGGATCCG CACTGCGGAG 
CCTCGACTGC TCACCGTCCG GGACACTGCC GAAAATCCGG TTCTCGAACA GGTCGAGGGC 
CCTGCGCGGG CCGAACAAGT TTCTGCACCG GTGCGGTTCG CCGTCGAGCA GGGCGGCCTG 
CCGAGCCTAA CCGGTGGTCT CGGGGTAGAC GTTGGCGGTG AGCAGCACTA G

Protein sequence

MNWEVRMGDE YPTVHAAAVQ AASVFLDRER STQKACRLIR EAGRGGADII GFPEGFIPAH 
PIWFHFHPAT GSIATELSVE LFKNAVEIPG PEVVELQRAA ADARAYVVVG VCEKRPNTFG 
TLYNSQLFIG PDGTLLGCRR KITPTVGERL VHTGGSGDGL SVFRTDFGPA SALICGENSN 
PLAIFALTAQ YTQVHVMSWP CHFPTTGAPM RDRVSVDSRA FAQMTKAYVM SCCGTVDETA 
LAKLRLSPDD EELIRRPDFC GGSLIVAPDG RVIAGPLGNE EAILYADLDL ELGIRMKLRH 
DFAGHYNRPD IFELRIRTAE PRLLTVRDTA ENPVLEQVEG PARAEQVSAP VRFAVEQGGL 
PSLTGGLGVD VGGEQH