Gene Acry_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1042
Symbol
ID	5160427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	1160734
End bp	1161684
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	71%
IMG OID	640552960
Product	proline iminopeptidase
Protein accession	YP_001234177
Protein GI	148260050
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCGGG GTGACCTGTT CCCCGAGGTC GGCCCGTATC AGACGGGGTA TCTGCCGGTC 
GGCGACGGGC ATGTGATCTA CTGGGAGCAG GTGGGCAACC CGCGCGGGCG GCCGGTGCTG 
TTCCTGCATG GTGGGCCGGG CGCCGGCGCG GGCGCGGTGC ACCGGCGCTT CTTCGACCCG 
GCATTCTGGC GCGTGGTGAT CTTCGACCAG CGCGGCGCCG GGCGCTCGAC GCCGCTGGGC 
AGCCTCGCGC GCAACACGAC GCCGGCGCTG ATCGAGGATA TCGAGGCGCT GCGCGAGCAT 
CTCGGCATCA GGCAGTTCCT GCTGTTCGGC GGTTCCTGGG GATCGACCCT CGCGCTGGCC 
TATGCCCAGG CGCATCCCGA GCGGGTGATG GGCATGGTGC TGCGCGGCAT CTTCCTCGGC 
CGGCCGAGCG AGGTGGAATG GTTCCTCGAA GGAATCGCCC GCTTCTTCCC CGATGCGCAC 
GCGGCGCTGG TGAACTTCCT GCCCGAGGCG GAGCGGGGCG ATCTGCTGGG GAGCTATTTC 
CGCCGGCTCT GCGACCCCGA TCCGGCCATT CACCTGCCGG CGGCGCAGGC CTGGTCGGTC 
TATGAGGGAT CGTGCTCGAC GCTGCTGCCG AGCTACGAGA CGGTGAGCGC CTTCGCGCAG 
GACCGCACCT CGCTCGGGCT CGCGCGGATC GAGGCGTATT ACTTCCTGAA CAACCTGTTC 
CTGCCGCCGG ACGGGCTGCT GGCCGGGATG GGACGGCTGG CCGGGGTGCC GGGCGAGATC 
GTGCAGGGGC GATACGACAT GATCTGCCCG CCGAATTCCG CCTTCGACCT CGCCGACGCC 
TGGCCCGCCG CGCGGCTGAC GGTGGTGCCG GATGCCGGGC ACTCGGCGCT GGAGCCGGGC 
ATTCGCGCGG CCCTGCTGGC CGGGCTGGAG CGGATCCGCA ACCTGACCTG A

Protein sequence

MPRGDLFPEV GPYQTGYLPV GDGHVIYWEQ VGNPRGRPVL FLHGGPGAGA GAVHRRFFDP 
AFWRVVIFDQ RGAGRSTPLG SLARNTTPAL IEDIEALREH LGIRQFLLFG GSWGSTLALA 
YAQAHPERVM GMVLRGIFLG RPSEVEWFLE GIARFFPDAH AALVNFLPEA ERGDLLGSYF 
RRLCDPDPAI HLPAAQAWSV YEGSCSTLLP SYETVSAFAQ DRTSLGLARI EAYYFLNNLF 
LPPDGLLAGM GRLAGVPGEI VQGRYDMICP PNSAFDLADA WPAARLTVVP DAGHSALEPG 
IRAALLAGLE RIRNLT