Gene Acry_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1148
Symbol
ID	5160076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	1278571
End bp	1280031
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	70%
IMG OID	640553062
Product	amidohydrolase
Protein accession	YP_001234279
Protein GI	148260152
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.318929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGATCC CGCCCAGCCC CGGCCGTCTC GCCATCCGCG CTCAGTTGCT CGGCTACGAC 
GGCAATCCCT TCGTGTCGGA TCCCGCGGAC TGCGTGCGGC ATGAGAGCGA CGGGCTGATC 
CTCGTCGCGG ACGGGCGGAT CTCCCATGTC GGTCCCTACG TCGCCGATCT CGTGCCCGAG 
GGCGTCGAAC TGCATGAGTA TCGCGATGCG CTGCTGATGC CGGGCTTCAT CGACGCCCAT 
GTCCATTACG CGCAGACGCC GATGATCGGC GCCTATGGCA AGCAGCTGCT CGACTGGCTG 
GAGACCTATG TCTTTCCCGT CGAGCAGCGC TATGCCGATC CCGATTTTGC CCGCGCCATG 
GCCCGGCTCT TCTTCGCGCA GGAACTTGCC GCCGGCGTGA CCACCACGCT GTCCTACTGC 
ACGGTTCATC CCGGCTCGGT CGACGCCTAT TTCGAGGAAG CGGCAAGGCT CGGCCTGCGC 
GCCGGCGCCG GCAAGGTCCT GATGGACCGC AACGCGCCCG AGCCGCTGCG CGACACCGCA 
CAGCGCGGGT ACGACGACTC CAGGCGCCTG ATCGACCGCT GGCATGGCCG CGGCCGGCTG 
TTCTACGCCG TCACCCCGCG TTTCGCGCCG ACCAGCACGC CGGCCCAGCT TGAGGCGGCC 
GGCGCGCTGT TCGCCGAGAC CGACGGCGTG TGCATGCAGA CCCACCTCTC CGAAAACCTC 
GCGGAGCTTG ATTGGGTGCG CGCCCTGTTC CCCGATGCCC TGGACTACCT CGATGTCTAT 
GATCGCGCGG GGCTGGTGGG TCCGCGCAGC CTGTTCGGCC ATGCCATCCA TCTTTCACCC 
CGCGAATGGG ACCGTCTCGC CGGGGCGGGC GCCGCCGTCG TTCACTGCCC CACCTCGAAC 
CTGTTCCTCG GCTCCGGCCT GTTCGACCTG CGCCGGGCGC TGATCGCCGG CAATCCGGTC 
CGCACCGCGC TGGGGTCGGA TATCGGCGCC GGAACCAGCT TCTCGCCGCT CGCGACGCTG 
AACGAGGCGT ACAAGGTCGC GGCCCTGCGG GGCGAGGCGC TCTCCGCCCA CCGGGCCTTC 
TACCTCGCGA CCCTCGGCTC GGCGCGAGCC CTGTACATGG ACGACAGGAT CGGTCGCCTC 
GCGCCGGGGT ACGAAGCCGA TTTCGCGGTG CTCGACCTCG CCGCCACGCC CCTCCTGCGC 
GAGCGTCTGC GTTTCGCCGA CACGCTGGAG GAGGCGCTGT TCGTGCTGAT GACGCTGGGC 
GGTGCGGGAT GCGTTCGGGC AACCTACGCG GCGGGCCGCC TCGTGCACGA CCGCACCCGG 
CCCGATGCGT CAGCTCAGGC GGGCGAGGGC TGTTGCGACA CCGTCGCCGT AGGCCGGATC 
GGCGCGGCGG CAATTGGCGA CGTGCCGCTC CTGGATGTGC CGCGAGGCAT CGCCGAGCGC 
GCGGGCGGTG TTGTCGAATA G

Protein sequence

MMIPPSPGRL AIRAQLLGYD GNPFVSDPAD CVRHESDGLI LVADGRISHV GPYVADLVPE 
GVELHEYRDA LLMPGFIDAH VHYAQTPMIG AYGKQLLDWL ETYVFPVEQR YADPDFARAM 
ARLFFAQELA AGVTTTLSYC TVHPGSVDAY FEEAARLGLR AGAGKVLMDR NAPEPLRDTA 
QRGYDDSRRL IDRWHGRGRL FYAVTPRFAP TSTPAQLEAA GALFAETDGV CMQTHLSENL 
AELDWVRALF PDALDYLDVY DRAGLVGPRS LFGHAIHLSP REWDRLAGAG AAVVHCPTSN 
LFLGSGLFDL RRALIAGNPV RTALGSDIGA GTSFSPLATL NEAYKVAALR GEALSAHRAF 
YLATLGSARA LYMDDRIGRL APGYEADFAV LDLAATPLLR ERLRFADTLE EALFVLMTLG 
GAGCVRATYA AGRLVHDRTR PDASAQAGEG CCDTVAVGRI GAAAIGDVPL LDVPRGIAER 
AGGVVE