Gene Acry_1009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1009
Symbol
ID	5161084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	1119537
End bp	1120574
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	72%
IMG OID	640552926
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_001234145
Protein GI	148260018
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGC TCGATCCGCT CTGGGCCCGC GGCCGCGCCT TCCTCGGCAC CGAGACCGCG 
ATCATGGGCG GCGCCATGAG CTGGGTCAGC GAGCGCCACC TCGTCTCCGC CATCTCCAAT 
GCCGGCGGCT TCGGCGTCAT TGCCTGCGGC TCGATGACCC CCGAACTGCT CGATGCCGAG 
ATCGCCGCGA CCAAGGCGCT CACCACGAAG CCCTTCGGCG TCAACCTGAT CACCATGCAC 
CCGCAGCTGC TGGAGCTGAT CGCGGTCTGC GTCCGCCACG GCGTGGGCCA TGTCGTCCTC 
GCCGGCGGCC TGCCCTCCGC CGCCGCGGTC CGCGCGGTGA AGGAGGGCGG CGCGAAGCTC 
GTCTGCTTCG CCCCCGCCCT GGTGCTCGCC AAGCGGCTCA TCCGCAGCGG CGCCGACGCC 
CTGGTGATCG AGGGCTCCGA GGCCGGCGGC CATATCGGCC CGGTCTCGCT GGCCGTGCTG 
GCGCAGGAAA TCCTGCCCGT CATCACCGAG GTCCCGGTCT TCGTCGCCGG CGGCATCGGC 
CGCGGCGAGG CGATCCTCGC CTTCCTCGAA ATGGGCGCCG CCGGCGTGCA GCTCGGCACC 
CGCTTCGCCG CCTCCGCCGA GAGCATCGCC CACCCCAATT TCAAGGCCGC CTTCCTGAAG 
GCGAACGCGC GAGACGCGAT TCCCTCGGTC CAGCTCGACG CCCGCTTCCC GGTCATCCCG 
GTGCGCGGCC TCGCCAATGC CGGCACCGCC CGCTTCGTCG AGCACCAGGC CGAGACCATC 
CGCCGCTTCC AGGCCGGCGA GCTCGACAAG GAGCAGGCCC AGCTCTCGAT CGAGCATTTC 
TGGGCCGGCG CCCTCCGCCG CGCGGTGATC GAGGGCGATG TCGAGCAGGG CTCGGTGATG 
GCCGGCCAGT CGGTCGGCAT GGTCACCGCG ATCCAGCCGG TGGCCGAGAT CATCGCCGAA 
CTCATCGCCC AGGCCGACGC CGCCTTCGCC GCGCGCGCCA CCGTCCGCCA GCCGGATGCC 
TCGATCGAAG CGGCCTAA

Protein sequence

MSALDPLWAR GRAFLGTETA IMGGAMSWVS ERHLVSAISN AGGFGVIACG SMTPELLDAE 
IAATKALTTK PFGVNLITMH PQLLELIAVC VRHGVGHVVL AGGLPSAAAV RAVKEGGAKL 
VCFAPALVLA KRLIRSGADA LVIEGSEAGG HIGPVSLAVL AQEILPVITE VPVFVAGGIG 
RGEAILAFLE MGAAGVQLGT RFAASAESIA HPNFKAAFLK ANARDAIPSV QLDARFPVIP 
VRGLANAGTA RFVEHQAETI RRFQAGELDK EQAQLSIEHF WAGALRRAVI EGDVEQGSVM 
AGQSVGMVTA IQPVAEIIAE LIAQADAAFA ARATVRQPDA SIEAA