Gene Caci_5043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5043
Symbol
ID	8336397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	5787449
End bp	5788486
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	71%
IMG OID	644958142
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_003115744
Protein GI	256394180
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACCAGC CACTGTCCGA CCTCGGAGTC GATCTTCCGA TCATCGCGGC GCCGATGGCC 
GGCGGGCCGA GTACGCCGGC GCTCGTCGTG GCGGCTGCTC GTGCGGGCGG TCTGGGGTTC 
CTGGCGGGCG GCTACAAGAC CGCCGAAGCT CTGGCCGGAC AGATCCGCGA CGTCGGTGCG 
GAGGGCGTGG CGTTCGGCGT CAACGTCTTC GTCCCGAACC CGGTGCCGGT ATCAGAGCAG 
GCATACCGGC GCTACGCCCG CGAGGTGCAG GTCGAGGCCG ACCGCTATGA ACTCACGCTG 
CCGGAGCAGC TGGTCGAGGA TGACGACCAC TGGTCGGACA AGATCGACCT GCTGATCTCC 
TCACCGGTGC CGTGGGTGTC TTTCACGTTC GGAATCCCGG AGCGTGGCGT CATCGACGCG 
CTGCGCCGGG CCGGAAGCGT CGTCTTTCAA TCCGTCACCA CGGCAGATGA AGCACGTCAG 
GCGGCCGCAG TCGGCGTCGA CGCGCTGATC GTGCAGGCAT CGGCCGGGGG CGGTCACTCC 
GCGACGCTCA CGCCAGCGGA GCTGCCAGCC AGCACTGTTT CGCTGCCGGA CCTGATTGCC 
CAAGTCGGCT GCGCCGTCGA CCTCCCCCTC ATCGCCACCG GCGGAATCGC CACCGCCGCC 
GACGTTGCCG CGTCGCTGGA CGCCGGAGCG GTAGCCGCAA TGGTCGGCAC TGTCCTGCTG 
CGGACGAACG AGAGCGGAGC ATCCGCCCCG CACAAGGCGG CGCTCGCCGA CCCGGCTTTC 
GACACCACCG TCATCACCCG CGCCTTCACC GGCCGCCCGG CACGCGCCCT GCGCAACCAT 
TTCACCGACC GCTACGACCC CCTCGCCCCG GCCGGCTACC CCGCCCTGCA CCACCTCACA 
AGCCCGCTCC GCAAAGCTGC CACCGCAGCC GCCGACACCC GCCTGATCCA CCTGTGGGCC 
GGGACCGGCT ACCGCAGCGC CGAGGTCGAG CCGGCCGCTG ACGCCTTCGC GCGACTCGCG 
GGTCAGTCCT CAGCATGA

Protein sequence

MHQPLSDLGV DLPIIAAPMA GGPSTPALVV AAARAGGLGF LAGGYKTAEA LAGQIRDVGA 
EGVAFGVNVF VPNPVPVSEQ AYRRYAREVQ VEADRYELTL PEQLVEDDDH WSDKIDLLIS 
SPVPWVSFTF GIPERGVIDA LRRAGSVVFQ SVTTADEARQ AAAVGVDALI VQASAGGGHS 
ATLTPAELPA STVSLPDLIA QVGCAVDLPL IATGGIATAA DVAASLDAGA VAAMVGTVLL 
RTNESGASAP HKAALADPAF DTTVITRAFT GRPARALRNH FTDRYDPLAP AGYPALHHLT 
SPLRKAATAA ADTRLIHLWA GTGYRSAEVE PAADAFARLA GQSSA