Gene Cagg_1446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1446
Symbol
ID	7269278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1775403
End bp	1776863
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	60%
IMG OID	643566289
Product	putative 2-nitropropane dioxygenase
Protein accession	YP_002462789
Protein GI	219848356
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00192568
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.276547
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCCA CCGATTTACC GATGATTATT CAGGGTGGCA TGGGTGCTGC TGTCTCTGAT 
TGGCGGCTAG CACGCGCCGT AGCAGCCTGT GGTCAACTTG GTGTGGTTTC CGGAACCGGG 
ATCGATACCA TTCTTATCCG ACGCTTGCAA GATGGAGACC GAGATGGGGC GATGCGCCGT 
GCGATGGCCC ATTTTCCCAT TCCCGGCGTA GCCGAACGGG TTTTGGAAAC CTACTTCCGC 
CCTAACGGTC GCGAACCAGG CGAGCCGTAT GCGCTGCTAC CGATGTACAA CCTGAAGGTG 
AGCAAGGAAC GACAACAGGT GGCGATGCTA GCAGCGTTTG TTGAGGTGTG GTTGGCCAAA 
GAGGGGCACC AGCGCCCGAT CGGTATGAAT CTGCTGACAA AGATTCAGTT GCCGAATTTG 
GCTTTGCTCT ACGGGGCTTT ATTGGCCGGC GTTGATGTGA TTATTATGGG AGCGGGTATT 
CCGCGCGAGA TCCCGGCTGC ACTTGATGCC TTAGCCGCCA ACCAACCCGC ACGCCTCACC 
GCTGAAATTG AAGGTGACGA TGGAGCACCA CCGACCTATA TTACGTTCGA TCCGGCCGAG 
CATTGGCCGG GCCCACCACC ACCGCTCCGC CGACCGCTCT TTTTGCCGAT TGTCGCCAGT 
GTGACGCTGG CGACGATGTT TGCCCGCAAG ATTGCCGGCG TCGATGGATT GGTGATCGAA 
GGTCCGACGG CAGGAGGTCA CAACGCGCCG CCACGCGGTG AACTCCGTCT TAACGAACGG 
GGTGAACCGG TGTACGGGCC GCGTGATCTG GTCGATCCGA CCAAGATTGC GGCTCTGGGG 
CTGCCTTTCT GGCTGGCAGG GGGGACCGCT TCACCGGAAG GGCTGGCTGC CGCACGGGCT 
GCCGGTGCGA TGGGGATCCA AGTCGGTACG CTGTTTGCCT TTTGTACCGA TTCGGGGCTT 
GACAATACTC TGCGTCGCTC GGTACTCGAC GCAGCAGCCC GTGATGCGGT CGATGTCTTT 
ACCGATCCGC GAGCCTCTCC GACCGGCTAC CCGTTTAAGG TCGTGCGTTG GGACAACGAT 
CCGGCCCAAG GCGTGCCCCG TCAACGTATT TGTGATCTCG GTTATCTACG CTCAATGTAC 
CGCACGCCAA AAGGCACAAT CGGTTATCGC TGCGCCAGTG AGCCGATCGC AACGTTTGTT 
AAGAAGGGGA GCGATCTGGC CGAGACTGAA GGCCGGCGCT GTTTATGCAA TGCACTGATG 
GCAAATATTG GCGTTGGTCA GGCCCGCGCC GATATTGGTG TCGAGCCACC GTTGCTGACG 
AGCGGTGACG ATCTGTTACG CCTGCGCACG ATTTTTGATC TGCGCCGTGG TTACTCGGCG 
GCTGATGTGA TCGCCTATCT CCTTGGTGAG CGCCCGGTGG CGGTGACGAT CCCGCAACAG 
CAGGAGTCGG TGGCCGGATA G

Protein sequence

MRATDLPMII QGGMGAAVSD WRLARAVAAC GQLGVVSGTG IDTILIRRLQ DGDRDGAMRR 
AMAHFPIPGV AERVLETYFR PNGREPGEPY ALLPMYNLKV SKERQQVAML AAFVEVWLAK 
EGHQRPIGMN LLTKIQLPNL ALLYGALLAG VDVIIMGAGI PREIPAALDA LAANQPARLT 
AEIEGDDGAP PTYITFDPAE HWPGPPPPLR RPLFLPIVAS VTLATMFARK IAGVDGLVIE 
GPTAGGHNAP PRGELRLNER GEPVYGPRDL VDPTKIAALG LPFWLAGGTA SPEGLAAARA 
AGAMGIQVGT LFAFCTDSGL DNTLRRSVLD AAARDAVDVF TDPRASPTGY PFKVVRWDND 
PAQGVPRQRI CDLGYLRSMY RTPKGTIGYR CASEPIATFV KKGSDLAETE GRRCLCNALM 
ANIGVGQARA DIGVEPPLLT SGDDLLRLRT IFDLRRGYSA ADVIAYLLGE RPVAVTIPQQ 
QESVAG