Gene Clim_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1939
Symbol
ID	6354994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2150148
End bp	2151407
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	51%
IMG OID	642669537
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_001943950
Protein GI	189347421
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGTAG ACAATTTCAG GTTACAATTA GGCGGAAAAG AGTTTATACC GATCGTTATC 
GGCGGTATGG GAGTAAACAT ATCGACAACT GAACTTGCCC TTGCGGCAGA GAAACTCGGA 
GGTGTCGGCC ATATCTCGGA TGCCGAGGTT TGTTACGTCT GCGACCAGAT TTTCAGTACG 
TCATACGTTT CGCGGAAAAG AAAACGGTAC GCCGCCTATA CCAATAATCC CGACAAGTCT 
GCGGTTCTGT TCGATCTTGA AGAGGTTGCC GAAGCCCAGA AAAGATACAT CGAGCACACC 
GTTTCACAGA AAACCGGAAA GGGTGCTGTT TTTCTGAACT GCATGGAAAA ACTGACCATG 
AACAATGCGT CAGAAACCCT CAAGGTAAGA CTTTCCGCCG CTCTGGATGC AGGCATCGAC 
GGCCTGACCC TTGCTGCAGG CCTCAATCTG CGAACGCTCG ATCTCATTCA GGATCATCCC 
AGGTTCCGCG ACGCACAGAT AGGTATTATC ATTTCTTCAG TCCGGGCTCT GGCCATCTTC 
CTGAAACGGG CAGTCCGTCT CAACCGGCTT CCGGATTATA TTATCGTCGA AGGGCCTCTG 
GCCGGAGGAC ATCTGGGATT CGGTCCGCTC GACTGGCATA CCTTCGACCT GAAAACCATC 
GTAACGGAAG TGCTCGACTT CCTGAAAAAA GAAAACCTTG CAATTCCGGT AATTCCGGCA 
GGCGGAATCT TTACCGGTAC GGATGCGGCA GATTACCTCA CCATGGGAGC TTCTGCTGTA 
CAGGTTGCCA CCCGTTTTGC CATTTCAAGG GAGGCTGGCC TGCCTTCACC GGTAAAACAG 
GAATATATCA ATGCCGAAGA GAAAGATATC GTGGTGAACA TGGCATCGAC AACCGGCTAC 
CCGATGCGCA TGCTCGTAAA CTCGCCTACA CTGTCCTACA ACATCAAACC GAACTGCGAA 
GGGCTTGGCT ATCTTCTGGA AAATGGCGGG AAATGCACCT ATATCGATGC GTATTACAAG 
GCGCTCGAAA CGAAACAACC CGGCCAGAAG CTCACTCCTG TCGAAAAAAC ATGCCTCTGC 
ACCGGCATGG CCCGTTACGA CTGCTGGACA TGCGGCCACA TGACCTACCG CCTCAAGGAT 
ACCACGATCA GGCTTTCGGA TGGTTCATGG CTGCTCCCTT CCGCTGAACA TATTTTTCTT 
GACTACCAGT TCAGCAAAGA TCATCAGATC AGATTACCTG AACCGGAGAA AAGCGTATAA

Protein sequence

MIVDNFRLQL GGKEFIPIVI GGMGVNISTT ELALAAEKLG GVGHISDAEV CYVCDQIFST 
SYVSRKRKRY AAYTNNPDKS AVLFDLEEVA EAQKRYIEHT VSQKTGKGAV FLNCMEKLTM 
NNASETLKVR LSAALDAGID GLTLAAGLNL RTLDLIQDHP RFRDAQIGII ISSVRALAIF 
LKRAVRLNRL PDYIIVEGPL AGGHLGFGPL DWHTFDLKTI VTEVLDFLKK ENLAIPVIPA 
GGIFTGTDAA DYLTMGASAV QVATRFAISR EAGLPSPVKQ EYINAEEKDI VVNMASTTGY 
PMRMLVNSPT LSYNIKPNCE GLGYLLENGG KCTYIDAYYK ALETKQPGQK LTPVEKTCLC 
TGMARYDCWT CGHMTYRLKD TTIRLSDGSW LLPSAEHIFL DYQFSKDHQI RLPEPEKSV