Gene Clim_0646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0646
Symbol
ID	6354094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	721905
End bp	723011
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	45%
IMG OID	642668277
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_001942712
Protein GI	189346183
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID	[TIGR01764] DNA binding domain, excisionase family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0000621493
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGC ATTATACAAC AGAAGAGGCC GCTCACTATC TGGGCGTATC TTCAGCAAGA 
ATACGTCAAT ATATTCTTGA AGAGCGCCTC CAGACAGATA AATCCGGCAG AGACCACTTG 
ATTGCCGAGT CTGTTCTTGC TGAATTTGCC AGGTTTGGCA GAAAAAAGGT AGGACGTCCC 
TTCCATGAAT TGTGCAATAC GAATACGGTC ACAGTCGGGT CAGAACGAGC ATCCGCATCA 
AACACTCTTA TCAACAGAGA ACTGCTTGAT GAAGAGGGAG TGCAGGTGAT CAACGGAGAT 
ACCAGGGATA GTATCAAAAG CCTTCCTGAC AACACGTTCA GATGTGTTGT TACATCTCCA 
CCCTATTGGG GTGTGCGAGA TTATGGCGTT GAGAATCAGA TTGGTGCAGA GCCTGACCTT 
AAGGATTATG TAAATGCTCT TGTCGAAATA TTTTCCGAGG TGCGACGAGT GCTCAAATCT 
GACGGAACAT TCTGGCTCAA TATCGGCAAT ACCTATACTT CAGGCGGAAG AAAATGGCGA 
CAGGAAGACT CTAAAAATAA AGGTCGAGCA ATGTCGTACC GGCCGCCTAC GCCTGATGGT 
CTGAAAAAAA AAGACCTTAT CGGCGTAGCA TGGATGGTGG CAATGGCTTG CCAGCTTGAC 
GGATGGTATT TAAGAAATGA CATTATCTGG CACAAGCCGA ATTGCCAACC GGAAAGCGTA 
AAAGACCGCT TAACGGTATC TCATGAGTAC CTCTTCATGT TCTCAAAATC TGAACAGTAC 
TATTTTAATC AGGAGGCAAT CAAGGAGTCG TATACAAACG GAAACGGCTT CAAAAACAAG 
CGGACCGTCT GGTCAATCAA TACCGAACCT TGTGCAGAAG CCCATTTTGC GGTTTTCCCT 
AAAAATCTTG TACGTCCATG CATATTAGCC GGGTCAGAGG AAAACGACCT GATTCTTGAC 
CCTTTCTATG GATCCGGGAC GGTTGGAATT GTATCGATGG AACTCAACAG AAAATGTGTC 
GGTATTGAAA TAAATCAGGA TTATGTTGAC ATAGCAAGCA AACGCAACGC ACGGGTACAA 
GGTGCACTTA TACTGCAGGA ATCGTAA

Protein sequence

MSKHYTTEEA AHYLGVSSAR IRQYILEERL QTDKSGRDHL IAESVLAEFA RFGRKKVGRP 
FHELCNTNTV TVGSERASAS NTLINRELLD EEGVQVINGD TRDSIKSLPD NTFRCVVTSP 
PYWGVRDYGV ENQIGAEPDL KDYVNALVEI FSEVRRVLKS DGTFWLNIGN TYTSGGRKWR 
QEDSKNKGRA MSYRPPTPDG LKKKDLIGVA WMVAMACQLD GWYLRNDIIW HKPNCQPESV 
KDRLTVSHEY LFMFSKSEQY YFNQEAIKES YTNGNGFKNK RTVWSINTEP CAEAHFAVFP 
KNLVRPCILA GSEENDLILD PFYGSGTVGI VSMELNRKCV GIEINQDYVD IASKRNARVQ 
GALILQES