Gene Clim_0054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0054
Symbol
ID	6355577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	60329
End bp	61579
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	52%
IMG OID	642667678
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_001942140
Protein GI	189345611
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.549481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTGC TGCCTGACAG TTCGGTTCAC CTTGTCATTA CCTCTCCTCC CTACTGGCAG 
CTCAAGGACT ACGGGACGGA GAACCAGATC GGATTTCACG ACAGCTATGA GAGCTACATC 
AACAATCTGA ATCTTGTCTG GAGCGAGTGC GAACGGGTGC TGCATCCCGG CTGCAGGCTC 
TGCATCAACA TCGGCGACCA GTTCGCCCGT TCGGTGTATT ACGGCCGGTA CAAGGTTATC 
CCGATCCGGA CGGAGATCAT CAGGTTCTGC GAGACTATCG GTTTCGACTA CATGGGCGCG 
GTGATCTGGC AGAAGGTGAC CACAACCAAC ACCACTGGCG GGGCATCCAT TATGGGAAGC 
TTCCCGTATC CGCGCAACGG CATTCTCAAG CTCGATTATG AGTTCATTCT CCTGTTCAAA 
AAGCCGGGAG ATGCGCCCAA GCCGGCAAAA GAGCAGAAAG AGCGCTCCGC CATGAGCACC 
GAAGAGTGGA ACACCTGTTT CTCCGGACAC TGGAACTTTG CCGGAGCAAA GCAGGATGGC 
CACATCGCCG TGTTTCCGGA AGAGCTTCCG CATCGCCTGA TCAGGATGTT CGCATTCAGC 
GGAGAAACGG TGCTCGATCC GTTCATGGGC AGCGGGACTA CCAGTCTTGC GGCAAAAAAC 
CTCGACAGGA ACTCGGTCGG CTACGAAATC AATCCCGAGT TTATCGGAAT AGCAAAAGAG 
AAACTCCGTG CCAACCAGAC GGACTTTGCC GGAACGGAGT ATATTTTTCA GCACGATGTC 
CTGAAGGGGG ATATTTCCGA AATGATCGAG CGTCTTCCTT ATCGTTTTCA AGACCCCCAC 
AAACTCGACA AGAAAATCGA CCCACGAAAG CTGACGTTCG GATCAAGAGT AGAAAAGGGT 
AGCGGGGCAA AACAGGAAGA GACGTTTATC GTCAGGGAGA TTCTAAGCCC CGAGATGGTC 
AGATTGTCCA ACGGCCTGAC GGTGAGGCTG ATCGGAGTGA AGGAAGAACC TTTTACGCGG 
GAAAAAGCTG TCGGGTATCT CGTTGACAAG ATCAAGGGAA AACGGATTTT CATGAAGTAC 
GACAGCATGA AATACGATGG GGGGGACAAT TTGCTCTGTT ACCTCTATCT GGAAAACAAG 
ACGTTTGTCA ACGCGCATCT GATCAAGAGC GGTTTAGTCG GGATTGACGG CAGCTACGAT 
TATAAATACC GGAGCAAATT TCAAACTTTT TCCGAACAGG TCAATGGCTA A

Protein sequence

MNLLPDSSVH LVITSPPYWQ LKDYGTENQI GFHDSYESYI NNLNLVWSEC ERVLHPGCRL 
CINIGDQFAR SVYYGRYKVI PIRTEIIRFC ETIGFDYMGA VIWQKVTTTN TTGGASIMGS 
FPYPRNGILK LDYEFILLFK KPGDAPKPAK EQKERSAMST EEWNTCFSGH WNFAGAKQDG 
HIAVFPEELP HRLIRMFAFS GETVLDPFMG SGTTSLAAKN LDRNSVGYEI NPEFIGIAKE 
KLRANQTDFA GTEYIFQHDV LKGDISEMIE RLPYRFQDPH KLDKKIDPRK LTFGSRVEKG 
SGAKQEETFI VREILSPEMV RLSNGLTVRL IGVKEEPFTR EKAVGYLVDK IKGKRIFMKY 
DSMKYDGGDN LLCYLYLENK TFVNAHLIKS GLVGIDGSYD YKYRSKFQTF SEQVNG