Gene Cpha266_0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0073
Symbol
ID	4568811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	83897
End bp	85186
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	52%
IMG OID	639764675
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_910567
Protein GI	119355923
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTGC TGCCGGACAG TTCGGTGCAT CTTATCATTA CCTCTCCCCC CTATTGGCAG 
CTCAAGGACT ACGGGACGGA GAACCAGATC GGATTTCACG ACAGCTATGA GAGCTACATC 
AACAATCTGA ACCTTGTCTG GAGCGAGTGC GAGCGGGTGC TGCATCCCGG CTGCAGGCTC 
TGCATCAACA TCGGCGACCA GTTCGCCCGT TCGGTGTATT ACGGACGGTA CAAGGTTATC 
CCGATCCGGA CGGAGATCAT CAGGTTCTGC GAGACTATCG GTTTCGACTA TATGGGCGCG 
GTGATCTGGC AGAAGGTGAC GACAACCAAC ACCACCGGAG GCGCTTCCAT TATGGGAAGC 
TTTCCGTATC CGCGCAACGG CATTCTCAAG CTCGATTATG AGTTCATTCT TCTGTTCAAA 
AAACAGGGAG ATGCCCCGAA GCCGTCAAAA GAGCTGAAAG AGCGCTCAGC CATGACCACC 
GAAGAGTGGA ACACCTGTTT CTCCGGACAC TGGAACTTTG CCGGAGCAAA ACAGGATGGC 
CATATCGCCG TGTTTCCGGA AGATCTGCCG CATCGCCTGA TCAGGATGTT CGCTTTCGTC 
GGCGAAACGG TGCTCGATCC GTTCATGGGC AGCGGGACGA CCAGTCTTGC GGCAAAAAAC 
CTCGACAGGA ACTCGGTCGG CTACGAAATC AATCCCGAGT TTATCGGGAT AGCAAGAGAG 
AAACTCAATT CCAACCAGAC GGACTTTGCC GGAACGGAGT ATGTTTTTCA GCACGATACC 
CTGAAGGGGG ATATTTCCGA AATGATCGAG CGTCTTCCTT ATCGTTTTCA AGACCCCCAC 
AAACTCGACA AGAAAATCGA CCCGCGAAAG CTGACGTTCG GTTCAAGAGT AGAAAAGGGT 
GGCGGGGCAA AACAGGAAGA GACGTTTATC GTCAGGGAGA TTCTAAGCCC CGAGATGGTC 
AGATTGTCCA ACGGCCTGAC GGTGAGGCTG ATCGGAGTGA AGGAAGACCC TTTCACGCGG 
GAAAAAGCTG TCGGGTATCT CGTTGACAAG ATCAAGGGAA AACGGATTTT CATGAAGTAC 
GACAGCATGA AATACGATGG GCGGAACAAT CTGCTCTGTT ACCTCTATCT GGAAAACAGG 
ACATTTGTCA ACGCGCATCT GATCAGGAGT GGTTTAGTAG GGATTGACGG CAGCTACGAG 
TACAGGTACA AACAGAAATT CCTGGCTTTT TCTGATGAGA ACAGCACACT TGTTCAAACA 
GGTCGGTGGT CTGGAATTGC TGCAAAGTGA

Protein sequence

MNLLPDSSVH LIITSPPYWQ LKDYGTENQI GFHDSYESYI NNLNLVWSEC ERVLHPGCRL 
CINIGDQFAR SVYYGRYKVI PIRTEIIRFC ETIGFDYMGA VIWQKVTTTN TTGGASIMGS 
FPYPRNGILK LDYEFILLFK KQGDAPKPSK ELKERSAMTT EEWNTCFSGH WNFAGAKQDG 
HIAVFPEDLP HRLIRMFAFV GETVLDPFMG SGTTSLAAKN LDRNSVGYEI NPEFIGIARE 
KLNSNQTDFA GTEYVFQHDT LKGDISEMIE RLPYRFQDPH KLDKKIDPRK LTFGSRVEKG 
GGAKQEETFI VREILSPEMV RLSNGLTVRL IGVKEDPFTR EKAVGYLVDK IKGKRIFMKY 
DSMKYDGRNN LLCYLYLENR TFVNAHLIRS GLVGIDGSYE YRYKQKFLAF SDENSTLVQT 
GRWSGIAAK