Gene Cag_1628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1628
Symbol
ID	3747936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2126357
End bp	2127436
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	32%
IMG OID	637774167
Product	C-5 cytosine-specific DNA methylase
Protein accession	YP_379924
Protein GI	78189586
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGC AAAATAACAT ATCAGCTATT GACTTATTCT GCGGAATTGG TGGTCTTACC 
TATGGCTTAA AAAAGTCAGG AATACAAGTA AAAGCAGGAA TAGACATTGA TGAATCTTGT 
CGATACAGTT TTGAAGAGAA TTGCGGCACA AAATTTATAA ATAAAGATAT TCAAAAATTA 
CAAAAAGAAG AATTAAATTC TATTTATGGT AATGCTGAAA TAAAAATATT AGTTGGTTGT 
GCCCCTTGTC AACCATTTTC ATCTTATACA TATAAAAAAG ATAAAAACAA AGATAAAAAA 
TGGCAATTGT TATATGATTT TTCTCGACTA ATTAAAGAAA CAAAGCCAGC AATTATATCT 
ATGGAGAATG TTCCTACTTT ATTAAATTTT AAAAAAGCCC CCGTTTTTTA TGATTTTATT 
CAGGAATTAA CAGCTAATAG TTATAAGGTT TGGTTCAATA TAGTTTACTC GCCTGATTAT 
GGCATTCCTC AAAAAAGAAG AAGATTAGTT TTATTAGCTT CAAAATTGGG AGACATAGAA 
CTTCTCCCAC CAACACATAA TCCTGATAAC TATATAACAG TAAAAGATGC TATTGGAAAT 
CTCGAAGCAA TCAAATCAGG AGAAACGTCA CAAAATGATT TTATTCATAA GGCTGCCCAA 
CTCTCTGAAA TAAACCTTTC AAGGATTAAA CAATCAATAC CAGGCGGAAG TTGGAAAAAG 
GACTGGGACG ATGAGTTGAA GTTGGTTTGC CATACCAAAG AAAAAGGAAA AACCTACGTA 
AGTGTTTATG GACGAATGAT GTGGAACGAA CCATCACCAA CAATGACCAC TTTTTGCACC 
GGCATCGGAA ATGGCAGGTT CGGGCATCCT GAACAAAATA GAGCAATTTC TTTAAGAGAA 
GCAGCGATAT TACAAAGTTT TCCTGCAGAT TATAAATTTG CAGAAAATGA AGCGACTTTA 
AAATTTGGTA AAACTTCAAA ACATATTGGA AATGCTGTTC CTCCAAAACT TGGCGAGATA 
ATAGGTAAAA GCATTTTACA ACATTTAGAA AAATACAACT ATGGAAAAGA AAATAAGTAA

Protein sequence

MKMQNNISAI DLFCGIGGLT YGLKKSGIQV KAGIDIDESC RYSFEENCGT KFINKDIQKL 
QKEELNSIYG NAEIKILVGC APCQPFSSYT YKKDKNKDKK WQLLYDFSRL IKETKPAIIS 
MENVPTLLNF KKAPVFYDFI QELTANSYKV WFNIVYSPDY GIPQKRRRLV LLASKLGDIE 
LLPPTHNPDN YITVKDAIGN LEAIKSGETS QNDFIHKAAQ LSEINLSRIK QSIPGGSWKK 
DWDDELKLVC HTKEKGKTYV SVYGRMMWNE PSPTMTTFCT GIGNGRFGHP EQNRAISLRE 
AAILQSFPAD YKFAENEATL KFGKTSKHIG NAVPPKLGEI IGKSILQHLE KYNYGKENK