Gene Caci_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3037
Symbol
ID	8334388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	3351919
End bp	3353370
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	67%
IMG OID	644956183
Product	C-5 cytosine-specific DNA methylase
Protein accession	YP_003113787
Protein GI	256392223
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0129697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.245214
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCA CTTTTACCGA CATTTTCTGC GGCGCCGGCG GAAGCTCAAC CGGCCTTGTC 
GCTGCGGGCT TCGAGCTGAA GCTGGCGGCA AACCACAGCA AGGTCGCGAT CTCCACGCAC 
GCCGCCAACC ACGGCAACGC CGAGCACGTC TGCGCCGACG TCAACAACTA CGACATGCGG 
CGCCTGCCCA CAACCGACGT GCTGTGGGCA TCGCCGATCT GCACCGAGAT CTCACCCGCC 
GGCGGGCGGG GACGTTCCCG CAAGCTGCTG CCCGGAGAGG AGGCGCTGCT GGAGTACGGC 
CCGGTGGAGA ACGCAGCCTG GGAACGGACC CGCGCCACCG CCTACGACGT CATCCGCGCC 
GCCGAGGTCC ACCGCTACAA GGTCGTGATG TGCGAGAACG TCATGGAGTT CGCCACCGAC 
TGGGAATTGT TCGACTGGTG GTTCAGCGGC ATGGAACGCC TCGGCTACCA GGGGCAGATC 
GTGTCGGTGT CCGCAGCCCA CATCGGCGGC GACGGCAACG AAGCCGCGCC GCAGTGGCGG 
GACCGGATCT ACATCGTGTT CACCCTCAAG GGCATTCCGC TGCCGGACCT GAAGCCGCGT 
CCGCTCGCCT GGTGCCCCGA GTGCGGAACC GATGTCCGAG CCGTACAGGC ATGGCGCAAT 
GGCCGCAAGA TCGGCAAGTA CAAGCAGCAG TACGACTACC GTTGTGAGAA CTCGTCATGC 
CGCCACAGCA TCGTCGAGCC CTACATCAAC CCGGCCGCGT CCATCATCGA CTGGGACAAC 
CTCGGCGAGC GCATCGGCGA CCGCACCAAG CCGCTGGCCG CGTCCACGAT GAAGCGGATC 
GCCGCCGGGC TGGTGAAGTT CCCCGACCGG CGCAGCGTCA TCACCGTCAA CCACTCCGGG 
CACGACGGGC GCGCGTTCCC CGCCGACGAG GGGCCGCTGC CGGTCCGCAG CACGAAGATC 
GGCGAGGGGC TGTTGATCCC GTGCGGCGGC GGCTGGAACA CGACCGCCTC GCCGACGAAC 
GTTCCGATGC GGACCCGGAC GGCCAACCCG AAGGGCTTCG AGGCGCTGGT CGCAACGTCC 
ACGCCGTTCA TCGTCGAGTA CCGCAACCAC GCCGATGCCT CGGCCGTGAC TCAGCCGTTG 
GCGACTGTCA CGTCCGGCGG GAACCACCAC GCGCTGGTGG TGCCGTGCCG CAATGCCTCG 
ACGAAGACGA CGAGCGAGCC GTTCCACACG ATGTCCACGG TGGACTCGGC CGCGCTGGTT 
GGGCCTGCGG TCGACATCAA CGACTGCTGG TTCCGGATGG TGCAGCCGCG CGAGCAGCTG 
TACTCGCAGC GATTCCCGCG CGACTACATC GTCCACGGCA CCAAGGGTGA GCAGACGATG 
CAGGCCGGAA ACGCCGTCGC CTGCAACGTT GCCCAGTGGG TCGGCGAGCG CGTTATGGCG 
GTGCTGTCGT GA

Protein sequence

MTITFTDIFC GAGGSSTGLV AAGFELKLAA NHSKVAISTH AANHGNAEHV CADVNNYDMR 
RLPTTDVLWA SPICTEISPA GGRGRSRKLL PGEEALLEYG PVENAAWERT RATAYDVIRA 
AEVHRYKVVM CENVMEFATD WELFDWWFSG MERLGYQGQI VSVSAAHIGG DGNEAAPQWR 
DRIYIVFTLK GIPLPDLKPR PLAWCPECGT DVRAVQAWRN GRKIGKYKQQ YDYRCENSSC 
RHSIVEPYIN PAASIIDWDN LGERIGDRTK PLAASTMKRI AAGLVKFPDR RSVITVNHSG 
HDGRAFPADE GPLPVRSTKI GEGLLIPCGG GWNTTASPTN VPMRTRTANP KGFEALVATS 
TPFIVEYRNH ADASAVTQPL ATVTSGGNHH ALVVPCRNAS TKTTSEPFHT MSTVDSAALV 
GPAVDINDCW FRMVQPREQL YSQRFPRDYI VHGTKGEQTM QAGNAVACNV AQWVGERVMA 
VLS