Gene CPF_2102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2102
Symbol
ID	4201194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2334314
End bp	2335441
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	33%
IMG OID	638082967
Product	putative methyltransferase
Protein accession	YP_696531
Protein GI	110799710
COG category	[L] Replication, recombination and repair
COG ID	[COG0116] Predicted N6-adenine-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.486637
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTATA ATTTAATAGC CACTGCAACT TTTGGCTTAG AGGCTGTTGT TGCAAAGGAA 
TTAAAAGAGT TAGGATATGA AGACCTAAAA ACTGAAAACG GAAGAGTTCA TTTTGAAGGG 
GATGAAATGG ATATTGCCAT AACAAACCTT TGGCTTAGAA CTGCAGATAG AGTTTTAATA 
AAAGTGGCTG AATTTAAAGC TGAAAGCTTT GAAGAGTTAT TTAATAAAAC TGTAGAGATT 
GATTGGAGTA AGTATATACC TGTAGATGGT AAGATGCATG TTGTTGGTAA ATCTGTTAAG 
TCAAAACTTT TTAGTGTTCC AGACTGCCAG TCAATAGTAA AAAAAGCCGT AGTTAAGAGT 
ATGAGCAGAA GTTATGGTCA AGATTGGTTC ACAGAAGATG GTCCAGTTTA TAAAATAGAA 
GTTGGACTTT TAAAAGATGT GGTTACCTTA ACAATAGATA CTTCAGGAGA GGGATTACAC 
AAAAGAGGAT ATAGAGAACA CTCAGGGCAA GCTCCCCTTA AGGAAACACT AGCTGCAGCT 
ATGGTTTTAC TTTCAAAGTG GAGAGGAGAG CAAACTCTTA TAGACCCATG TTGTGGATCA 
GGAACAATAT TAATAGAAGC TGCTATGATA GCTAAAAACA TAGCTCCAGG ATTACATAGA 
AAATTTGTTT CTGAAACTTG GCCTTCAATG GATAAGGAAA TTTGGGATCA AGTTAGAGAG 
GGAGCAGAGA AATCTATAAA GAAAATTCCT TTAGATATAA CTGGTTATGA TATAGATAGT 
TGGGTATTAA GTACAGCTAA AAATAACGTA AGAAAAGCAG GATTAACTGA TTGTATAACT 
ATAGAAAAAA GAAACTTTTT TGATTTTTCA ACTAAGAAAA AGTATGGATA TATGATTACA 
AATCCACCAT ATGGTGAGAG AATAGGTGAA AAAGAAATAG TTTCAAAATT AAATAAACAC 
TTTGGAGAAG TTAAAGAGAA GTTAGATACT TGGGATTTTA ATATTCTAAC AGCATGTCCA 
GATTTCCAAA AAGAGTTTGG TAGAAAAGCT ACTAAAAACA GAAAGCTTTA TAATGGTAGA 
CTTTTATGCT ACTACTATCA ATATTTAGAT AATAATTTAA AGAAGTAA

Protein sequence

MDYNLIATAT FGLEAVVAKE LKELGYEDLK TENGRVHFEG DEMDIAITNL WLRTADRVLI 
KVAEFKAESF EELFNKTVEI DWSKYIPVDG KMHVVGKSVK SKLFSVPDCQ SIVKKAVVKS 
MSRSYGQDWF TEDGPVYKIE VGLLKDVVTL TIDTSGEGLH KRGYREHSGQ APLKETLAAA 
MVLLSKWRGE QTLIDPCCGS GTILIEAAMI AKNIAPGLHR KFVSETWPSM DKEIWDQVRE 
GAEKSIKKIP LDITGYDIDS WVLSTAKNNV RKAGLTDCIT IEKRNFFDFS TKKKYGYMIT 
NPPYGERIGE KEIVSKLNKH FGEVKEKLDT WDFNILTACP DFQKEFGRKA TKNRKLYNGR 
LLCYYYQYLD NNLKK