Gene CPF_2603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2603
Symbol
ID	4201041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	2869990
End bp	2871759
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	25%
IMG OID	638083470
Product	putative resolvase
Protein accession	YP_696993
Protein GI	110799073
COG category	[L] Replication, recombination and repair
COG ID	[COG1961] Site-specific recombinases, DNA invertase Pin homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00221459
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAATA AAGTTATAAA TGATTCACAA AACTATGCTG TTATATATGC AAGAATATCT 
TCTAAAAATG AAAACAACTC TATAAATGCA CAAATTAAAC TTGGAGAAGA TGTTATAAAT 
AAAAACAACC TACTACTTCA TGACACTTAT ATAGATAAAA TATCTGGAAA AACCACATCT 
CCTAAAGAAA GAAAAGGCTT TTCTAGACTT TTAGAAGATG CTAAAGCAGG TTTATTTAAG 
ACAATAGTTA TATACAGACT AGATAGATTA GTTAGAAGAT ATGATGATTG GATTGAAACA 
AAAAAAATCC TTAATAAACT AGGCATTAAA ATATTGTTTT CTGATACAAA CCAAGCATTA 
TTAGAGAATT CTCCACAATC TGAATTCTTT CAAAACTTTT CTGTAATGAT AGCAGAAATG 
GAGCCAGATA CAATAAGCTT ACGCGCAAGT CAAGGTAGAA TATTTAGAAG AAAGAGCGGT 
GCATATACTT CTCCTAAAGC TCCATTTGGA TATATAAAAC AAGAATCTAA TGACAGAAGA 
AAATCAAAAT CTATATTTAT TCAAGAGCCT ATAAAATTAG CATTTATTAA ATATATATTT 
TTTGTTTTTC ACCGTTTAAT TATTGAAGAA AAAAGAAGTG ATAGTTCTAA CCCCCAAGCT 
TCTATTAATA CACTCTATAA TTCACTACAA AATACATTGG AGCATATAGA GGCAAATATT 
GATTTAAGAG ATATTCCTCT TAGAAACAAT ACTAAATATG CATCTTTAGA AGCCGAACTT 
TTTGGTGTAA TTAATAAATA TATTGAAAAC ACTGATTTAA AATCTGTCAA AAAAGAAATA 
AGTGAAGTTA AATTTTATTA TTTATTTTCT AAAGGAAATA CTACTAAAAA AAATTCTGCT 
TATTTAAGTG CCTGTTTAAG AAACCCTGTA TATGCAGGTT GTATTTTACT AGACTCTAAT 
CATCCATTCA AAGGTTTGTC ATTCTCAACT GATGAAAAGA CTGGTATTAC TAGTTTTAAA 
GAGCGTTTGG ATTCTGAAGC CTTTGTTAAT ACAAACAATT TAGTAGGCAT AATTCCTTCA 
TCTATTTTTA AAACAGTATA TTCTTATTTA ACTTATAAAA GTTTAATTAA AATTGATAGA 
ACTCCTAACT TTTTGCTTAA AGGAAGCCTA ATATGTTCTA AATGTAATAA AAAGCTAAAA 
TTAATTGATG ATAACTATCT ATCATGTAAA GGAACTAGAT GTCATCCATT CCTAAAATAT 
GACTTATTAA AATTTATTAT TGATAAAATT ATAGATAATT GTTTATCTAT AAGTCAAACA 
CCACTAGAAC AATTTATTAA TAAACTCTCT AGGAAGATTG AAATTAAAAA TCAAAATATT 
AAATATCAAA CTTTAAATAA ATATGAAGCT ATTTATAACT ATCTATCTTC AAATGATTCA 
TCTTATGTTG ATAAGATACA TCAAAAGGAT ATTGCAATAA AATCCTATGT TAGTTCATGT 
AATAAATATA GAACTAAGCT TTCTTATTTA AATCAATTAT TTGATGAAGT TAACAAAATA 
AATAAAAAGT ATAGTTCTAA ACCTCAATTA GAAAATAATA GTGTTCTATT AAAACAAGTA 
AAAGAAAAGA TAGTTAATCA TATTATGAAT AATGAAGAAT TTTTTGTTCC TATATTTAGT 
GAAATTATTA AAGAAATAAA GGTGGATATT AACTATGAAC AATCTCCAAT TGAAGGAAAG 
CTCAATATCA GATATGAATT CACTCCCTAA

Protein sequence

MLNKVINDSQ NYAVIYARIS SKNENNSINA QIKLGEDVIN KNNLLLHDTY IDKISGKTTS 
PKERKGFSRL LEDAKAGLFK TIVIYRLDRL VRRYDDWIET KKILNKLGIK ILFSDTNQAL 
LENSPQSEFF QNFSVMIAEM EPDTISLRAS QGRIFRRKSG AYTSPKAPFG YIKQESNDRR 
KSKSIFIQEP IKLAFIKYIF FVFHRLIIEE KRSDSSNPQA SINTLYNSLQ NTLEHIEANI 
DLRDIPLRNN TKYASLEAEL FGVINKYIEN TDLKSVKKEI SEVKFYYLFS KGNTTKKNSA 
YLSACLRNPV YAGCILLDSN HPFKGLSFST DEKTGITSFK ERLDSEAFVN TNNLVGIIPS 
SIFKTVYSYL TYKSLIKIDR TPNFLLKGSL ICSKCNKKLK LIDDNYLSCK GTRCHPFLKY 
DLLKFIIDKI IDNCLSISQT PLEQFINKLS RKIEIKNQNI KYQTLNKYEA IYNYLSSNDS 
SYVDKIHQKD IAIKSYVSSC NKYRTKLSYL NQLFDEVNKI NKKYSSKPQL ENNSVLLKQV 
KEKIVNHIMN NEEFFVPIFS EIIKEIKVDI NYEQSPIEGK LNIRYEFTP