Gene CPF_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2026
Symbol
ID	4202756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2266486
End bp	2267487
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	30%
IMG OID	638082895
Product	hypothetical protein
Protein accession	YP_696459
Protein GI	110800232
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTTTGA TATCCATATT CATAATTTTA CTTGTGATTA ACTTAGCTGT ATTTGTAGTT 
AAATATAACT CCATAAAGCG AAGCCCTTTA CAATCTAATA AAGCTGATAT AACCTTTAAA 
GTTAAAGAAG GAGAGTCACT AAATGGACTT TTTGAACGAT TAAACAATGA AAATGTACTT 
AGAAGTTCCT TTTTTTCTAA GATATATATA AAGTTTAATA ACGTAGAAGA AAGTATAAAA 
CCAGGTACAT ATACTGTGAA TAGTGACATA AGTTTTAATG ATTTTTTAAG TGTACTAACT 
GATGGGAAAG TATCAGATTA TAAGGTAACA TTTCCAGAGG GATACACTGT AGAGGATATA 
GCTAAGAAAT TGGAAGAATC TAAGGTATGC ACAAAAGATG AGTTTTTAAA AGTAGTAAAA 
GAGTATCCAT TACCATCTTA TATAAAACCT AATAATGAAA GAAAATATGA GTTAGAAGGA 
TTTTTATTTC CAGACACATA TGCTATTCCT AAAGGCACAA CACCAAAACA AATAATTGAA 
ATGATGCTTA ACAGGTTTGA AGGGGTAATT AGTGAGATAC AAAGTGAACT AGGCATTACT 
ATTCCAAAGG AAGAGTATGA GAAATATGTA ATAGTAGCTT CAATGGTTGA AAAAGAGGCT 
AGGGATGATA GTGAGCGTGC AGAAATAGCA TCTGTTATAT ATAACAGACT ACAAAAAGGT 
ATGCCTTTAC AAATCGATGC TACAGTTTTA TATGCTTTAG GAGAGCATAA AGATACTGTG 
CTTTATAAAG ACTTAAAAGT GGATTCACCA TATAATACAT ATAAGATTAA AGGACTTCCA 
GTGGGGCCAA TATGTAATCC TGGAAAACCT TCACTTTTAG CTGCCATAAA ACCAGCTAAA 
ACAGACTACA TATATTATTT ATTGAATCCA TCAAATAATA AGCACTATTT TACTAATAAT 
TACGAAGATT TCCTAGCTAA GAAGAAAGAA TTTGGATACT AA

Protein sequence

MVLISIFIIL LVINLAVFVV KYNSIKRSPL QSNKADITFK VKEGESLNGL FERLNNENVL 
RSSFFSKIYI KFNNVEESIK PGTYTVNSDI SFNDFLSVLT DGKVSDYKVT FPEGYTVEDI 
AKKLEESKVC TKDEFLKVVK EYPLPSYIKP NNERKYELEG FLFPDTYAIP KGTTPKQIIE 
MMLNRFEGVI SEIQSELGIT IPKEEYEKYV IVASMVEKEA RDDSERAEIA SVIYNRLQKG 
MPLQIDATVL YALGEHKDTV LYKDLKVDSP YNTYKIKGLP VGPICNPGKP SLLAAIKPAK 
TDYIYYLLNP SNNKHYFTNN YEDFLAKKKE FGY