Gene CPF_0123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0123
Symbol
ID	4202970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	147208
End bp	149112
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	30%
IMG OID	638081004
Product	cell wall surface anchor family protein
Protein accession	YP_694587
Protein GI	110800193
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4932] Predicted outer membrane protein
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC GAAAATTATT AATAATGATA GGATTAGCAA CTAGTATATT TACTTTAGAG 
GCTTTACCTA TGGGGTTACC AGTTGCAAAT TCAACTGTTT ATGCTGCAGA ACAAATTGCG 
CCTACTACTC AAAATTTATC TGTTCAAAAA GTAATGTATG AAGGGGTAAA GCCATCTATT 
ACAAATGATG GAGAAGAAAA GCAATTGCCA GTTGGAGCAG AAAAATTTAA TCCTGAAAAG 
TATGGTGATG TAAAGTTTAC ATTAGTTGAT ATAACATCAT ACTTTAATAA TAAGGGAGAA 
AAAGGAATTC AAGAAGAATT AAATGGATTA ACAGCAGAAC AATATTCTGA TTGGATAAAT 
ACTCATAAAG AAGCAAATAC TACACCGGTT ACACACTCTG TAAATACTGA GGGTAAGGTT 
AATTACGATA ATGTTTTAGC CACTAATAAA GATGGAACAG GACATGTTTA CGCTATATTA 
GAAACAAAAA GTGCAAAAGG ATTAATTGAA CAAATTGCTC AACCTATTGT TGTTAGTTTA 
CCTATGACAA ATGTTGTTGG AAATGGTTGG CTTAATACAA TAAACTTATA TCCTAAAAAT 
AAAGTAAAAT CATTATCATT TAAATTAACA AAGTATGGTG AAGAAATTTC AGATACTAAT 
AAATTAGCTG ATGCCACATT TGATATTTAT TCTGGGGTTC CTGGAAGTGG AACTAAGTTA 
AACAAAGATG TTTTAACAAC TAATAAAGAT GGTGTTATTA CAGTAGATAA TTTAACTAAA 
GGAGATTATT ATTTCGTGGA AACAAGTGCT CCTAAAAACT ATGTTATAGG ATCAAATGCA 
TTAAATGATA ACAATAATAA ATTAAAATTT TCTATTGGAG ATGATGGGGT AGATAAAAAT 
TCTTTACATA TTGAGTTTAT AAACTACTTA AAACCAGAGA GCAATAAAGA GGTAACTAAT 
GGAACAGCTC CTCGTACTAA TGAATCAAGT TTTACAATTG GAGATACAGT AGACTATGAA 
AATACTATTC GTGTTCCTAA AGATATTGCA GGTGGAAAAA TTGTAAATGG TGATAATACA 
GAAACTACTT CAGCTTATTC AGTGTTTAAT TACAAAGATA TAGCCGGAAC TGGATTATCT 
TATTTTGGAC AAGCTAAGGA TGTAAATATT ACTACTCAAG ATGGAACTAA ATTAGAGTTA 
AACACAGATT ATACTTACGA AGGATTACAA AATGGTTTTA AAATTAATTT CATCATGAAT 
AATGGAAAAG TAAGTGCTAA AGTTGCTAGT TTAGCAGGAC AAAACTTAAA AGTTAGTTAT 
CCAATGATAT TAAACGATAA GGCCTTAATT GATGGTCCTG TAGAAAATAG TTTTGATTTA 
TCTTGGAATA ATAGTCCAAA TCCTGATAGT AAAGTAAATC ATGAAACTGG AAAAGTGCCT 
GTATTTACTG GTGGAGCAAA ATTTGTTAAA CAAGATAAAT CAAGTAAGGC AGCTTTAAAA 
GGAGCGAAGT TCGTAATAAT GAACAAAGAA GGAAAATACT TCGATGGATG GGAAGATGCT 
AATAATGATG GAGTAAAAGA TGCTAAGTGG TCAGATACAC AACCTACAAG TGGAGAAGGT 
GTATTTGTTT CAGGTGATAA TGGTCAATTC TTAATAAAAG GATTAGCTTA TGGAACTTAT 
AAATTAAAAG AAATTGAAGC TCCAGAGGGA TATCAATTAT TAACCAATAC TCAAGAATTT 
GAAATTAGCA AAGATACTTA TTCTGGTGGA TTTAGTACAA TTACAAATAC TAAGAAATCA 
GCTATGCCAC TTACTGGTTC TACACAATTA ATTGTTACTG TGTTAGCTGG TGCTGTACTT 
ATAGTTTCAT CAGGTGTTTA TTACAGAAAA CGTAAAATGA ATTAA

Protein sequence

MKKRKLLIMI GLATSIFTLE ALPMGLPVAN STVYAAEQIA PTTQNLSVQK VMYEGVKPSI 
TNDGEEKQLP VGAEKFNPEK YGDVKFTLVD ITSYFNNKGE KGIQEELNGL TAEQYSDWIN 
THKEANTTPV THSVNTEGKV NYDNVLATNK DGTGHVYAIL ETKSAKGLIE QIAQPIVVSL 
PMTNVVGNGW LNTINLYPKN KVKSLSFKLT KYGEEISDTN KLADATFDIY SGVPGSGTKL 
NKDVLTTNKD GVITVDNLTK GDYYFVETSA PKNYVIGSNA LNDNNNKLKF SIGDDGVDKN 
SLHIEFINYL KPESNKEVTN GTAPRTNESS FTIGDTVDYE NTIRVPKDIA GGKIVNGDNT 
ETTSAYSVFN YKDIAGTGLS YFGQAKDVNI TTQDGTKLEL NTDYTYEGLQ NGFKINFIMN 
NGKVSAKVAS LAGQNLKVSY PMILNDKALI DGPVENSFDL SWNNSPNPDS KVNHETGKVP 
VFTGGAKFVK QDKSSKAALK GAKFVIMNKE GKYFDGWEDA NNDGVKDAKW SDTQPTSGEG 
VFVSGDNGQF LIKGLAYGTY KLKEIEAPEG YQLLTNTQEF EISKDTYSGG FSTITNTKKS 
AMPLTGSTQL IVTVLAGAVL IVSSGVYYRK RKMN