Gene CPF_1568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1568
Symbol
ID	4201671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1785241
End bp	1786269
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	29%
IMG OID	638082446
Product	glycosy hydrolase family protein
Protein accession	YP_696011
Protein GI	110800996
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3757] Lyzozyme M1 (1,4-beta-N-acetylmuramidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00668816
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGTA GAAACAATAA TAATTTAAAA GGAATTGATG TATCAAACTG GAAAGGAAAT 
ATAAATTTTG AGAGTGTAAA AAATGATGGC GTAGAAGTAG TTTATATTAA AGCTACAGAA 
GGTAATTACT TTAAGGATAA ATACGCTAAA CAAAATTATG AGGGAGCAAA AGAACAAGGA 
TTAAGTGTAG GGTTTTACCA TTTCTTTAGA GCTAATAAAG GGGCTAAGGA TCAAGCTAAT 
TTCTTTATAG ATTATTTAAA TGAAATAGGA GCTGTTAATT ATGATTGTAA ATTAGCTTTA 
GATATAGAAA CTACTGAAGG AGTAGGAGCA AGAGATTTAA CATCTATGTG TATAGAATTT 
TTAGAAGAGG TAAAAAGACT TACAGGAAAA GAAGTTGTTG TATATACTTA TACAAGTTTT 
TCAAATAATA ATTTAGATAG TAGATTATCT AATTATCCAG TTTGGATAGC ACATTATGGG 
GTGAACACTC CTGGAGCTAA TAATATTTGG AGTGAATGGG TTGGATTTCA ATATTCAGAG 
AATGGAAGTG TAGATGGTGT AAGCGGTGGA TGTGATATGA ATGAGTTTAC AGAAGAAATA 
TTTATTGATT CAAGTAACTT TAATTTAGAT AATGCTACTA CTAAAAATGT AAGCACTAAA 
TTAAATATAA GAGCTAAAGG AACTACTAAT TCTAAAGTAA TTGGTTCAAT ACCAGCAAAT 
GAAACCTTTA AAATAAAATG GGTTGATGAA GATTATCTTG GTTGGTATTA CGTTGAGTAT 
AATGGAATAG TTGGTTATGT AAATGCAGAT TATGTAGAAA AGCTACAAAT GGCTACTACT 
CATAATGTAA GTACTTTTTT AAATGTAAGA GAAGAAGGAT CATTAAATTC TAGAATAGTA 
GATAAGATAA ATGCAGGTGA TATTTTTAGA ATAGATTGGG TGGATTCCGA TTTTATAGGT 
TGGTATAGAG TAACAACTAA AAATGGAAAA GTTGGATTTG TTAATTCTGA ATTTGTTAAG 
AAGATCTAA

Protein sequence

MQSRNNNNLK GIDVSNWKGN INFESVKNDG VEVVYIKATE GNYFKDKYAK QNYEGAKEQG 
LSVGFYHFFR ANKGAKDQAN FFIDYLNEIG AVNYDCKLAL DIETTEGVGA RDLTSMCIEF 
LEEVKRLTGK EVVVYTYTSF SNNNLDSRLS NYPVWIAHYG VNTPGANNIW SEWVGFQYSE 
NGSVDGVSGG CDMNEFTEEI FIDSSNFNLD NATTKNVSTK LNIRAKGTTN SKVIGSIPAN 
ETFKIKWVDE DYLGWYYVEY NGIVGYVNAD YVEKLQMATT HNVSTFLNVR EEGSLNSRIV 
DKINAGDIFR IDWVDSDFIG WYRVTTKNGK VGFVNSEFVK KI