Gene CPF_2177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2177
Symbol
ID	4202229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2416377
End bp	2417552
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	28%
IMG OID	638083042
Product	transglutaminase domain-containing protein
Protein accession	YP_696601
Protein GI	110800793
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTTA ACTTAGTAGA TATAATTATA GTTTGTTCTT TTATACTACC ATTAGTAGTT 
GCTTACAAAA GAAAGTTTAA TATTATTAGA ATAAAGAATA GTATAGAGGA ATTAGGAGGA 
TATATATCCT TTTTTCTTGC TTTATACTTA AGTTTTATAG CTATAAAAAA GATAGATATA 
ATAGAGAGGA TGTTTTCAAT TGTAGTTGTT GAATTCAATA ACATTATATC TAACTTTAAT 
ATTTCACCAC AGGTTATAAT AATATTCATA GTATTAGCTC TTACCCTTGT AATTTATTTT 
ATAGTAAAAG TTATACTTAA AATATTTAGT TTTATTATTA TAAATCCAAT ACTTAGATGG 
TTAAAGAAAG CAGAGTCTAG AAGGGGAAAG GGATTTGGTA AAGTTGCGGC TTTAATAATA 
AATATACCAA AGTCTCTTTT TTATATGGCA GTAATTGCTT TAGTCATAGT TATTCTAGGA 
AGCAATGGTT TCTTAGGAGA GAAAATGGAA GGAATGACTT TAGCTTCAAA GGCTTATGAG 
GTTATAAATA GTAATAAGTA CTATGCTGCT TTAAATAAAG AATATGAAGC TTTTCATGAT 
GAATATAAAG ATGTTATTAG TAAAAACATA GATTCTGCAG TTGAAAGCAA TAAAGAGACA 
AATAGTGAAA AAGTGGTTGA AAGTAATAGA AATGTTATAA ATCTTTATAA TGGTGTAACT 
TTAGAACAAG GTATAAAATC AAATGAAGCT ATTAATAAAA AAGCTAAGGA ACTTACTAAA 
AATGCAAAAA GTAGTAGAGA AAAAGCTAAA AGAATATATA CTTGGATAAG TGAAAATATT 
AATTATGATG ATAATAAAGC TGAAAATATA AGTGAGAAAA CTTCTGAGTA TAAGTCTGGA 
GCTATTGAAG CCTTTGAAAC TAGAAAAGGA ATATGCTTTG ATTATTCCTG TCTTTATGTT 
GCTATGGCAA GAGAAGCGGG GCTTAAAGTT AGAATTGTAA CTGGAGAAGG ATTCAATGGA 
AAGGAATGGG GACCACATTC TTGGAATGAG GTTTATTTAC CAGAAAAAAA TCAATGGATA 
ACTGTTGATC CTACCTTTGG TAAAGCTGGA AACTATTTTG ATAGTAAGAA AAATAGTGAA 
TCACACAGAG ATGGAAAAAT AGTTGGAGAA TGGTAA

Protein sequence

MNFNLVDIII VCSFILPLVV AYKRKFNIIR IKNSIEELGG YISFFLALYL SFIAIKKIDI 
IERMFSIVVV EFNNIISNFN ISPQVIIIFI VLALTLVIYF IVKVILKIFS FIIINPILRW 
LKKAESRRGK GFGKVAALII NIPKSLFYMA VIALVIVILG SNGFLGEKME GMTLASKAYE 
VINSNKYYAA LNKEYEAFHD EYKDVISKNI DSAVESNKET NSEKVVESNR NVINLYNGVT 
LEQGIKSNEA INKKAKELTK NAKSSREKAK RIYTWISENI NYDDNKAENI SEKTSEYKSG 
AIEAFETRKG ICFDYSCLYV AMAREAGLKV RIVTGEGFNG KEWGPHSWNE VYLPEKNQWI 
TVDPTFGKAG NYFDSKKNSE SHRDGKIVGE W