Gene CPF_1658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1658
Symbol
ID	4203421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1875232
End bp	1876383
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	30%
IMG OID	638082535
Product	hypothetical protein
Protein accession	YP_696099
Protein GI	110798886
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.2932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA AACCAAAAAT ATTATTAGTG ACTTCTTTAT CCCTAATAGT ATTATTAACC 
TTATCCATAT ATGTATCCTT AAACAAAAAG AAAACTTCAG CATTTTCAGA AGCCATAAAT 
TTATTAAAAG AACCTGACAA AAAAGAAGAT GATGAATTAA AGGGAAAATT TGAAGAAGTA 
CTTCAAGACT TATTTAAAAA TAGAAATATA GCCATATTAA ACAATGATTT AGAGGAATTA 
AAGAAATTTT ATGATTTAGA AAAAAAGCCT AGTCTTTGGG CCTATGAAAG TGAAAGTAAA 
AAAGTTAAGT ATTTAAACAA CTGGTCTCAA AAACAAGGAG TTGTATTTAA TGAAATAAAA 
TCAAAAACTG AAATAAGAAA GGCTAGAGAA AGAGAAAAGG ACTTATACGG AATAATATGT 
GTTGTTTCAA GTGAATTTAC ATATTATTAT CTTAATGATC CTCTTAAAAC TAATACCTTT 
AGATTAGGTA CTTATCACTA TTTAAATTTA AAAGATGAGG GAGATAGGTA TATTATCACT 
AAGGAATGGT ACACTGATCC TTTTGCTGAT TCTCTAGATT TAAATAATAT AAAATCTGAT 
GAAATTAAAT CCTATATTTT AAATAGTTCT AGTCCATCTT ATTCACCTGA TGAAAGAACA 
CAGAAAGCTA TAGATTATGC ACATACCTAT TGTGGAGCAG CTGCAGATGA TGAACTTGGT 
TTTAACTATA ATAAAAAATA CACAGACTTT AACCCTCAAG GAGGAGACTG TGCAAACTTC 
GCCTCTCAAA TTCTTTTTGA AGGTGGTGGA TTTAAGAAAA ATTCAACATG GAACTATTCT 
GATGGTGAAG GTTCTAAGGC TTGGGTAAAT GCTCAAGCAT TTAAAAATTA CATGGTTAAT 
AGTGGACGTG CTTCCTATAT TGCTAAGGGT AAATATTCCG AAATATATAA AGCGGCCTAT 
AACTTAAGAC CTGGTGATTT TGTAGCTTAT GAAAAAAATG GACGAATAAC TCACATTTCA 
ACAGTTACAG GATTAGATAG TAAAGGTTAT CCCCTAGTAA CTTGTCACAA CACAGATAGA 
CTTCTTGTTC CTTTTGATTT AGGTTGGAGC AATGACAATA TACGCTTTCA TCTAGTAGAT 
GTTTATTATT GA

Protein sequence

MKRKPKILLV TSLSLIVLLT LSIYVSLNKK KTSAFSEAIN LLKEPDKKED DELKGKFEEV 
LQDLFKNRNI AILNNDLEEL KKFYDLEKKP SLWAYESESK KVKYLNNWSQ KQGVVFNEIK 
SKTEIRKARE REKDLYGIIC VVSSEFTYYY LNDPLKTNTF RLGTYHYLNL KDEGDRYIIT 
KEWYTDPFAD SLDLNNIKSD EIKSYILNSS SPSYSPDERT QKAIDYAHTY CGAAADDELG 
FNYNKKYTDF NPQGGDCANF ASQILFEGGG FKKNSTWNYS DGEGSKAWVN AQAFKNYMVN 
SGRASYIAKG KYSEIYKAAY NLRPGDFVAY EKNGRITHIS TVTGLDSKGY PLVTCHNTDR 
LLVPFDLGWS NDNIRFHLVD VYY