Gene CPR_1397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1397
Symbol
ID	4205593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1570345
End bp	1571496
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	29%
IMG OID	642565951
Product	hypothetical protein
Protein accession	YP_698716
Protein GI	110803353
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.240429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA AACCCAAAAT ATTATTAGTG ACTTCTTTAT CCCTAATAGT ATTATTAACC 
TTATCCATAT ATGTATCCTT AAACAAAAAG AAAACTTCAG CATTTTCAGA AGTCATAAAT 
TTATTAAATG AACCTCATCA AAAAGAATAT GATGAATTAA AAGGAAAATT TGAAAAAGTA 
CTTCAAGACT TATTTAAAAA TAGAAATATA GCCATATTGA ACAATGATTT AGAGGAATTA 
AAGAAATTTT ATGATTTACA AAAAAAGCCT AGTCTTTGGG CCTATGAAAG TGAAAGTAAA 
AAAGTTAAGT ATTTAAACAA CTGGTCTCAA AAACAAGGAG TTGTATTTAA TGAAATAAAA 
TCAAAAATTG AAATAAGAAA GGCTAGAGAA AGAGAAAAGG ACTTATACGG AATAATATGT 
GTTGTTTCAA GTGAATTTAC ATATTATTAT CTTAATGAAC CACTTAAAAC TAATACCTTT 
AGATTAGGTA CTTATCACTA TTTAAATTTA AAAGATGAGG GAGATAGGTG TATTATCACT 
AAAGAATGGT ACACCGATCC TTTTGCTGAT TCTCTAGATT TAAATAATAT AAAATCTGAT 
GAAATTAAAT CATATATTTT AAATAGTTCT AGTCCAGATT ATTCACCTGA TGAAAGAACA 
CAAAAAGCTA TAGATTATGC ACACACCTAT TGTGGAGCAG CTGCAGATAA TGAACTTGGT 
TTTAACTATA ATAAAAAATA CACAGACTTT AACCCTCAAG GAGGAGACTG TGCAAACTTC 
GCCTCTCAAA TTCTTTTTGA AGGTGGTGGC TTTAAGAAAA ATTCAACATG GAACTATTCT 
GATGGTGAAG GTTCTAAGGC TTGGGTAAAT GCTCAAGCAT TTAAAAATTA CATGGTTAAT 
AGTGGGCGTA CTTCCTATAT TGCTAAGGGT AAATATTCTG AAATATATAA AGCTGCCTAT 
AACTTAAGAC CTGGTGATTT TGTTGCTTAT GAAAAAAATG GACGAATAAC TCACATTTCA 
ACAGTTACAG GATTAGATAG TAAAGGTTAT CCCCTAGTAA CTTGCCATAA CACAGATAGA 
CTTCTTGTTC CTTTTGATTT AGGTTGGAGC AATGATAATA TACGCTTTCA TCTAGTAGAT 
GTTTATTATT GA

Protein sequence

MKRKPKILLV TSLSLIVLLT LSIYVSLNKK KTSAFSEVIN LLNEPHQKEY DELKGKFEKV 
LQDLFKNRNI AILNNDLEEL KKFYDLQKKP SLWAYESESK KVKYLNNWSQ KQGVVFNEIK 
SKIEIRKARE REKDLYGIIC VVSSEFTYYY LNEPLKTNTF RLGTYHYLNL KDEGDRCIIT 
KEWYTDPFAD SLDLNNIKSD EIKSYILNSS SPDYSPDERT QKAIDYAHTY CGAAADNELG 
FNYNKKYTDF NPQGGDCANF ASQILFEGGG FKKNSTWNYS DGEGSKAWVN AQAFKNYMVN 
SGRTSYIAKG KYSEIYKAAY NLRPGDFVAY EKNGRITHIS TVTGLDSKGY PLVTCHNTDR 
LLVPFDLGWS NDNIRFHLVD VYY