Gene CPF_0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0949
Symbol
ID	4201902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1101686
End bp	1103050
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	30%
IMG OID	638081831
Product	putative phage terminase, large subunit
Protein accession	YP_695396
Protein GI	110801301
COG category
COG ID
TIGRFAM ID	[TIGR01547] phage terminase, large subunit, PBSX family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.327026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATG AATACAAGTT ATCAGATAAG TATTTAGCTT TTTTAAAACA TAGAGCACCA 
GTAGAAGCAT TGGAGGGAAC AACAGCAGCA GGAAAAACTA CAGTAGGAAT ATTAAAGTTT 
ATGCTGATGG TTGCAGAATC TCCTAAGAAA ATGCATGTTA TTGCTGCTAA AACAACTGGC 
GTTGCTGAGA AAAACTTAAT ACAAAAAGAA TATGGAATTA CTGATGTATT TGGTGATTTA 
GTCAAGTATA ACGGTAATGG TGATAAAGAT AATAAAATAC CTCATATAAG ATATATAACT 
CCTAATGGTG AGAAAATAAT ATATATACTA GGTTATGATA ACGTAGATAA ATGGAAGATG 
GCCTTAGGTT CTCAATTCGG TTGTGTACTT ATAGATGAGG TTAACACAGC TAGTATTGAA 
TTTGTAAGAG AAATATGTAC TAGAAATGAT TATCTTATGA TGACACTTAA TCCAGATGAT 
CCTAACTTAC CTATATATTC AGAATTTATT AATTGTTGTA GACCATTAGA AAAATATAAG 
AAAGATGTTC CAAAAGAGAT AATGGAGCAG TTAAATTCGG AACCAAAGCC TAACTGGACT 
TATTGGTTCT TTTCTTTTTA TGATAATGCA TCATTAAGTG AGGAAGCTAT TGAAAAGAAA 
AAGACGAGTG CTCCTAAAGG TACTAAGCTA TATAAGAATA AGATACTAGG GTTAAGAGGA 
AGAGCAACAG GATTAATATT CTCTAATTTT GAAAGAAAGA ATAATGTATT ATCTAAAGAA 
CAGGTTATTA AACAAATAAA AGATAAGAAA TTAAAGTTTG TTCAATTTAC AGCAGGATTA 
GATACCTCAT ATTCTCAAAA TAGTCCTGAT ACCTTTGCAT TTACTTTCTT AGGTATTACA 
GATAAGAAAG AATTAGTAAT GCTAGATGAA GAGGTGTATA ACAATAAAGA CCTAGAAACT 
CCATTAGCTC CTAGTGATAT AGCTCCTAAA TACTTTAAGT TCTTAGAGAA GAATAGAAAT 
GAATGGGGAT TTGCTAGAGA TGTATTTGTA GATTCAGCAG ACCAAGCAAC TATAACGGAG 
CTTAAGAAGT TTAAGAGAAC TAATCCATGT ATGTATAACT TTATTAACTC TTATAAGAAA 
GTAACTATAT TGGATAGAAT ACATTTAGCT TTAGGTTGGA TTAATACCAA TGGTAAAGTA 
TTTTATTATG TTTTAGATAC TTGTAAAGAG CATATAAGAG AACTTGAATG TTATTCATGG 
AAAGAGGATA AGTATGAGCC AGAGGATGCA AATGATCATA CAATTAACTC TAGTCAGTAT 
GCATGGATAC CTTTTAGAAA GATAGTAGGA GATTATATAA CATAA

Protein sequence

MSDEYKLSDK YLAFLKHRAP VEALEGTTAA GKTTVGILKF MLMVAESPKK MHVIAAKTTG 
VAEKNLIQKE YGITDVFGDL VKYNGNGDKD NKIPHIRYIT PNGEKIIYIL GYDNVDKWKM 
ALGSQFGCVL IDEVNTASIE FVREICTRND YLMMTLNPDD PNLPIYSEFI NCCRPLEKYK 
KDVPKEIMEQ LNSEPKPNWT YWFFSFYDNA SLSEEAIEKK KTSAPKGTKL YKNKILGLRG 
RATGLIFSNF ERKNNVLSKE QVIKQIKDKK LKFVQFTAGL DTSYSQNSPD TFAFTFLGIT 
DKKELVMLDE EVYNNKDLET PLAPSDIAPK YFKFLEKNRN EWGFARDVFV DSADQATITE 
LKKFKRTNPC MYNFINSYKK VTILDRIHLA LGWINTNGKV FYYVLDTCKE HIRELECYSW 
KEDKYEPEDA NDHTINSSQY AWIPFRKIVG DYIT