Gene CPR_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1035
Symbol
ID	4204943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1177773
End bp	1179407
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	21%
IMG OID	642565592
Product	GGDEF domain-containing protein
Protein accession	YP_698358
Protein GI	110801973
COG category	[T] Signal transduction mechanisms
COG ID	[COG3706] Response regulator containing a CheY-like receiver domain and a GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00577049
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AAAAAAAGAA ATATTTATTA ATTTTATTAA TTTTTTTAAT AGTTATTAAT 
TTATTTATAT TTTCTTTTTA TAAATTTAAA TCAAATAAAA AAAATAAAAA ATATATAGAG 
AAAACTAATT CAATTTTATA TGAATTTAAA TTATATATGA AAAAAAGAGA TTTTAAAAAT 
TGTGAAAATA AACTTTACTC AATTGTAAAT AATAAAGATA TGTTTTATAG TTTACCTGAT 
AATTTAAAGT TCGAGATTTA TAATTATTTA GCTATAATAA ATCTTCAACA AGAAAAATTT 
TTAAATGCTT TATCTTATTA TGAAGAAGCC TTTAAATATG CTGATAAAGA GTCAAAGATA 
ATTATTAAGC TAAACATGAC ATCTGCTTAT AGATATATGG GGGCCTATGT TACTGCTACT 
AATATTTTAA ATAAAATGAT AGAGTCATCA TTAACTTTTA AAAATGAAAA TTCTTATCTT 
AAAGAATATA CTCTATTAAA TTTAGCTGAA ACTTATTTTG CTGTAAATGA TATAACTGAC 
TTTAATTCTA CAATAGAAAC TATATCGAAA TATTATTGTG GGCCTGAAAA TGAGTTAGCA 
GATCTAAAAA TACTTTTAGA TTCCTATTTA ATAATAAAAG CAATATCAGA GAATAACCTT 
GATTTAGTAC CAAAATACAT TTCTGAAATA GATGAATTAG AAAGTAAAAA TAAAGATCTC 
ATATATTCAG AATTAGAAAT GATTAAACTT CGTTCATATG GTATGTATTA TGAAAGCATA 
GGAAATTTCA ATTTAGCATT AGATTATTTT TCCAAATTAG AAAAATCAGC TGATAATGAA 
GGTGCTTCTT ATGTTTCGCT TTTTTCTATA AGCAAAAGAA TTTCTATCTA TAAAAAATTA 
AATGATACTT ATAAAATAAA TTATTTAATA AATAAATATT ATGAAAAACA AACTTCAATA 
AATGACATAA ATAATAATGA ATTTAAATAC TATATAGATA ATAAAATTAT AAACAATCAT 
GAGTTACCAT TTTTAAAAGA AACAATTATT ATTTTAACAA TTCTATTTTT AATCTCTATT 
TTATTAGTGC TTTTTTACTT AAAGAAAGCT CGGGATTCAA AATTAGATTC TTTAAAAGAT 
GGACTTTGCA ATATTTACAA TAGGCGTTTT TTAGACTCTT ATATAAATAA TTTAAAAGAA 
AAGGATCTAC CTATTTCTTT TTTAATGATA GATGTAGATT ATTTTAAACT TTATAATGAT 
AACTATGGTC ATCAAGCAGG TGATTTTGTG CTAAAAAGCA TATCTTCTGT ATTAAAAAGA 
AATTCTCGTA AGGAAGATAT AGTTTCACGT TATGGAGGAG AAGAATTTTG TGTTTTACTA 
AAAGGAGCTT CTAAACATTC TTCTATTAAT TACGCTAAAA GAATCAAAGA AAATTTAGAT 
AATTTAAATA TAAAGCATAA ATACTCAAAA ATTTCTAACA ATGTAACCTT TAGTATAGGA 
ATATATACTA CATATACTAA AAACGATCTA AAAAATGCTA TTAAACTTTC TGATAAAGCA 
CTATATATAT CTAAAACAAG AGGGAGAAAT ACATATACTT ATCTAGAAGA TAACTCTTCT 
GATTCTTCTA ATTAA

Protein sequence

MKNKKKKYLL ILLIFLIVIN LFIFSFYKFK SNKKNKKYIE KTNSILYEFK LYMKKRDFKN 
CENKLYSIVN NKDMFYSLPD NLKFEIYNYL AIINLQQEKF LNALSYYEEA FKYADKESKI 
IIKLNMTSAY RYMGAYVTAT NILNKMIESS LTFKNENSYL KEYTLLNLAE TYFAVNDITD 
FNSTIETISK YYCGPENELA DLKILLDSYL IIKAISENNL DLVPKYISEI DELESKNKDL 
IYSELEMIKL RSYGMYYESI GNFNLALDYF SKLEKSADNE GASYVSLFSI SKRISIYKKL 
NDTYKINYLI NKYYEKQTSI NDINNNEFKY YIDNKIINNH ELPFLKETII ILTILFLISI 
LLVLFYLKKA RDSKLDSLKD GLCNIYNRRF LDSYINNLKE KDLPISFLMI DVDYFKLYND 
NYGHQAGDFV LKSISSVLKR NSRKEDIVSR YGGEEFCVLL KGASKHSSIN YAKRIKENLD 
NLNIKHKYSK ISNNVTFSIG IYTTYTKNDL KNAIKLSDKA LYISKTRGRN TYTYLEDNSS 
DSSN