Gene CPF_1807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1807
Symbol
ID	4202824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2039285
End bp	2041300
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	28%
IMG OID	638082677
Product	hypothetical protein
Protein accession	YP_696241
Protein GI	110799104
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.203389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA AGTACTTTAA AGAGGTTTTA GGAAATAAAA AAACTTTGAA GAATTTGGGG 
ATTAACGTAT TTATTTGGAT TACTCTATCT TTTCTATTAG TATTTTTAGG GGAGTCATTT 
CATAGAGGAT CTATTGAAAA TGGAAAGGAT TTTTTAGATA ATCAAACAAC AGTATTTCTA 
TTAAACTATC TAATATTTTT GATGATTACT TCAATAGCTT TTTTCTTTAA GAAGACTAGA 
ATGGTTTATG GAATAATAAG TACAATTCTT ATGGGCTTTT ATATGGCAAG TGGAGTAATA 
CTAGGCTTTA GAGGAACACC ACTTATATGG GCAGATATGT TTTCTTTTAA AGAAGGATTA 
GCTATAGCAG GAAATTATTT AAACTTAAAT ATTTTAAAAT ATGCTGTTAT AGCCTTAGTA 
ATTATAATTG CAATATTAGT ATTGTTATGG TTTAGTGAAA GATATAAAAG TAGAAATAAA 
GTGATTAATC TATATGGCTT TATAATCTTA CCATTATCTA TTTTGGCTGT AGGAGCTTTT 
TATGGAAATG CAAAAGGGAG TATAGAAGTA TATAGATGGG ATTTGCCAGT TTCCTATGAG 
AGAAATGGGT TTATGTACTC ATTTTTAGAT ACTGCAGCAG GATTTAAGGT TAAAGAGCCA 
AGTGATTACA ATAAGGCATC TATTGAGAAA ATAAAGAATG ATATAATTGA AGAAGCACAA 
CTAGCTAGTA ATGATACTAA AATGGCATCT GCTATGCCAT CAGAATTTCC TAATATAATA 
ATTGTTCAAT TAGAATCATT TATGGATTTA GATAGAATAA ATGGATTAAC TTTTACAGAG 
GACCCTATAC CAACCTTTAG AAAAATAGCT AGTGAATCAA CAAATGGCTT TTTAAAGGTA 
CCTACTTATG GAGGGGGAAC TGTTAGAAGT GAATTTGAAG TGCTAACTGG ATTAAGTACT 
GATTACTTAC CAGTAGGTGA AATACCTAAT AATAATATAC TTAAAAAACA GCCAGTTGAA 
AGTTTAGCTT ATATATTACA TGATTATGGG TATGGAACAA ATGTTATACA TAATTACGAA 
GGAAATTTTT ATAATAGAGA CACAGTGTAT CCTAACTTAG GATTTGATAA ATATATATCT 
ATGGAGTATA TGGACAAACC TACTAATGCT GATTGGCAAT ATCCAGAGGA TGTTTTAAAC 
ATAGAACCTA TAGAAGATAT AATATCTAAT AATGAAAAGC CTCAGTTTAT TTATAATGTA 
ACTGTAGAAA GTCATGGAGG ATATTCTTCT TCAGATTTTG AAAATTATAC AGTGGATGGA 
GATTTAGATC AAGAAGAAAA AAATGAACTT CAATGTTACA TAGATAAATT AAGAGGGGTT 
GATGAATACA TAAAAGAACT TTTAGATTAT GTAGAATCTT CAGGAGAGCC TACAGTAATC 
GCTATGTTTG GAGATCATCT ACCTTCATTA AAGATAATAA ATGATGATGA GAGTGTATTA 
AAAGATGGAA ATAAATATTT AGCTGATTTC TTTATATGGG ATAATATTGG CTTACCAAAG 
GAAAATGTAA ATATGGAAGC AGAGGAGTTT ACAACATATA TATTAGAAAA GCTTAATATG 
GTGGCAGGAG TTATGCCTAC TTTCCATAAT GCATGTAAGG ATGATGAGAA TTACAAAGAA 
GATTTTGAAC TTCTTCAATA TGACATGCTA TTTGGAAATA AATATATCCT AAATGAAAAT 
AAAAATAAAT ATGAAAAAAC CAATATGAAG ATGGGATTAA AGGAAATAAC TCTAAATAAT 
TATGATATAA AAGATGATAT ATTAACTGTA ACTGGTGATA ATTTTAATTA TAAGAGCAAA 
ATTATTATAA ATGGAAAGAT TAAAGAAACT AATTTTATAG ATGAAAATAC ATTAACAACT 
ACTGAAATTC CTTCAAATAT TAAAAATATT TCAGTTGGTC AAATAGGAAA GTATGATAAA 
ATACTAAGTA GTAGCAATTC ATTAGAAATA AAATAG

Protein sequence

MNKKYFKEVL GNKKTLKNLG INVFIWITLS FLLVFLGESF HRGSIENGKD FLDNQTTVFL 
LNYLIFLMIT SIAFFFKKTR MVYGIISTIL MGFYMASGVI LGFRGTPLIW ADMFSFKEGL 
AIAGNYLNLN ILKYAVIALV IIIAILVLLW FSERYKSRNK VINLYGFIIL PLSILAVGAF 
YGNAKGSIEV YRWDLPVSYE RNGFMYSFLD TAAGFKVKEP SDYNKASIEK IKNDIIEEAQ 
LASNDTKMAS AMPSEFPNII IVQLESFMDL DRINGLTFTE DPIPTFRKIA SESTNGFLKV 
PTYGGGTVRS EFEVLTGLST DYLPVGEIPN NNILKKQPVE SLAYILHDYG YGTNVIHNYE 
GNFYNRDTVY PNLGFDKYIS MEYMDKPTNA DWQYPEDVLN IEPIEDIISN NEKPQFIYNV 
TVESHGGYSS SDFENYTVDG DLDQEEKNEL QCYIDKLRGV DEYIKELLDY VESSGEPTVI 
AMFGDHLPSL KIINDDESVL KDGNKYLADF FIWDNIGLPK ENVNMEAEEF TTYILEKLNM 
VAGVMPTFHN ACKDDENYKE DFELLQYDML FGNKYILNEN KNKYEKTNMK MGLKEITLNN 
YDIKDDILTV TGDNFNYKSK IIINGKIKET NFIDENTLTT TEIPSNIKNI SVGQIGKYDK 
ILSSSNSLEI K