Gene CPF_0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0439
Symbol
ID	4203745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	524854
End bp	526191
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	28%
IMG OID	638081323
Product	CBS/transporter associated domain-containing protein
Protein accession	YP_694896
Protein GI	110799963
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCCGA GTCCCAGTAT TTTACCAAAA ATTATTCTAA TATTAGTTCT TATCTTAATT 
AATGCGTTCT TTGCAGCTGC AGAGATGGCA ATGGTATCTG TAAATAAATC TAAGATAAAG 
ATGCTTGCAG AGAAAGGGAA CAAAAAAGCC CTTTTATTAA AAAAGGTTTT AAAATCACCT 
GGCAACTTTT TATCTACTAT TCAAATAGGA ATAACATTTG CAGGATTTTT TGCCAGTGCA 
TCAGCAGCCA CTAGCATTTC AGAAACTCTA GCGCAATTCA TGTACAAGCT AAATATTCCT 
TATGGTAATG AGATATCAGT TATACTTATA ACTGTGCTTT TGTCTTATAT AACTTTAGTT 
TTTGGAGAAT TACTTCCAAA GAGAATTGCA TTACAAAAGC CAGAAGAAAT TGCTTTAATG 
GCTATAAGAC CAATCAATGT TATTTCTAAA ATATCAACAC CATTTGTAAA GATTCTTTCA 
GCTTCAACAA ACTTATTTAT AAAAATATTA GGTTTAAATA AGTCTGAAGA TAAAGAAACT 
GTATCTAAGG ATGAAATAAA ATCCATGATA AGTATTGGAC AAGAGAGTGG TGTAATCGAT 
AAAACTGAAA AGGATATGTT AGATAATATA TTTGAATTTG ATCATAAAGT TGTTAAAGAA 
GTTATGACTC CTAGGGGAGA AGTCTTTGCT ATAAAATCAA CAACTCCAAA TGAAACAATT 
GCTAAGAAAC TTATAAGTGA GCAATTTTCA AGAGTTCCTG TTTATAATGA AACTAGGGAT 
AATATAGTAG GAATACTTTA TTTAAAAGAC TTCTTTGAAG CCGTTGTAAA GGTTGGAGTA 
GATAACATTA AATTAGATCA ATTAATACGT CCAGCTTACT TTGTTCTTGA AAATAAAGCT 
ATAGATGATT TATTTAAAGA GCTTCAAGAT AGTAAGCAAC ATATGGCTGT AATAATAGAT 
GAATATGGTG GTTTTTCTGG AATTGTTACT ATAGAAGACT TAATTGAAGA AGTTATGGGT 
GATATATTAG ATGAGTATGA CGATTCAGAA AACTATATAG ATAAAATAGA TAATAATACC 
TATGTAGTTG ATGGTTTATT AACATTAGAT AAGTTAAATG ATTATTTAAA CCTAAATCTT 
GAAAGTCAAA ATATAGAGAC TATTGGTGGT TTTGTTGTTA ACTTAATAGG AAATATTCCG 
CAAAGTGAAA ATCAAATGGT TGAATATGAC AATCTTTCTT TCCAAGTTTG TAAAACAAAT 
AAGAAGAGAA TTGAAAAACT AAAAATTTAT TTAAATAATT CAACTAGTTT CAATTCAGAT 
GTTATATTAA ACAATTAA

Protein sequence

MDPSPSILPK IILILVLILI NAFFAAAEMA MVSVNKSKIK MLAEKGNKKA LLLKKVLKSP 
GNFLSTIQIG ITFAGFFASA SAATSISETL AQFMYKLNIP YGNEISVILI TVLLSYITLV 
FGELLPKRIA LQKPEEIALM AIRPINVISK ISTPFVKILS ASTNLFIKIL GLNKSEDKET 
VSKDEIKSMI SIGQESGVID KTEKDMLDNI FEFDHKVVKE VMTPRGEVFA IKSTTPNETI 
AKKLISEQFS RVPVYNETRD NIVGILYLKD FFEAVVKVGV DNIKLDQLIR PAYFVLENKA 
IDDLFKELQD SKQHMAVIID EYGGFSGIVT IEDLIEEVMG DILDEYDDSE NYIDKIDNNT 
YVVDGLLTLD KLNDYLNLNL ESQNIETIGG FVVNLIGNIP QSENQMVEYD NLSFQVCKTN 
KKRIEKLKIY LNNSTSFNSD VILNN