Gene CPF_1731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1731
Symbol
ID	4201928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1952947
End bp	1954602
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	30%
IMG OID	638082603
Product	SulP family sulfate permease
Protein accession	YP_696167
Protein GI	110801327
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.281721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACAAAC CAAAGTTAAT TTCTCTTTTA GATGATAAAG AGAACGGATT TTCAAAAGAA 
CAATTTTTTA AAGATTTAAT CGCTGGGATA ATAGTTGCTA TTATAGCACT TCCCCTATCT 
ATTGCATTAG GTATTTCTTC AGGGGTGTCT CCTGAGAAAG GATTAATAAC TGCAATCATA 
GCTGGATTTA TAATTTCATT ATTAGGAGGA AGTAGAGTTC AAATTGGTGG GCCTACTGGT 
GCCTTTGTTG TTATAGTATT TGGTATTATA CAAAATCATG GAGTTGATGG ACTAATAATT 
GCCACATTTA TGGCTGGTAT TATTCTTGTT TTATTTGGTT TATTACGATT TGGTAGCTTA 
ATAAAATACA TACCTTATCC AATAACGGTA GGATTTACTT CTGGTATAGC TGTAACTCTT 
TTCTCAACAC AGGTTAAGGA TTTTTTAGGA CTTTCAATGA CTAAAACCCC TTCTGAGTTT 
ATACCTAAGT GGGAAGCTTA CATATCTCAT ATGAACACTA CAAACCTTTA TACATTAGCT 
ATAGGATTAC TAGCACTTAT TATTTTAATC TTTTGGCCAA AAATAAATAA AAAGATTCCA 
GGATCTTTAA TAGCTTTAAT AGTAACAACT TTAGTAGTAT TTATATTTAA TTTACCAGTT 
GCAACAATAG GAAGTCAATT TGGTAAAATA AGCTCAAATA TTCCAATGCC TCATATTCCT 
AACCTAAATC TTAATACATT AAAAGCATTA ATCGGACCTG CTTTTACAAT AGCGCTTTTA 
GGTGGAATTG AATCTTTATT ATCTGCTGTT GTTTCAGATG GTATGATTGG AGACAAGCAT 
AATTCAAATG CAGAACTTAT AGCACAAGGA ATAGCTAATA TGGGTTCTTC TCTATTTGGA 
GGAATTCCTG CTACTGGAGC AATTGCTAGA ACTGCTGCCA ATGTTAAAAA TGGGGGAAGA 
ACTCCTATTT CGGGTATAGT TCATTCAATA ACTTTATTAC TTATAATGCT TGTATTTATG 
CCTCTTGCTA AATTCATTCC ATTAACTACT TTATCAGCAA TATTAATAAT TGTTTCATAT 
AACATGAGTG AATGGAGAAC TTTTAAAGCA ATACTTAAGG CTCCTAAAAG TGATATAGCT 
ATATTACTAA CAACATTTTT CTTAACAGTA TTATTTGATT TAGTAATTGC TATAGGAATA 
GGAATGGTAG TTTCTATGTG CTTATTTATG AGAAGAGTTG CTACTTCTAT AGAAGTAAAT 
GAATTAAATG AAAGTGACTG TTCTGATAAA TCTAATATAG ATACTGATAT GGAAAATCTT 
AAGGTTGGAG AAAATGTCTT AGTCTATGAT ATAAGAGGTC ACCTTTTCTT TGGTGCTGTA 
GATACATTTA TGAATACAAT GAAGGAAATA AATGATGATG CAAAGGTTCT TGTTTTAAGA 
ATGAGACATA CTAAGACTTT AGATGTTACA GGATATAAAC AAATAAAAAA TATAGCTCTA 
AGTTGTAAGT CTCGTAATAT GACTTTAATA ATATCTGAAT TACAAGAACA GCCAAAAAAA 
GTTATGAGAC TTATGGGATT TATAGATACT TTAGGTGAAG ATCACTTTGC TACAAATTTT 
GATGAAGCTT TAGAAAAAGC AAATTCTTTA ATTTAA

Protein sequence

MYKPKLISLL DDKENGFSKE QFFKDLIAGI IVAIIALPLS IALGISSGVS PEKGLITAII 
AGFIISLLGG SRVQIGGPTG AFVVIVFGII QNHGVDGLII ATFMAGIILV LFGLLRFGSL 
IKYIPYPITV GFTSGIAVTL FSTQVKDFLG LSMTKTPSEF IPKWEAYISH MNTTNLYTLA 
IGLLALIILI FWPKINKKIP GSLIALIVTT LVVFIFNLPV ATIGSQFGKI SSNIPMPHIP 
NLNLNTLKAL IGPAFTIALL GGIESLLSAV VSDGMIGDKH NSNAELIAQG IANMGSSLFG 
GIPATGAIAR TAANVKNGGR TPISGIVHSI TLLLIMLVFM PLAKFIPLTT LSAILIIVSY 
NMSEWRTFKA ILKAPKSDIA ILLTTFFLTV LFDLVIAIGI GMVVSMCLFM RRVATSIEVN 
ELNESDCSDK SNIDTDMENL KVGENVLVYD IRGHLFFGAV DTFMNTMKEI NDDAKVLVLR 
MRHTKTLDVT GYKQIKNIAL SCKSRNMTLI ISELQEQPKK VMRLMGFIDT LGEDHFATNF 
DEALEKANSL I