Gene CPR_1183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1183
Symbol
ID	4204070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1333458
End bp	1334561
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	30%
IMG OID	642565739
Product	sodium:dicarboxylate symporter family protein
Protein accession	YP_698505
Protein GI	110801653
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000817553
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATT TATCCTTAAT AAAAAGAATA TTTGTTGCAA TTATTTTAGG AATACTTATT 
GGGCTAGGAT GTTCCTATAT TAATTTAGAT ATACCTATTA GAATATTAAT GACCTTTAAT 
AGCATATTTG GGAATTTACT AAGTTTCTTA ATTCCACTTA TAATAGTTGG GTTTATAGTT 
CCTGGTATAG CATCCTTAGG AAATAAATCA GGAAAAGGAC TTTTCATAAC TACTTTAATT 
TCATATGCTT CAACATTTTT AATAGGAATA CTTACTTTCT TTATAGGACG CGCAGTACTT 
CCTAAATTTA TAGTAAGTGC TTCTCTAAGC ACTGGATCAG TAAATGTTGA TCCTTATTTT 
ACAATTGATA TTCCTCCAAT GTTTGGTGTT ATGTCAGCTT TAGTTTTTGC ATTCTTATTA 
GGAATAGGAA TATCAAGAAT AAAAAATAGT TACTTATTAA AAGTATCAGA AGAATTTAAT 
CACGTTATTT CATTAACTAT AAAAAATGTG TTAATACCTT TAGTACCTAT TTACATACTT 
TCAATATTTT CAAAGTTAAG TTATAATGGT GAGATTTTTA CTACTTTAAA GTCTTTTGGA 
CTTGTGTACT TAGTTTTATT TTCAATACAA GGATCTTATT TAGTGGTTCA ATATGCTTTA 
GCTGGAACTT TAAAGAAAGA AAATCCATTA AAATTACTTA AAAATATGAT TCCTGCATAT 
ATGACAGCTT TGGGAACTCA ATCATCAGCA GCTACAATCC CAGTTACTTT AAACTGTACT 
AAGGAAAATA AAGTTGACCA AGATGTAGCA GACTTTGTTA TTCCTTTAGG AGCAACAATA 
AATTTAGCAG GTGATACTAT TACTCTAGTT CTTGCATCAA TGTCTGTAAT ATATATGAAA 
GGACAAGTTC CAACTTTCTC TATTATGGTT CCATTTATAA TTATGTTAGG AGTAACTATG 
GTAGCAGCAC CAGGGGTACC AGGTGGCGGA GTTATGGCTG CTTTAGGATT ACTTGAAGGT 
ATGCTTGGAT TTGGTAATAT TGAAAAATCC TTAATGATAG CACTTCATGC TGCTCAAGAT 
AGTTTGGAAC AGCAACTAAT GTAA

Protein sequence

MKNLSLIKRI FVAIILGILI GLGCSYINLD IPIRILMTFN SIFGNLLSFL IPLIIVGFIV 
PGIASLGNKS GKGLFITTLI SYASTFLIGI LTFFIGRAVL PKFIVSASLS TGSVNVDPYF 
TIDIPPMFGV MSALVFAFLL GIGISRIKNS YLLKVSEEFN HVISLTIKNV LIPLVPIYIL 
SIFSKLSYNG EIFTTLKSFG LVYLVLFSIQ GSYLVVQYAL AGTLKKENPL KLLKNMIPAY 
MTALGTQSSA ATIPVTLNCT KENKVDQDVA DFVIPLGATI NLAGDTITLV LASMSVIYMK 
GQVPTFSIMV PFIIMLGVTM VAAPGVPGGG VMAALGLLEG MLGFGNIEKS LMIALHAAQD 
SLEQQLM