Gene CPF_1223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1223
Symbol
ID	4203555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1391813
End bp	1392976
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	31%
IMG OID	638082104
Product	sodium:dicarboxylate symporter family protein
Protein accession	YP_695669
Protein GI	110800158
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00163296
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGAAAT TATTTAATAA TCTTATTTTT AAACTTGTTT TAGGTGTTAT ATTAGGAATA 
ATAATAGGCA CATACTCTTC AGAGGGGCTT ATGTCAACAA TTGTGACAAT TAAGTATGTA 
TTGGGACAAA TTATATTTTT CTCTGTTCCA CTTATTATTT TAGGATTTAT AGCTCCATCT 
ATTGCTAAAT TAAAAGATAA CGCAAGCAAA CTATTAGGAT ATGCTGTTTT AATAGCTTAT 
TTATCTTCAG TTTTTGCTGC TATTCTTTCA ATGATTGCAG GATATGCATT AATACCTAAA 
TTATCTATAG TATCTAATAT AGCATCATTA AAGGAATTAC CAGAACTTAT ATTTAAATTA 
GATATACCAC CAGTTATGAG TGTAATGAGT GCGTTAGCTT TAGCATTACT TTTAGGATTA 
GCTGTTGGAT GGACAAAGGC TGATTTAGTA GAAAAGCTTT TAGATCAATT TCAAGCTATA 
GTACTTAGTA TTGTAAATAA AATAATAATA CCAATATTAC CATTTTTCAT AGCAACTAAC 
TTTGCAGCTT TAGCTTATGA AGGAGGATTA AGTAATCAAC TTCCTGTATT CTTTAAAGTT 
ATATTAATTG TATTATTTGG TCATTTTATA TGGTTAACAA TTTTATATTT AATAGGTGGA 
GCAATATCAA AAGAAAATCC ATGGGAAGTT GTAAAGTATT ATGGACCAGC ATATCTTACT 
GCAGTAGGTA CAATGTCAAG TGCAGCAACA TTACCAGTAG CTTTAGAGTC TGCAAAGAAA 
TCAAAGGCTT TAAGAGAAGA TATAGTGGAT TTTGCAATAC CATTATGTTC AAACATACAT 
TTATGTGGTT CAGTTCTTAC AGAAGTATTC TTTGTAATGA CAGTATCTCA AATTTTATAT 
GGTAAGATTC CGAGTTTACC AACTATGATA TTATTTATAG TATTATTAGG GGTGTTTGCA 
ATCGGGGCAC CAGGAGTCCC TGGGGGGACA GTAATGGCAT CATTAGGTTT AATAATTAGT 
GTATTAGCCT TTGATGAGGC TGGGACAGCT CTTATGTTAA CAATATTTGC TCTTCAAGAT 
AGTTTTGGAA CAGCATGTAA TGTAACTGGT GATGGAGCAA TAGCTCTTAT GCTGACAGGT 
ATAGCAAAGA AAAAGAACTT ATAA

Protein sequence

MKKLFNNLIF KLVLGVILGI IIGTYSSEGL MSTIVTIKYV LGQIIFFSVP LIILGFIAPS 
IAKLKDNASK LLGYAVLIAY LSSVFAAILS MIAGYALIPK LSIVSNIASL KELPELIFKL 
DIPPVMSVMS ALALALLLGL AVGWTKADLV EKLLDQFQAI VLSIVNKIII PILPFFIATN 
FAALAYEGGL SNQLPVFFKV ILIVLFGHFI WLTILYLIGG AISKENPWEV VKYYGPAYLT 
AVGTMSSAAT LPVALESAKK SKALREDIVD FAIPLCSNIH LCGSVLTEVF FVMTVSQILY 
GKIPSLPTMI LFIVLLGVFA IGAPGVPGGT VMASLGLIIS VLAFDEAGTA LMLTIFALQD 
SFGTACNVTG DGAIALMLTG IAKKKNL