Gene CPR_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1019
Symbol
ID	4206584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1161048
End bp	1162355
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	30%
IMG OID	642565576
Product	sodium:dicarboxylate symporter family protein
Protein accession	YP_698342
Protein GI	110801814
COG category	[R] General function prediction only
COG ID	[COG1823] Predicted Na+/dicarboxylate symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00254139
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAATA TTAAATTAAT ATTAGCAATT GTGCTTTCAA TATTAGCAAC ATATGCTATA 
TATAAAATAA GAAAAATTAC AAATAAATTT TCATTTGCTA CGCTGACAGC ATTAACTTTA 
GGGGTAGTAC TTGGAATTAT ATTTAAGGAG AATATACTAT TTTTAGATAC AGTAGGAAAG 
GCTTATATGT CTTTAATTAA GATGATAGTA GTTCCTTTAG TAGTAACATC CTTAATAACT 
AGTATTGTTA GATTAGAAAA TTTAGATACA TTAAAATCAA TAGGATTAAA AACATTTACT 
GTTTTATTAG GAACTACAGG AGCTGCAGCC TTTATAGGAA TTATTGTAGC TAGTTCTTTA 
AATCTTGGAC AAGGTTTAAG ATTTATAGGG GCTGAAAATT TTAAGGCAAG AGAAATACCA 
GGGTTTTCTA AGGTACTTAT AGATATGCTA CCATCAAATC CTTTAGCGGC TATTGTAGAG 
AATAAAATAA TACCAATAGT TATTTTTTCA ATGTTTATAG CAATTGCCTT AGTTATTGAA 
GATAATACTA ATAAAGAAAA AGCAAAGCCA TTTAAAGATT TTATTTTATC AGCTTATGAT 
ATAGTTTTAA GAATAACTAA GATGGTATTA AGAATAATAC CATATGGAGT ATTTGCCTTA 
ATAGCTACAG CGGCAGCTAA AAATGGAATG GATACTTTGA TGTCATTAAT ATGGGTAATA 
CTAGCTGTTT ATATAGCTGC CTTTCTTCAA TTTTTATTTG TATATACTCC ATTAATAAGC 
TTTGTTGCAA GAATGAATCC ATTAAAATTC TTTAAAGGAA TTTTTCCGGC ACAGGTTGTA 
GCTTTTACAA GTCAAAGTAG TTATGGTACT TTACCTGTTA CAATAAAATC TTTAGTAGAG 
GGTGTTGGAG TATCAGAAAA TATAGCAAGC TTTGTAGCAC CACTTGGATC AACAATTGGA 
CTAAATGGAT GTGGAGGTTT TTATCCAGCA ATAGTTGCAA TATTTGCAGC CAATGTTTTT 
AATGTAGAAC TTACTATTTA TTCATACATA CTTATAGTTT TAACTGCTAT AATATCTTCC 
ATAGGAATAG CAGGGGTACC TGGATCAGCA ACAATGTCAA CAACTGTAAT GTTAGCGGCT 
TTAGGATTAC CAATAGAAGC ATTAGCAATG GTGATTGCAG TAGATTCTAT AATTGATATG 
ATAAGAACTG CCACAAATGT AACAGGGGCT TCAGTTGCTG CATTAATAGT TGATCAAACA 
GAAAAAAGAA AAGAATATAA AGTTGAAGAA TCAGTACAAA GAGCATAA

Protein sequence

MINIKLILAI VLSILATYAI YKIRKITNKF SFATLTALTL GVVLGIIFKE NILFLDTVGK 
AYMSLIKMIV VPLVVTSLIT SIVRLENLDT LKSIGLKTFT VLLGTTGAAA FIGIIVASSL 
NLGQGLRFIG AENFKAREIP GFSKVLIDML PSNPLAAIVE NKIIPIVIFS MFIAIALVIE 
DNTNKEKAKP FKDFILSAYD IVLRITKMVL RIIPYGVFAL IATAAAKNGM DTLMSLIWVI 
LAVYIAAFLQ FLFVYTPLIS FVARMNPLKF FKGIFPAQVV AFTSQSSYGT LPVTIKSLVE 
GVGVSENIAS FVAPLGSTIG LNGCGGFYPA IVAIFAANVF NVELTIYSYI LIVLTAIISS 
IGIAGVPGSA TMSTTVMLAA LGLPIEALAM VIAVDSIIDM IRTATNVTGA SVAALIVDQT 
EKRKEYKVEE SVQRA