Gene CPR_0742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0742
Symbol
ID	4205623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	867786
End bp	869051
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	32%
IMG OID	642565302
Product	proton/sodium-glutamate symport protein
Protein accession	YP_698068
Protein GI	110803401
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000616985
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TAGGACTAGC ATTTCAAATT ATACTTGGCC TTATACTAGG TATTATAATC 
GGTGCTATTT TTTATGGAAA TCCAGTTGTT ACTTCATATT TACAACCATT TGGAGATATT 
TTTATAAGAT TAATTAAAAT GATTGTAATT CCTATCGTCT TTTCATCACT AGTTGTTGGT 
GTTGCTGGCG TTGGAGATGT TAAAAAATTA GGAAAAATAG GTGGAAAAAC TATTCTTTAT 
TTTGAGATTG TAACTACATT CGCTATTATA ATAGGTTTAG TTATAGCTAA TTTATTTCAT 
CCTGGAAGCG GAGTAAATAT TAGTACTCTT GCAACTACTA ATATTGATAA ATATATGAGT 
ACAGCACAAG CTGCATCTAG CCATGGATTT ATGGATACAT TTATAAATAT TGTTCCAACT 
AATATTTTTG AATCCCTTGC AAAAGGAGAT TTGCTTCCGA TTATTTTCTT TTCAGTTATG 
TTCGGATTAG GTGTAGCTGC AATTGGAGAA AAAGGGAAAC CAGTTCTTTC ACTATGTCAA 
GGTATTGCTG ACTCAATGTT TTGGATTACT AATCAAATTA TGAAACTTGC GCCACTTGGC 
GTATTTGGAT TAATAGGTGT AACTGTTTCT AAATTTGGAT TAGCTTCATT AATTCCTTTA 
GGAAAGTTAA TAATTACTGT TTATGGCGCC ATGTTCTTCT TTGTATTTTT TGTTCTTGGC 
TTTATTGCAA AAATGGCTGG AACAAGCATT ATATCACTTA TGAAACTTTT AAAAGATGAA 
CTTATTTTAG CTTATACTAC AGCAAGTTCT GAAGCCGTTT TACCAAAACT TATGGAAAAG 
ATGGAGAGGT TTGGCTGTCC TAAGGCAATT ACATCTTTTG TTATTCCAAC AGGATATTCA 
TTTAACTTAG ATGGATCTAC TTTATATCAA TCTATTGCAG CACTTTTTAT TGCTCAAATA 
TATGGAATTC ACTTACCACT TTCTGCTCAA ATTAATTTAG TGCTTGTATT AATGCTTACT 
TCAAAAGGTA TGGCTGGAGT TCCTGGTGCA TCTTTTGTAG TACTTTTAGC AACTGTTGGT 
TCTTTGGGAA TTCCAGTAGC AGGGGTTGCA TTTATTGCTG GTATAGATCG TATAGTTGAT 
ATGGCGAGAA CTCTTGTTAA TGTACTTGGA AATTCCTTAG CTGTTGTTGT TATATCTAAA 
TGGGAAAAGG AATTTAATGC TGAAGAAGGA GAAAAATATA TTAAATCAGT TAGTGAAATA 
GCATAA

Protein sequence

MKKLGLAFQI ILGLILGIII GAIFYGNPVV TSYLQPFGDI FIRLIKMIVI PIVFSSLVVG 
VAGVGDVKKL GKIGGKTILY FEIVTTFAII IGLVIANLFH PGSGVNISTL ATTNIDKYMS 
TAQAASSHGF MDTFINIVPT NIFESLAKGD LLPIIFFSVM FGLGVAAIGE KGKPVLSLCQ 
GIADSMFWIT NQIMKLAPLG VFGLIGVTVS KFGLASLIPL GKLIITVYGA MFFFVFFVLG 
FIAKMAGTSI ISLMKLLKDE LILAYTTASS EAVLPKLMEK MERFGCPKAI TSFVIPTGYS 
FNLDGSTLYQ SIAALFIAQI YGIHLPLSAQ INLVLVLMLT SKGMAGVPGA SFVVLLATVG 
SLGIPVAGVA FIAGIDRIVD MARTLVNVLG NSLAVVVISK WEKEFNAEEG EKYIKSVSEI 
A