Gene CPF_2335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2335
Symbol
ID	4202670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2596807
End bp	2598255
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	32%
IMG OID	638083200
Product	extracellular solute-binding protein
Protein accession	YP_696758
Protein GI	110799804
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAT TCAAAAAACT AATAGCTTTA ACAGCTTGTG CAATGTTAAC TACTTCAGTT 
GCATTAACTG GATGTGGAGC AGACAAAACA GCAAATGCTG GAGAGGGAGA AACAGTAAAA 
CTTACTTGGT ATACAATTGG ACAAACACCA AAAGATTTAG ACATGGTTCA AGAAAAAGCT 
AATGAATATT TAAAAGAAAA GATAAATGCT ACTATTGATA TGAAATTTAT TGATTACGGT 
GATTACACTC AAAAAATGGG AGTTATAATA AATTCAGGAG AACCATATGA CTTAGCATTT 
ACTTGTTCAT GGGCTAACCC ATATTTAGAA AATGCTAGAA AAGGAGCTTT CTTAGAAATA 
GACGAATTAT TAGAAACTAA AGGTAAAGAA ATGAAGTCTG TTATAGATGA AAGATTCTGG 
GAAGGTGCTA AAATAGATGG TAAAACATAT GCAGTTCCAA ACCAAAAGGA AATAGGAGTT 
GCACCTATGT GGGTATTCAC TAAGGAATAT GTTGATAAAT ACAACATACC ATATCAAGAT 
ATCCATACTT TAGAAGATTT AGAGCCATGG TTAAAAGTTA TCCATGAAAA TGAGCCAGAT 
GTTACACCTT TATACATAAC AAAAGGATTC TCAGCACCAG CTTACTTCGA TCAATTAGTT 
GATCCAGTAG GAGTTGAGTA TGGAGATGAA AGCTTAAAGA TTAAAAATAT GTTTGAAACA 
GATAAAATGA AGAGCGAATT AGAAACTTTA CAAAAGTACT ATGATGCTGG ATATATAAAT 
GCTGACTCAG CTACAGCTAA GGATGATAAA GCAGTTAAGA GATTTGTAAC TAAAGCTGAT 
GGACAACCTT ATGCTGATGG ATTATGGTCA AAGGATTTAG GATATGAGGT AGTTTCATCA 
CCAATAATGG ATACTCATAT TACTAATGGT TCAACTACAG GATCAATGAT AGCTATTTCT 
AAAACTTCAG AGCATCCAGA AAAAGCTATG GAATTCTTAA ACTTATTAAA CACTGACGTA 
TATTTAAGAA ACTTACTTAA CTATGGTATA GAAGGAACTC ACTATGAAAA AACTAGTGAT 
ACTCAAATAA AATTAACTGA TAAAGCTAAA GACTACTCAG TTGGATACTA TACTTTAGGT 
AACTTATTTA TAACTTATAC TTTAGATAAC GAACCAGTTG ATAAGTGGAA AGAATTCGAA 
GCATTTAATG ATGCATCAGT TGAATCACCT GCTCTAGGAT TCAAATTTAA CACTGAAAAA 
GTAAGTAACC AAATAGCTGC TATAAACAAC GTTCTTGAAG AGTTCAAGGC AACTATATAC 
AGTGGATCAG TTAACGAAGC TGAATATTTA GACAAAATGA ACAAGAAATT AAAAGAAGTT 
GGAATAGATG AAGTAATTTC AGAAATGCAA AGCCAAATAG ATGCATGGAA AGCTGAAAAT 
GGAAAATAA

Protein sequence

MLKFKKLIAL TACAMLTTSV ALTGCGADKT ANAGEGETVK LTWYTIGQTP KDLDMVQEKA 
NEYLKEKINA TIDMKFIDYG DYTQKMGVII NSGEPYDLAF TCSWANPYLE NARKGAFLEI 
DELLETKGKE MKSVIDERFW EGAKIDGKTY AVPNQKEIGV APMWVFTKEY VDKYNIPYQD 
IHTLEDLEPW LKVIHENEPD VTPLYITKGF SAPAYFDQLV DPVGVEYGDE SLKIKNMFET 
DKMKSELETL QKYYDAGYIN ADSATAKDDK AVKRFVTKAD GQPYADGLWS KDLGYEVVSS 
PIMDTHITNG STTGSMIAIS KTSEHPEKAM EFLNLLNTDV YLRNLLNYGI EGTHYEKTSD 
TQIKLTDKAK DYSVGYYTLG NLFITYTLDN EPVDKWKEFE AFNDASVESP ALGFKFNTEK 
VSNQIAAINN VLEEFKATIY SGSVNEAEYL DKMNKKLKEV GIDEVISEMQ SQIDAWKAEN 
GK