Gene Cphy_3210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3210
Symbol
ID	5741988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3913601
End bp	3915310
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	36%
IMG OID	641294310
Product	putative multiple sugar transport system substrate-binding protein
Protein accession	YP_001560303
Protein GI	160881335
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000204614
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA GATTTTTGTC ACTGTTTTTA GTACTAATGC TAATGGCTTC TTTAGCAGCA 
GGATGCAGTA AAAAGGTGGA CGATACGAAA GATGTAGACA ATTCTAAAGT TGAAGCAACA 
AAAAAACCGG AAAATACAAA AGCACCAGAT AAGCAAGAAA TTAAAGAATT CACTGCATTT 
TTCGCAGTAC CTGGAACTGA AATCAACAAC AATAATGTTG CTATGGAGAA ATTAGCTGAG 
TTAACAGGAG CTAAGTGTAA AGAGACTTGG TTAACTGGTC AGACAGCAGA AGAAGCAGTT 
GGTACATTAA TTGCTGGTGG TGAATACCCA GATTTTATTT GCGGTTCTAC AGGTCATGCT 
CAGTTATTAG AAGCAGGTGC CTATATTGCA ATTGATCAGT ATTGGGATAA ATACCCTAAT 
ATTAAGAATT ACTTATCAGA GGAAGAGTGG AATAAAGTTA GAGCAGAGGA TGGACATGTG 
TATATCATTC CTCAATTTGG TATTATTAAT GAAAAAGATA CCGAATGTGT ACATAATGAC 
GAAGCATTTT GGATTCAAAC AAGAGTATTA AAGTGGGATA ATTACCCTAA GATTACAACT 
CTTGATCAGT ATTTTGACTT GATAGAAAGA TATATTGCAG CAAATCCTAC TATGCCTGAT 
GGAACTGCAA ATATTGGATA TGAAATCTTA ACTGATGACT GGAGATATTT CTGCTTAGAG 
AATGCACCAT TTTTCTTAGA TGGTTATCCT AATGATGGTT GCTGTATAGT AGATCCAGTA 
ACTTTAGAGG TTTCTGATTA TAATACAACA GATACTGCAA AGAAGTACTT TGCAAAACTT 
AATGAAGAGT TTAAGAAGGA AATTATCGAT CCTGAAACTT TTACAATGTC TTATGACCAG 
TATATAGCAA AGCTATCTTC CGGTCGTGTA TTAGGTATGG TTGACCAACA TTGGAACTTC 
CAGCAGGCAG AAGATGCAAT CAAGACACAG GGCTTAGATG ATTGTACTTA TATACCATTA 
GGAATTGTTA TGAATGAAGG AACAAAAGAT CGTTACCATT CAGCAAGTGC TCTCGATGTT 
TCTAACGGTT TAGGAATTAC AGTAAGCTGT AAAGATGTTG AAGGTGCAAT GAAGTTTATG 
GATGATTTAT TATCACAGGA AGCATTAACA CTTCGTTTCT GGGGTATTGA AGGGCAAGAT 
TATATGGTTG GCGACGGTGG AGTTTTCTAT CGTACAGACG AACAACGTAA TAATGCAGTA 
AGTCAGGATT ATCAGGTAGC TAATTTATGT AAATACTCAT ATTTCCCACA ATTAGAAGGT 
ATGAATCGTG ATGGTATTAA TGCATGGGAA CCAGGCAGTC AGCCAGGAGA GTTCTTTGAT 
GCTCTTAAGC CAGAGGTTCA GGAATGCTTA AAGGCATATG GTGCAGAAAC CTATGTTCAG 
TTGTTAAATC CAGCAGGAGA AAATTCACCT TGGTTCCCAA TGTGGTCTTA TTCTAATACA 
TTTACCTCAG ATACAGATCA TGGTATGGCA AAGGTAAATA TGGATGAAGT TAAACACGAG 
TATTTACCAA AGGCTGTTAT GGCGAAAGAC TTTGAAGCTG CTTGGCAGGA TTACATGAAA 
GTTTACAGCG ATAGAGTAAA TATTGATGCT TACTTAAAAG CTATAAAAAC TGAAGTTGAA 
AGAAGAATAG CTGTTGCAGA AGGCAAATAA

Protein sequence

MKKRFLSLFL VLMLMASLAA GCSKKVDDTK DVDNSKVEAT KKPENTKAPD KQEIKEFTAF 
FAVPGTEINN NNVAMEKLAE LTGAKCKETW LTGQTAEEAV GTLIAGGEYP DFICGSTGHA 
QLLEAGAYIA IDQYWDKYPN IKNYLSEEEW NKVRAEDGHV YIIPQFGIIN EKDTECVHND 
EAFWIQTRVL KWDNYPKITT LDQYFDLIER YIAANPTMPD GTANIGYEIL TDDWRYFCLE 
NAPFFLDGYP NDGCCIVDPV TLEVSDYNTT DTAKKYFAKL NEEFKKEIID PETFTMSYDQ 
YIAKLSSGRV LGMVDQHWNF QQAEDAIKTQ GLDDCTYIPL GIVMNEGTKD RYHSASALDV 
SNGLGITVSC KDVEGAMKFM DDLLSQEALT LRFWGIEGQD YMVGDGGVFY RTDEQRNNAV 
SQDYQVANLC KYSYFPQLEG MNRDGINAWE PGSQPGEFFD ALKPEVQECL KAYGAETYVQ 
LLNPAGENSP WFPMWSYSNT FTSDTDHGMA KVNMDEVKHE YLPKAVMAKD FEAAWQDYMK 
VYSDRVNIDA YLKAIKTEVE RRIAVAEGK