Gene Cphy_3590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3590
Symbol
ID	5742615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4434607
End bp	4435923
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	37%
IMG OID	641294702
Product	extracellular solute-binding protein
Protein accession	YP_001560678
Protein GI	160881710
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000122441
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAGAA AATTGTTAAG TGTAACTCTT ATGATTGCAA TGGTAGCTTG TCTATTTACG 
GGATGTTCCA AAAACGATGG CTCGTCAAAG ACAGGTAGTA ACAATGCAGG TTCAAAAACG 
TCAGACCAAG TAACACTCAC GGTTTGGTGT TGGGATCCGA AATTTAACTG CTTTGCTATG 
GATACTGCTG GCGAAATTTA TGCAAAGGAT CATCCAAATG TAAAGGTTGA AGTAATTGAA 
ACTGCTTGGA ATGATATCCA AACTAAATTG ACTACAGCAG TTACCGGGCA GTCGAACACG 
TTACCTGATA TTATATTAAT GCAGGACAAT GCATTAGCTA AGAATATCAT TAACTATCCG 
GATGCGTTTT TTGATCTAAC AAATTCCGGT ATTAAGTTTG ATCAATTTGC ATCGTTTAAA 
ACTGCATTAG GAACTGTAAA TGGGAAAAAT TATTCTGTTC CTTTTGATAA TGGCGCAGCA 
ATTACCTGTT ATAGGACAGA TATCTTAGAA CAAGCGGGAT ACACAATAGA TGATTTTACG 
AATATTACAT GGAAAGAATT TATTGAAAAA GGTAAAGTTG TTCTTGAAAA GACAGGAAAG 
CCTTTATTAT CGAATCAAGC AGGTTCTCCA GACCTCTTAA TGCTTATGAT GCAGAGTGCA 
GGTGCTTGGG TACTTGATGA GAATGGTAAA CCAAACTTTA AGGATAACGC AGTTTTAAAA 
GAAGTTATCG ATACATATGT AGAATTAGAA AAATCCGGTG TACTTGTTGA AGTAAATGAC 
TGGGATCAAT ATGTAAGTAG TATTAATAGT ACAACAGTAG CTGGTGCAAT GAACGGATGT 
TGGATTATTG CTACGGTAAC AAGTGCAGCA GATCAATCTG GTTTATGGGG AGTAACCAAT 
ATTCCTAAAT TATCATGTGC GGGTGCTACA AATTATAGTA GCCAGGGTGG CTCTTCTTGG 
CTAGTATGTG CGAATTCTAA AAATAAAGAT GTAGCAGCAG ACTTTTTAGG TGCAACATTT 
GGTGGTAGCG TGGAATTATA TGAAACAATT CTTCCATCTT CCGGTGCATT AGCAACTTAC 
TTACCAGCTG GGGAAAGTGC TGCTTATGCT AAACCACAAG ATTTCTTTAG GGGAGATACC 
ATTTACTTAA AGATAACAGA GTATGCTTCT AAGGTGCCTC AGGTTTCTTA TGGCGTATAC 
AACTATGAAG CAAGGGATGC TATCGGTACT GCGATTACAA AGATTGTAGC AGGTACGGAT 
TATAATACTG CAATCAGTGA AGCTCAGAAA GAATTAGAAT TCCAGATGGG TCAATAA

Protein sequence

MKRKLLSVTL MIAMVACLFT GCSKNDGSSK TGSNNAGSKT SDQVTLTVWC WDPKFNCFAM 
DTAGEIYAKD HPNVKVEVIE TAWNDIQTKL TTAVTGQSNT LPDIILMQDN ALAKNIINYP 
DAFFDLTNSG IKFDQFASFK TALGTVNGKN YSVPFDNGAA ITCYRTDILE QAGYTIDDFT 
NITWKEFIEK GKVVLEKTGK PLLSNQAGSP DLLMLMMQSA GAWVLDENGK PNFKDNAVLK 
EVIDTYVELE KSGVLVEVND WDQYVSSINS TTVAGAMNGC WIIATVTSAA DQSGLWGVTN 
IPKLSCAGAT NYSSQGGSSW LVCANSKNKD VAADFLGATF GGSVELYETI LPSSGALATY 
LPAGESAAYA KPQDFFRGDT IYLKITEYAS KVPQVSYGVY NYEARDAIGT AITKIVAGTD 
YNTAISEAQK ELEFQMGQ