Gene Cphy_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2139
Symbol
ID	5744145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2646855
End bp	2647898
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	34%
IMG OID	641293234
Product	extracellular solute-binding protein
Protein accession	YP_001559244
Protein GI	160880276
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATA AAATAATAAT AACGGTTGTG CTGTCACTCT TTGTCATATT TTTAGTTGGA 
TATACCACAT CAATAAAAAA TCACAATTTA AAAACTAGTG AAGAAGAGCA GGAAGAGTTA 
GTAATTTATA GTTCACATCC ATTGGATTTT CTAAAACCTT TAATCGAAGA ATTCGAGTCA 
AGAACAGGGA TTTTTGTAAC AGTTGTCAGT GGCGGTACCG GACAATTGAT TGACAGAATT 
GAAGAGGAAC AAGATAACCC GAATGCGGAT ATATTATGGG GCGGAACTGC GTCTATATTA 
AAACCTCAGA TGTATCTGTT TGAAGAGTAC TCTTGTGCCA ATGAAGATGT AATTCAAAAA 
GAATTTAAGA ATAAAGAAGG AGCGTTTACT AAGTTTTCTG ATGTACCCAG TGTCTTAATG 
GTTAATACAG ATTTGATTGG AAATATAAAA ATTGATGGAT ACAAAGATTT ACTAAATCCG 
GAGCTAAAAG GTAAGATAGC TTATTGTAGT CCTAATGTAT CATCATCTGC CTTCGAGCAT 
CTTATTAACA TGTTATATGC TATGGGAGAC GGGAATCCTG AGGATGGTTG GAATTATGTA 
AAACTCTTTT GTAATAATTT AGACGGGAAT CTATTATACA GTTCTACAGA TGTTTACCGT 
GGAGTTGCAA ATGGTGAATT TGTTGTAGGG CTTATATTTG AAGAAGCTGC TGCCGCATTG 
GTGGCGAATG GAGAACATAT TAAAATTACA TACATGGAAG AAGGAGTTTT ATCTACACCT 
GATTGCGTTA CCATTGTTAA AAATTCGCCT CATCTTAAAA ATGCCAGGGC TTTCATTGAT 
TTTGCTACCG GATATGAAGT ACAGACGATG ATAACAATGG AGCTTAATAG ACGATCGGTT 
CGTGACGATG TAAAAACTCC AACGTACCTT AAAGCAAAGG ATGAGATTGC AATTATTCAT 
GCAGATAATG AACTAATTTA TGAAATGAAA AAAGAATGGA TACGAAAATT TGAAGAAATA 
TTTCTAGATA TCAAAGAAGA ATAG

Protein sequence

MKYKIIITVV LSLFVIFLVG YTTSIKNHNL KTSEEEQEEL VIYSSHPLDF LKPLIEEFES 
RTGIFVTVVS GGTGQLIDRI EEEQDNPNAD ILWGGTASIL KPQMYLFEEY SCANEDVIQK 
EFKNKEGAFT KFSDVPSVLM VNTDLIGNIK IDGYKDLLNP ELKGKIAYCS PNVSSSAFEH 
LINMLYAMGD GNPEDGWNYV KLFCNNLDGN LLYSSTDVYR GVANGEFVVG LIFEEAAAAL 
VANGEHIKIT YMEEGVLSTP DCVTIVKNSP HLKNARAFID FATGYEVQTM ITMELNRRSV 
RDDVKTPTYL KAKDEIAIIH ADNELIYEMK KEWIRKFEEI FLDIKEE