Gene Cthe_1410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1410
Symbol
ID	4809071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1728803
End bp	1729804
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	39%
IMG OID	640106833
Product	cation diffusion facilitator family transporter
Protein accession	YP_001037834
Protein GI	125973924
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0053] Predicted Co/Zn/Cd cation transporters
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGAAACA ATTTTGATGA ATACGGTAGT GTTTGGAATG GAGGCCTTGC GTTGATTAAA 
CTTTTAATCA GGTGGTTTAT CAAGGATTAT CAAAATGTGG ATAACAAAAA GGTAAGGGAA 
GCTTACGGAG TATTGTCGGG AGTAACAGGC ATTATTTGCA ACGTATTTTT GTTTATTGTA 
AAAATAACTG TGGGACTGGT CATGAACAGT ATTGCAGTAA TTTCTGACGC TTTCAACAAT 
TTAAGCGATT TAGGTTCGTC ATTGGTTGGA ATACTCGGTG TCAAGCTTAG CAACAGGCCT 
CCGGACGAGG AACATCCTCA TGGCCATGGA AGGTATGAGT ATATATCATC TCTTGTGGTG 
TCGTTTATTA TATTTGGTGT TGGCCTTGAA CTTTTGAGAA ATTCTTTTTG GAAAATAATC 
AAACCTGAAG AAGTGACATT GAGTACAATA TCGATATTAT TGCTCGTTAT CTCAGTGGCT 
GTAAAATTGT GGATGTTTTC ATACAATAGA TATATAGGAA AAATAATCAA TTCGGGAATT 
AACAAAGCGA CAGCCCAGGA TAGTCTGAAC GATGCCATTG CCACAACCGC AGTGCTTGCA 
GGAACTCTAA TTGGAAGGTT TGTTTCTTTT CCCCTGGATG GAATTATGGG TTTAATCATA 
TCCGCACTGA TTATGTATAC AGGATTTGGT ATTGCGAAAG ATTCGGTGGA CCTGCTTCTG 
GGCCTGTGTC CTAACTCTGA GCTCATCGAG AGCATAAATT CATATTTTTT GGTCGGAGAA 
AAAATAAAGG GCACTCATGA CTTGAAAGTT CATGATTACG GTCCCGGCAG AATAAGCGCG 
TCTATTCATG CCGAAGTGCC TGAAGGGGCA GACATAGTTG AAATACATTC AATAATTGAT 
GAAATCGAGC AAAGAATAAA AAATGAGCTC GGAATTGACA TAGTCGTTCA TATGGATCCT 
GTTGAAGAGA AAAAAGAGGA TTGTTGTAAC GACGATAAAT AA

Protein sequence

MGNNFDEYGS VWNGGLALIK LLIRWFIKDY QNVDNKKVRE AYGVLSGVTG IICNVFLFIV 
KITVGLVMNS IAVISDAFNN LSDLGSSLVG ILGVKLSNRP PDEEHPHGHG RYEYISSLVV 
SFIIFGVGLE LLRNSFWKII KPEEVTLSTI SILLLVISVA VKLWMFSYNR YIGKIINSGI 
NKATAQDSLN DAIATTAVLA GTLIGRFVSF PLDGIMGLII SALIMYTGFG IAKDSVDLLL 
GLCPNSELIE SINSYFLVGE KIKGTHDLKV HDYGPGRISA SIHAEVPEGA DIVEIHSIID 
EIEQRIKNEL GIDIVVHMDP VEEKKEDCCN DDK