Gene Cthe_2967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2967
Symbol
ID	4810855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3485676
End bp	3486854
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	43%
IMG OID	640108389
Product	major facilitator transporter
Protein accession	YP_001039357
Protein GI	125975447
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTCGT TGTTGTTGGC GCTTATTTAT CTCGCTTTTA TCAGTTTGGG ACTGCCCGAT 
GCACTTCTTG GCTCGGCCTG GCCTACCATG TACCCCGTGC TGGAAGTACC TGTTTCTTTT 
GCAGGCATAA TATCTATGAT TATTGCAGGG GGTACCATTG TCTCGAGTTT AAATACAAAC 
CGGGTGGTTC GCAAATTTGG CACCGGACTT GTGACTGCTG TCAGTGTATT GATGACGGCG 
GTGGCTCTGT TTGGGTTTTC CGTTTCGAAA ACTTTTTGGA TGCTTTGCCT TTGGTCTATT 
CCATACGGTC TTGGAGCAGG TGCGGTGGAT TCGGCCCTGA ACAATTTTGT GGCACTTCAT 
TATGCTTCCA GGCACATGAG TTGGCTGCAC TGTTTTTGGG GTATAGGTGC GTCTGTTGGA 
CCTTATATCA TGAGTTATTG TCTGACAGTT AAGAACAGTT GGGAAAGTGG TTATATGACA 
GTAGGTGCTT TTCAAATCGT ATTAACAGTT ATTCTCTTTT TCAGTCTGCC TGTTTGGAAC 
AAGCAGGCAA AGATCAAGAA GGAGAGTCAA ACAGAGGAAC CAAAGCATTT GAAAATTCAT 
GAGGCATTAA AAATTAAAGG GGTTAAGCAG GTACTAATAG CGTTTTTCTC CTATTGTGCT 
CTCGAGACCA CTGCAGGCTT GTGGGCCAGC AGTTATCTCG TGCTGCATCA GGGAATTGAG 
GCAAAAGTGG CTGCAAGATG GGCTTCTTTG TTTTATTTAG GTATTACTTT CGGGCGCTTT 
CTGAACGGTT TTGTTACTGA CAAATTAGGG AACCGCAATA TGATTCGCAT AGGACTAGGT 
ATTATAACCA TAGGATTGGC AGCGGTGATT TTGCCGGTGC AAATTGAACT TGTAACGTTG 
GCAGGTTTGG TTTTAATCGG CATAGGATGC GCTCCTATCT ATCCTTGCAT CATACATGAG 
ACACCAAAGA ATTTTGGAGC GGAGAATTCT CAGGCTATTA TCGGAATTCA GATGGCAAGT 
GCTTATACCG GTTCAACATT CATGCCGCCT ATATTTGGTG TGCTGGCAAA ATTTACAACG 
ATTTCTTTAT ATCCGGTTTA TTTGACATTC TTCCTGATTT TGATGATAGT AATGACGGAA 
AGGCTTAATC GTCTTGTAGT AAGTAAAGAG AGCAGATAA

Protein sequence

MYSLLLALIY LAFISLGLPD ALLGSAWPTM YPVLEVPVSF AGIISMIIAG GTIVSSLNTN 
RVVRKFGTGL VTAVSVLMTA VALFGFSVSK TFWMLCLWSI PYGLGAGAVD SALNNFVALH 
YASRHMSWLH CFWGIGASVG PYIMSYCLTV KNSWESGYMT VGAFQIVLTV ILFFSLPVWN 
KQAKIKKESQ TEEPKHLKIH EALKIKGVKQ VLIAFFSYCA LETTAGLWAS SYLVLHQGIE 
AKVAARWASL FYLGITFGRF LNGFVTDKLG NRNMIRIGLG IITIGLAAVI LPVQIELVTL 
AGLVLIGIGC APIYPCIIHE TPKNFGAENS QAIIGIQMAS AYTGSTFMPP IFGVLAKFTT 
ISLYPVYLTF FLILMIVMTE RLNRLVVSKE SR