Gene Cthe_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1019
Symbol
ID	4811313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1219127
End bp	1220110
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	37%
IMG OID	640106437
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001037444
Protein GI	125973534
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.103701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATAC AATTAAAGAA ATCTGGTATA GGAGTTAAGG AAAAAAAGTC AAAAAATCAT 
CTGTTATATT CAATAAAGCA GAATTTATTT GCGTATGCAA TGTTAATACC TACTTTTGTT 
TGCATGATGT GCATTCACTT TATTCCCATG CTTCAGGGAA TATATCTGTC TTTGCTGGAT 
CTTAACCAGT TGACAATGAC TAAGTTTTTG AATGCACCGT TTATAGGTCT GAAAAATTAT 
TATGAAATTC TTTTTGATGA AAAGAGTTTG ATTAGAAGAG GTTTCTGGTT TGCTCTTAGA 
AATACGGCCA TTTATACGGT GGTAGTTACT TTTGCAACAT TTGCCCTGGG AATTATACTG 
GCTATGCTTG TAAACAGGGA ATTTAAAGGG AGAGGTATTG TAAGAACCGC GCTCCTTATG 
CCTTGGGTTG TACCTTCCTA TGTTGTTGGT ATGACATGGG GCTTTTTATG GAGACAGGAT 
TCAGGTTTAA TAAACATTAT TTTGTGTGAC ATACTGCATA TATTACCCGA AAAGCCGTAT 
TGGCTGGTAG GGTCCAACCA GATTTGGGCA ATAATTATAC CTACAATATG GAGAGGTCTT 
CCTCTTTCTA TGATTCTTAT GCTGGCCGGT TTGCAGAGTA TATCACCGGA TTATTATGAA 
GCAGCTGATA TTGATGGTGC CAACGGTTGG CAGAAGTTCT GGCATATAAC TTTGCCTCTG 
TTGAAACCTA TTCTTGCCAT CAATGTTATG TTCTCATTAA TTTCAAATAT TTATTCTTTC 
AATATTGTTT CAATGATGTT TGGTAATGGT GCCGGTATAC CGGGTGAATG GGGAGATCTT 
CTGATGACAT ACATTCAGAG AAATACATTC CAGATGTGGA GGTTTGGCCC GGGTGCGGCG 
GCTTTAATGA TTGTAATGTT CTTTGTACTT GGTATTGTTG CTTTATGGTA TACACTCTTT 
AAAGATGATT TGGTGGTGAA GTAA

Protein sequence

MDIQLKKSGI GVKEKKSKNH LLYSIKQNLF AYAMLIPTFV CMMCIHFIPM LQGIYLSLLD 
LNQLTMTKFL NAPFIGLKNY YEILFDEKSL IRRGFWFALR NTAIYTVVVT FATFALGIIL 
AMLVNREFKG RGIVRTALLM PWVVPSYVVG MTWGFLWRQD SGLINIILCD ILHILPEKPY 
WLVGSNQIWA IIIPTIWRGL PLSMILMLAG LQSISPDYYE AADIDGANGW QKFWHITLPL 
LKPILAINVM FSLISNIYSF NIVSMMFGNG AGIPGEWGDL LMTYIQRNTF QMWRFGPGAA 
ALMIVMFFVL GIVALWYTLF KDDLVVK