Gene Cthe_1658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1658
Symbol
ID	4808908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1984293
End bp	1985645
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	38%
IMG OID	640107073
Product	TrkH family potassium uptake protein
Protein accession	YP_001038074
Protein GI	125974164
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0168] Trk-type K+ transport systems, membrane components
TIGRFAM ID	[TIGR00933] potassium uptake protein, TrkH family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.552595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGAAAAT ATATAAGAAA ACTGAAATCA TTATCATACC CACAGATAAT AGCACTTGGC 
TACTTTCTGA TAATAATTGC CGGGACATTT TTGCTGTCAT TGCCGATAGC CAGCCGCAAT 
AATTTATTTC CCGGATTAAT TAATGCACTT TTTACAGCAA CCTCTGCTAC TTGTGTAACA 
GGGCTTGTTG TTTTTGACAC CTATACACAA TGGTCGCTAT TTGGACAAGT AGTTATTTTA 
CTGCTGATTC AAATAGGTGG CTTAGGGTTT ATGACGGTTG TCACAATGTT TTCTATTTTT 
TTAAAAAGAA AAATCGGGCT GAAAGAAAGG GGACTTTTAC GTGAAAGTAT AAATGCTATG 
TATATCGGTG GGATTGTACG TCTGACCAAA AGAATATTGC TTGGCACTTT GCTGTTTGAA 
GGTATTGGTG CAGTATTGCT ATCATTGAGG TTTATACCCA AAATGGGCTT GCTGGAAGGT 
ATATATAATG GCATTTTTCA CTCGGTTTCA GCTTTTTGCA ATGCCGGGTT TGACATTATG 
GGAAAGTACG GCAAGTATTC ATCGCTAACA AATTTCGCCG GGGATGCGGT TGTTAACTTA 
ACAATTATTT CACTCATCAT TGTCGGAGGA ATAGGGTTCT TTGTATGGGA TGATATTGAG 
AAAAATAAAT ATCATTTTAG AAAATATCAG CTACATACAA AAATAGTTTT AACGATGACC 
GCAATTCTTA TAGTGTCAGG GACGATATGC TTTTATATTT TTGAAAGAAA TAACCTTCTT 
TATGGGATGA CTACAGGAGA AAAAGTTTTA GTCTCTCTCT TTGGCGCAGT TACGCCCAGA 
ACAGCAGGCT TCAATACTGT TGACGTTGCA TCATTAACCT CTGCAAGTAA ACTTCTAACT 
ATTGTGTTGA TGTTTATAGG CGGCAGTCCC GGATCTACTG CCGGTGGGAT CAAGACTACT 
ACTTTAGCGG TTATTATGAT TTCGCTGTGG TCAAGCTTGA AAAATAGGAA GGGTGATAAT 
ATATTTGGCA GGAGACTGGA AGATAATGCA CTAAAGAGGT CGTCTGCCGT TGTGACAGTC 
AATATACTTC TTATACTGAG TGCGGCTTTA CTTATTAGTG CTACAAATAA AGCTTTAGGA 
CTTGACGCTG TTTTGTTTGA GGTTACATCT GCAATTGGTA CTGTTGGTCT TTCTACGGGA 
ATCACAGGTG GTCTGAATAC CTTTGCAAAA ATAATTATCA TACTATTGAT GTATAGCGGC 
AGAGTCGGAA GTCTTTCTTT TGCTTTGCTG TTTACAGAAC ATGGAGTGAC GTCATCTATA 
CAGAATCCGG TGGAAAAAAT AAATATAGGA TAG

Protein sequence

MRKYIRKLKS LSYPQIIALG YFLIIIAGTF LLSLPIASRN NLFPGLINAL FTATSATCVT 
GLVVFDTYTQ WSLFGQVVIL LLIQIGGLGF MTVVTMFSIF LKRKIGLKER GLLRESINAM 
YIGGIVRLTK RILLGTLLFE GIGAVLLSLR FIPKMGLLEG IYNGIFHSVS AFCNAGFDIM 
GKYGKYSSLT NFAGDAVVNL TIISLIIVGG IGFFVWDDIE KNKYHFRKYQ LHTKIVLTMT 
AILIVSGTIC FYIFERNNLL YGMTTGEKVL VSLFGAVTPR TAGFNTVDVA SLTSASKLLT 
IVLMFIGGSP GSTAGGIKTT TLAVIMISLW SSLKNRKGDN IFGRRLEDNA LKRSSAVVTV 
NILLILSAAL LISATNKALG LDAVLFEVTS AIGTVGLSTG ITGGLNTFAK IIIILLMYSG 
RVGSLSFALL FTEHGVTSSI QNPVEKINIG