Gene Cthe_2962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2962
Symbol
ID	4810850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3480056
End bp	3481084
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	44%
IMG OID	640108384
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001039352
Protein GI	125975442
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAACA TTGAAGCAAA AACTTCTTCA TCCGGCTATA ATTCAGCCCG GAAAAAAGAT 
GTTTTAATAG AAGTGAAAAA TTTAAAGCAA TATTTTAACA TAAAAACCAG CCTTGGTAAA 
AAAGCCACAG TTAAAGCGGT GGATGATGTA ACCTTTGAGA TTTACAAAGG CGAAACCCTC 
GGACTCGTTG GCGAATCCGG TTCAGGTAAA ACCACTTTGG GAAGGACAAT TCTCAGGATT 
TATGAGCCTA CAGCCGGGCG AGTTGTATTT TTGGGAGTTG ATATAACCAA ATTGGGAAGG 
GGACAGCTCC TTCCCTACAG GAAAAAAATG CAGTATATTT TTCAAGACCC TTACGCATCC 
CTCGACCCTC GTATGACCGT TTCGGATATT GTGGGCGAAG CACTGGATAT TCATAGACTG 
GTTTCTTCCA AAAAAGAGAG GGAGGAAAAA GTCAGAGAAC TGTTAAAAAT GGTAGGACTT 
AATACCGAAC ACGCATCCCG TTATCCTCAT GAATTTTCAG GAGGACAGCG CCAAAGAATC 
GGAATAGCCC GGGCTATCGC CGTAGAACCT GAATTTATCG TATGTGACGA GCCGGTATCC 
GCACTTGACG TTTCTATAAG GGCCCAGATA ATTAACACGC TGGAAGAAAT GCAGGAAAGG 
CTGAACCTGA CCTACCTTTT CATCTCCCAT GATTTGGGCG TGGTAAGGCA TACATGTGAC 
AGAGTAGGGG TCATGTACCT GGGACATATA GTGGAACTGG TGGAATCGGA AGAATTGTAC 
AAAAATCCTC TCCATCCATA CACTCAGGCA CTATTGACGG CTATTCCCAG ACCTAATCCT 
GAGATTGCCA AGAAAAGAAA CAGAATTATC TTAAAGGGTG AAATCCCGTC ACCGGTGAAT 
CCGCCATCTG GCTGCAAGTT CAGAACCAGA TGTCCCTATG CAAAGGATAT CTGTGCAAAA 
GAAGTGCCCG AGTTCAAAGA TTACGGAAAC GGTCATTATG TAGCCTGCCA TTTTGCAGGT 
AAATTATGA

Protein sequence

MTNIEAKTSS SGYNSARKKD VLIEVKNLKQ YFNIKTSLGK KATVKAVDDV TFEIYKGETL 
GLVGESGSGK TTLGRTILRI YEPTAGRVVF LGVDITKLGR GQLLPYRKKM QYIFQDPYAS 
LDPRMTVSDI VGEALDIHRL VSSKKEREEK VRELLKMVGL NTEHASRYPH EFSGGQRQRI 
GIARAIAVEP EFIVCDEPVS ALDVSIRAQI INTLEEMQER LNLTYLFISH DLGVVRHTCD 
RVGVMYLGHI VELVESEELY KNPLHPYTQA LLTAIPRPNP EIAKKRNRII LKGEIPSPVN 
PPSGCKFRTR CPYAKDICAK EVPEFKDYGN GHYVACHFAG KL