Gene Cthe_3172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3172
Symbol
ID	4809622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3749248
End bp	3750663
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	44%
IMG OID	640108605
Product	hypothetical protein
Protein accession	YP_001039560
Protein GI	125975650
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.534068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATAT CTGACATATT GGGAATGACG TTTAAAAACC TGATGAGAAG AAAAATCAGA 
ACTCTGTTGA CCCTCACAGG TGTGTTGATT GGGACGACGT CCATTGCTGT AATGATGTCA 
ATAGGGGTCG GGATGGACAG AGCCTTTGAA AGCCAGTTCA GCAGGATGGG AAGTCTGAAT 
ACTATAACTG TCACCGGTTA TTATTACTCG GATGGAGGCA GTGATTATTA TTACTCGGTG 
AGTGGCGGCA CTGGGAATCA AAAAAGACTT GACGACAAGG CAGTCAGGGA TTTTGAACAG 
ATTGAAGGAG TCGAAGCTGT TATGCCGCAG CTTAGGGCAT ATCTCAAGTT TGTATCGGGA 
AGGTATGTGG CTGGTGTGAA TGTTGTCGGA GTTGACCCGT CAAAAATGAG GATATTTGGA 
TTTGAGGTGT CCGAGGGAAG GCTTTTAAAT GAAGATGACA AAGGAGCAAT TGTTTTTGGA 
AGTCAGGTGC CTTACCATTT TTACAATCCC AGGGCCGTCG GAAGAAACAG GGTATTTATA 
ATAGGAGGAA AAAATAGTGA AGACCCTCCT GTAAATGTGT TCGAAGACAG ACTTATTATG 
ACTTTTGACT ATTTTTACGG GGAAAGCCAT GCAAATCAGC AGGGAAGTAT CAGAAGAAAG 
ACCTACAAGG TTCAGGGAGT GGGAATTCTC AAAGAAAGCG GAGAATACAA CTATTCCGCT 
TTTATCAACA TAGATTACCT GAAAAAGCTT ATGCAGGAAA ATGAAAGGGA GGAAAAGAGA 
ATAGCCGCAT CTTTGGCGGC AGGCAATGAA GGCAGTGTTG GTTATTATAA CGCATCTTAC 
AGCAGCAATA GGCTGTCTTC CCAGAATCCA ACCTATGAGA CGGTATTGGT AAAAGTTGCC 
GACGTAAACA AGGTTGAAGA GGTGGAAAAC AAGATAAAAG AAATGGGATT TGGTGCTTAC 
AGTCTTGCAG ATGCAAGGAA CGAGATGAAG AAGACGATGG CTGTGGTTCA GGCTATTTTG 
GGAGCCATAG GAGCTATTTC TCTTCTTGTC GCATCTTTGG GAATAACCAA CACAATGTAT 
ATGTCCATAT ATGAAAGAAC CAAGGAAATT GGCATATTCA AGGTTTTGGG CTGCTACCTT 
AAAGACATCA GGGGAATGTT TCTCCTTGAG GCCGCTTTGA TAGGCTTTTT CGGAGGGACC 
ATCGGAATAG GTTTCAGCTA TGCAATTTCT GCAATTATCA ATGCCATTGT TGCAGGAGCT 
GTACCTAATA TGGAGGGAGC GTCAATATCA GTGATACCGC TGTGGCTGGC ATTGGCAGCA 
TTGGCAGTGG CAGTGCTTGT AGGCCTTCTT GCAGGATATT TCCCTTCCAA ACGGGCTATG 
AGGCTTAGCG CATTGGATGC AATAAGGAAT GAATAA

Protein sequence

MRISDILGMT FKNLMRRKIR TLLTLTGVLI GTTSIAVMMS IGVGMDRAFE SQFSRMGSLN 
TITVTGYYYS DGGSDYYYSV SGGTGNQKRL DDKAVRDFEQ IEGVEAVMPQ LRAYLKFVSG 
RYVAGVNVVG VDPSKMRIFG FEVSEGRLLN EDDKGAIVFG SQVPYHFYNP RAVGRNRVFI 
IGGKNSEDPP VNVFEDRLIM TFDYFYGESH ANQQGSIRRK TYKVQGVGIL KESGEYNYSA 
FINIDYLKKL MQENEREEKR IAASLAAGNE GSVGYYNASY SSNRLSSQNP TYETVLVKVA 
DVNKVEEVEN KIKEMGFGAY SLADARNEMK KTMAVVQAIL GAIGAISLLV ASLGITNTMY 
MSIYERTKEI GIFKVLGCYL KDIRGMFLLE AALIGFFGGT IGIGFSYAIS AIINAIVAGA 
VPNMEGASIS VIPLWLALAA LAVAVLVGLL AGYFPSKRAM RLSALDAIRN E