Gene Cthe_0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0133
Symbol
ID	4808691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	162114
End bp	163598
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	44%
IMG OID	640105544
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001036567
Protein GI	125972657
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTATT GCAATTGGTT GTTTGACACA AAAGACAAGG ACCTTGAAAG AGAAATCATC 
ATTGACTGGG AAACCGGAAA AAGGCTGACT TTTAAAGGAC TTCAGACGGA AGTGGTAAGG 
CTTGCAAATT TCCTCAAGTC AAAAGGGTAT GTCCCCGGAA CGGTTATTGC CACACATCTT 
TACAACGGTA TTGAAGCAGC CGTCGCTTTT TTGGCCGCCG AATATATCGG ATGTGTTGTT 
TGCCTTGTGG ATCCGCTTTT TAAGGCGGAC GAAGTGCCGT ACTATGTTGA AGACTCCGGT 
GCCAAATGTC TAATTACCCA CCTGGAAAAA GATGAGATAG CCGGAAAACT ACCATCGGAA 
GTTGATGTGA TAAACGTAAG AGAGGTTCAG GAAGTCTGTG AAAGCGACGA GTTTGAAAAA 
TCTCTTGAAA TATATGATTT TGAAGAAAAT GAACTTGCAC TGCTTTTATA TACCTCGGGT 
TCCACTTCCA CTCCCAAGGG TGTGATGCTT ACAACGGGCT GTTGTCATAC GTTCCTTAGA 
AAGAATCATC AGTCGATGTA CAGATATGAT CCGGATGACA GAATCTTATG TTTTGTGCCC 
TTTTCCCATG GATTCGGTTC AATTTCCGTC CTGATTCCGG CATTGGCGTA CAAGGCGGGA 
ATTGTGTTTC AAAAAACATT CCATCCTGCC AAAGTTGCCG AAGCGGTGAT AAAAGAGAAC 
ATTACCCATA TGCTGGGCGT GCCGACCCAT TACCGTCAAT TGTTAAGATA TGAACCTTTC 
ATTAACAATC TGGGCAAGCT TAAAGCGGCT TTTTGCTCGG CAGCGCCCAT TAGCTGTGAA 
GTGGCACGGC AGTGGTACGA AAAAACCGGA ATATATTTGG ATGAGGGCTA CGGAATGAGT 
GAAGCAACCA CTCTTATTAC CACAAGGATG TCACGGCTTC CTTCAACTTC AGGGGATGTG 
GGACACCCCC CGGAAGGGAT TATATCCGTT GACATTGTTG ACGACAACGA CAGGGTGGTT 
GAAAACGGAA CAATAGGAGA AATTCGTGTA ACCGGACAGG GACTCATGCT TGGATACCTG 
AATCGGCCGA AAGAGACAGC GGAAAGGCTC AGAAACGGAT ATCTCTATAC CGGTGATTTG 
GGATACAAAA ACCCTGACGG ATCACTGGTT GTTTGCGGCA GAAAAACAGA ATTCATAAAC 
GTTGCAGGGC TTAAAATATC GCCTGTTGAA GTTGAGACTG CATTAAATTC CCATTCAGAT 
GTGATTGATT CTGCAGTTGT CGGAGTTACG GATGAAGTCT ATGGAGAAGT GGTAAAGGCT 
TTTGTTATCA AGAAACAGGA TTCAAACCTC ACGGAGCGGG AACTGATAAA ATATGTTTCC 
GACAAAGTGG CAAACTTTAA AGTACCGAAA TATGTTGTGT TTGTTGATGA ATTTCCGCGA 
AACAATGTTG GAAAAGTTGA TAAAAAGGCA TTAAAAAATA TGTAG

Protein sequence

MNYCNWLFDT KDKDLEREII IDWETGKRLT FKGLQTEVVR LANFLKSKGY VPGTVIATHL 
YNGIEAAVAF LAAEYIGCVV CLVDPLFKAD EVPYYVEDSG AKCLITHLEK DEIAGKLPSE 
VDVINVREVQ EVCESDEFEK SLEIYDFEEN ELALLLYTSG STSTPKGVML TTGCCHTFLR 
KNHQSMYRYD PDDRILCFVP FSHGFGSISV LIPALAYKAG IVFQKTFHPA KVAEAVIKEN 
ITHMLGVPTH YRQLLRYEPF INNLGKLKAA FCSAAPISCE VARQWYEKTG IYLDEGYGMS 
EATTLITTRM SRLPSTSGDV GHPPEGIISV DIVDDNDRVV ENGTIGEIRV TGQGLMLGYL 
NRPKETAERL RNGYLYTGDL GYKNPDGSLV VCGRKTEFIN VAGLKISPVE VETALNSHSD 
VIDSAVVGVT DEVYGEVVKA FVIKKQDSNL TERELIKYVS DKVANFKVPK YVVFVDEFPR 
NNVGKVDKKA LKNM