Gene Cthe_2640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2640
Symbol
ID	4808951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3121893
End bp	3123068
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	40%
IMG OID	640108053
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_001039032
Protein GI	125975122
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase [TIGR03568] UDP-N-acetyl-D-glucosamine 2-epimerase, UDP-hydrolysing

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGG TAATAAGTGT TTTTACAGCC ACAAGAGCCG AGTATGGTTT GCTAAAGCCC 
ATAATAAATA AGTTGAATAA AATAAAGGAA TTTGACGTAA GGATTGTAGC AACCGGTGCG 
CATCTTTCGC CGGAGTTTGG GCTTACCTAC AAAGAAATTG AAAAAGACGG ATTTCATATA 
GATGAAAAAA TAGAAATTTT GCTAAGTGCG GATACACCGT CTGCAATATC CAAATCAATG 
GGCCTTGTTT TGATTGGATT TGCAGATTAT TTTAAAAGGA TTAATCCCGA TTTGTTGATT 
GTCCTTGGAG ACAGATATGA AACCCTTGCA GTTTCCATGG CGGCGGTAAA TCAAAGAATT 
CCCATTGCCC ATCTTTACGG CGGCGAATCG ACGGAAGGGG CTGTTGACGA GTCAATCCGC 
CATGCCATAA CCAAACTGAG CTATCTTCAT TTTACAAGTA CGGAAACTTA CCGGAAAAGA 
GTCATACAAC TGGGGGAACA TCCCGACCGG GTGTTCAATG TGGGGGCCAT TGGCATAGAA 
AATATATTAA ATGAAAAACT CCTGTCAAAA GATGAATTGG AAAAAGAATT AAAGATAGAT 
TTAAGTAAGC CTTATGCAAT GGCATGTTTT CATCCGGTAA CCCTGGAAGA AAACACTTCC 
GAAAAGCACA TTACTGCTTT GCTTGAAGCA TGCAAGGCAT ATAAGAATAT GAATTTCATA 
TTTACCAAAA CCAATGCCGA CACCGACGGG CGCATTATAA ACCGGCTTAT TGACAAATAT 
GCAGAGGAAA ATGACAACAT TACTGCTTTT ACCTCACTGG GCACGGTTAA TTACTTAAGT 
GTCCTGAAAC ACAGTGCCAT GATAATAGGC AATTCCTCAA GCGGGCTGCT GGAAGCGCCC 
AGTTTTGGCA TTCCGACAAT AAATATCGGC GAACGCCAGA AAGGAAGAAT ACAAGCCACC 
AGTGTCATAA ATTGCAACCC AAACGAGGAA GAAATAAAAC AGGCAATTAA AAAGGCTTTG 
TCGGATTCAT TCATCAAACA GGCAAAAGAA ACAGTAAATC CTTACGGAGA CGGAAACACT 
TCCGAGAGAA TTATTGAAGT AATTAAAGAA TATATGCTGG GCGAAAAAAT CAATCTTAAA 
AAAGAATTTT ACGACGTTGA GGTTGTCGGA ATATGA

Protein sequence

MKKVISVFTA TRAEYGLLKP IINKLNKIKE FDVRIVATGA HLSPEFGLTY KEIEKDGFHI 
DEKIEILLSA DTPSAISKSM GLVLIGFADY FKRINPDLLI VLGDRYETLA VSMAAVNQRI 
PIAHLYGGES TEGAVDESIR HAITKLSYLH FTSTETYRKR VIQLGEHPDR VFNVGAIGIE 
NILNEKLLSK DELEKELKID LSKPYAMACF HPVTLEENTS EKHITALLEA CKAYKNMNFI 
FTKTNADTDG RIINRLIDKY AEENDNITAF TSLGTVNYLS VLKHSAMIIG NSSSGLLEAP 
SFGIPTINIG ERQKGRIQAT SVINCNPNEE EIKQAIKKAL SDSFIKQAKE TVNPYGDGNT 
SERIIEVIKE YMLGEKINLK KEFYDVEVVG I