Gene Cthe_2641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2641
Symbol
ID	4808952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3123065
End bp	3124057
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	40%
IMG OID	640108054
Product	N-acetylneuraminate synthase
Protein accession	YP_001039033
Protein GI	125975123
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2089] Sialic acid synthase
TIGRFAM ID	[TIGR03569] N-acetylneuraminate synthase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAGTGT TTGTCATAGC CGAAGCAGGC ATAAATCACA ATGGAGAGCT AAAGCTTGCA 
AAAAAACTGG TGGATGCCGC CAAAGATGCA GGTGCTGACT GTATAAAATT TCAAACCTTT 
ATTTCAAAAA ATCTTACGAC AAAAAACGCT TCAAAGGCCG AGTACCAGAA GCAAACAAAA 
TCCGAAGAAT CTCAGTATGA CATGCTCAAA AGGTATGAAC TTTCTTTTGA TGAATTTTCG 
GAGCTAAGCA GGTACTGCCA GGATAAAAAC ATTGAATTTC TTTCGACGGC CTTTGATTTT 
GAAAGCATAG AGTTTTTAAA AAGTCTTGAT ATGAAAAGAT GGAAGATTCC TTCGGGAGAA 
ATTACAAATC TTCCTTATTT AATAAAAATA GCAAAGCTAA ACAAGCCCGT TATTTTATCC 
ACGGGCATGA GCACAATGGA TGAGATAAAA AAAGCGGTTT CGGTATTGAG AGAAAACGGT 
ACCGGAGAAA TTACGGTTCT TCACTGCACG ACGGAGTATC CTGCGCCCTT TTCTGATGTA 
AACCTTAAAG CCATGCTCAC AATAAAAAAA GAGCTCGGCG TAAAAGTAGG TTATTCCGAC 
CACACGAAAG GAATTGAAGC ATCCATTGCA GCTGTGGCAC TGGGAGCTTC CGTCATAGAA 
AAACATTTAA CTTTGGATAA GAATATGGAA GGTCCTGATC ACAAGTCAAG CCTTGAACCA 
AATGAAATGA AAGCTATGAT TAGAGCCCTC AGAAATATTG AGCTTGCTTT GGGCGACGGA 
ATAAAGAAGC CTTCAGAATC TGAGAAAAAG AATATTTGTG TGGCCCGCAA AAGCATTGTG 
GCCAAAAGAT ACATCCAAAA GGGTGAAATT TTCACTGAGG AAAATTTGAC GGTAAAAAGG 
CCGGGTAACG GCATCAGCCC GATGCAATGG TTTGAAGTTC TTGGAAGAAG AGCCGTAAGA 
GATTTTCAGG AAGACGAGTT GATAGAGTTA TGA

Protein sequence

MKVFVIAEAG INHNGELKLA KKLVDAAKDA GADCIKFQTF ISKNLTTKNA SKAEYQKQTK 
SEESQYDMLK RYELSFDEFS ELSRYCQDKN IEFLSTAFDF ESIEFLKSLD MKRWKIPSGE 
ITNLPYLIKI AKLNKPVILS TGMSTMDEIK KAVSVLRENG TGEITVLHCT TEYPAPFSDV 
NLKAMLTIKK ELGVKVGYSD HTKGIEASIA AVALGASVIE KHLTLDKNME GPDHKSSLEP 
NEMKAMIRAL RNIELALGDG IKKPSESEKK NICVARKSIV AKRYIQKGEI FTEENLTVKR 
PGNGISPMQW FEVLGRRAVR DFQEDELIEL