Gene Cthe_3116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3116
Symbol
ID	4809679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3677281
End bp	3678372
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	39%
IMG OID	640108549
Product	mannose-6-phosphate isomerase, class I
Protein accession	YP_001039504
Protein GI	125975594
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1482] Phosphomannose isomerase
TIGRFAM ID	[TIGR00218] mannose-6-phosphate isomerase, class I

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGTATC CGTATAAAAT GACGCCTGTG TACAAGGACT ATATATGGGG TGGACACAAT 
CTCAAAAGGT TGGGAAAACC TGTAGTTGAG GGACGAGTGG CGGAAAGTTG GGAACTTTCT 
GCCATACCTG GAAGCGAAAC CAAAATTTCC AACGGTGTTT TACAAGGTCA GAGTATTGTT 
GATGTAATAA AAAAATACGG AAGAAAGAAA ATTCTTGGCG ATAAATTTGC TGCTGCACCG 
ATGAATACAG GATTCCCGCT TCTTTTGAAG TTCATTGACG CAAACGACCG CCTGTCCATT 
CAGGTTCATC CTGACAATGA ATATGCAAAA GAACACGAAC ACGGTGTGGG TAAAACCGAA 
ATGTGGTACA TAGTAGACGC CAAATCGGGA GCGACGGTTA TTCACGGATT TGCCGAAAGC 
TGTCAAAGCC CTGTAAAAAT TCGTGAATCT ATTTTAAAAG GCGAACACAG TGGATTGTAT 
AGAGAAATCC AGGTAAAAAA AGGCGATGTG GTTTTTGTAC CGGCGGGTAC CGTGCACGCA 
TTAAATGACG GTCTGGTAGT TGCTGAAATA CAGCAAAATT CAGATCTTAC ATACAGGATT 
TTTGACTATG ACAGGACTGA TTCCTATGGA AACAAAAGAC CTCTTCATGT GAATAAAGCA 
CTGGATGTGC TTTCTTTTCA AAATTCCAAA GCTTTGTATA AAGGAATTAC CGTATACCGT 
GATAATGGAA TAGAAACAAA GTATCTTGCC ATAAGTGAAT ATTTCTGTGT AAAAGAAATA 
AAGAGTGAGG GTGGAACCCT TGAATTAAAT CCGAAAGGTA CTTTTTCCGC ATTTATGTTT 
TTGGATGGTG AAGCCCAAAT AATATATGAT GAGGAGAAAT TGAAGATTAG TGCAATGGAA 
ACAGTTTTTA TTCCCGCGTA TATGGGCAAG TATAAAATCC GTGGTTCATT TTTGGCGCTT 
CATGTTTACG TGGCGGATTC TGCGTTGAAA GTTTATGATT CTTTAAGAAA TAAAGGCTTT 
TCCCATGAAG AAATAATTGA AAATGCAGCA GGGGCGGAAA ATCTCAAATT TCCTCTTAGA 
GTTGTAATAT GA

Protein sequence

MLYPYKMTPV YKDYIWGGHN LKRLGKPVVE GRVAESWELS AIPGSETKIS NGVLQGQSIV 
DVIKKYGRKK ILGDKFAAAP MNTGFPLLLK FIDANDRLSI QVHPDNEYAK EHEHGVGKTE 
MWYIVDAKSG ATVIHGFAES CQSPVKIRES ILKGEHSGLY REIQVKKGDV VFVPAGTVHA 
LNDGLVVAEI QQNSDLTYRI FDYDRTDSYG NKRPLHVNKA LDVLSFQNSK ALYKGITVYR 
DNGIETKYLA ISEYFCVKEI KSEGGTLELN PKGTFSAFMF LDGEAQIIYD EEKLKISAME 
TVFIPAYMGK YKIRGSFLAL HVYVADSALK VYDSLRNKGF SHEEIIENAA GAENLKFPLR 
VVI