Gene Cthe_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1939
Symbol
ID	4810722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2314949
End bp	2316283
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	39%
IMG OID	640107355
Product	magnesium transporter
Protein accession	YP_001038350
Protein GI	125974440
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2239] Mg/Co/Ni transporter MgtE (contains CBS domain)
TIGRFAM ID	[TIGR00400] Mg2+ transporter (mgtE)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0382273
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAA TGATTCTGGA GCTCATTGAA CAAGGCAAAT ATGCCGAAGT GAGAAACAAA 
ATTACTGAAA TGAATGAAGT TGACATTGCC CAACTTTTGG AAGAGACGGA CAAGCATAAG 
CTGCTGGTGA TATTCAGGAT ATTGCCAAAG GATGTTGCTG CCGGGGTCTT TTCGTATATA 
TCATATGAAT TACAGAGATA TATTGTTGAA TCCATTACCG ACAGCGAAAT AAAGAACATT 
TTGGATGAAT TGTTCCTGGA CGATACAATT GACTTTTTGG AGGAAATGCC TTCAAACATT 
GTAAAAAGGG TTCTTAAGAA CGCGGATGAA ACAACGAGAA AGCTTATAAA CCAGTTTTTG 
AACTATCCTG AAAACTCGGC CGGGAGCATA ATGACCATAG AGTATGTCGA CTTGAAAAAG 
GAAATGACGG TAAAACAGGC TTTGCAGCAT ATCAAGGAGA CAGGGATAGA CAAAGAGACG 
ATTGATACTT GCTATATTTT GGATGACTCC AGAAAACTTG AAGGTGTAAT ATCAATCAGA 
AAGCTGATAT TAAGTGACGA GTCCGTGGTA ATTAAAGACA TCATGGATGC AGATGTAATA 
TATGTAAACA CACATGACAA GCAGGAAGAA ATTGCAGCAT TGTTTAAAAA ATATGATTTT 
CTTTCCATGC CTGTGGTTGA TAATGAACGA AGACTGGTCG GTATAGTGAC AATAGATGAT 
ATTGTGGATG TTATTGAGCA GGAAAATACT GAAGATTTCC AGAAAATGGC GGCCATTCAG 
CCTTCCGAAA AAGAGTATTT GAAGACAAAC GCGTTGGTAT TGGCCAAGCA CAGAATCACA 
TGGCTTTTGG TATTGATGCT TTCTGCAACT TTTACGGGCA ATATTATAAA AAAATTTGAT 
GAAGTATTGC AATCAATTGT TATACTGGCT TCTTTCATCC CGATGCTCAT GAATACCGGT 
GGAAATGCCG GTTCCCAGTC ATCGGCACTT ATAATCAGGG GCCTGTCCTT GGGAGAAATA 
AGAGCGAGGG ATTTTTTAAA GGTTTTATGG AAAGAAATTC AGGTAAGCTG CATTGTAGGA 
GTAGTTTTAG CTGCTGTGAA TTTTGTAAGA ATATATTATT TTGAAAAAGC AGGTTTTCTA 
GTGTCCGCAA CCGTATGTCT AACCTTGTTT TTTACGATTA TGTTGGCGAA AGTCATCGGA 
GGGCTGCTTC CCATCATGGC AAAGAAACTT AAACTTGACC CTGCGATTAT GGCAGGTCCG 
CTGATAACAA CCGTGGTTGA TGCGGTAACT CTTACCATAT ATTTTACCAT AGCAACGTGG 
TTGTTGGACA TATAA

Protein sequence

MKEMILELIE QGKYAEVRNK ITEMNEVDIA QLLEETDKHK LLVIFRILPK DVAAGVFSYI 
SYELQRYIVE SITDSEIKNI LDELFLDDTI DFLEEMPSNI VKRVLKNADE TTRKLINQFL 
NYPENSAGSI MTIEYVDLKK EMTVKQALQH IKETGIDKET IDTCYILDDS RKLEGVISIR 
KLILSDESVV IKDIMDADVI YVNTHDKQEE IAALFKKYDF LSMPVVDNER RLVGIVTIDD 
IVDVIEQENT EDFQKMAAIQ PSEKEYLKTN ALVLAKHRIT WLLVLMLSAT FTGNIIKKFD 
EVLQSIVILA SFIPMLMNTG GNAGSQSSAL IIRGLSLGEI RARDFLKVLW KEIQVSCIVG 
VVLAAVNFVR IYYFEKAGFL VSATVCLTLF FTIMLAKVIG GLLPIMAKKL KLDPAIMAGP 
LITTVVDAVT LTIYFTIATW LLDI