Gene Moth_1683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1683
Symbol
ID	3833283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1721972
End bp	1722898
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	55%
IMG OID	637829608
Product	cation diffusion facilitator family transporter
Protein accession	YP_430528
Protein GI	83590519
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0053] Predicted Co/Zn/Cd cation transporters
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000676071
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.070124
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGTGC GGACCAGAGC TGCCAGGGTA TCTATCTTTT CCAACATAAT CCTGGTGCTG 
GGTAAACTGG GGATCGGTTA CTGGATGCAC TCGGTCAGTG TCATGTCGGA AGCCATCCAC 
TCCGGCCTGG ACCTGGTGGC GGCGGCGATA GCCTATTTTT CCGTCCGGGA AGCCAGCAAG 
CCGGCTGATG CCGAGCACCG CTACGGCCAT GGTAAAATTG AAAATATTTC GGGTACCATT 
GAAGCCCTGC TGATTTTCCT GGCAGCCCTC TGGATTATCT ATGAAGCAAT CAAAAGGTTT 
ATCAGCGGCA GCCATGCCAT TAGCGAACCC CTGACCGGCG TGGCTGTTAT GGGCGGGGCC 
GGCGTAGTCA ACTACCTGGT TTCCCGTTAT CTCTTCCGGG TTGCGAAAGA TACGGACTCC 
ATCGCCCTGG AGGCCGACGC CTGGCACCTG CGTACCGATG TTTATACTTC CGCCGGGGTA 
ATGCTGGGCC TGGCAGCCCT TTATTTTACC GGTTTCCAAT GGCTGGATCC CCTGGTGGCC 
CTGGTGGTAG CCGCCATGAT CATCAAGGCG GCCTACCATT TAACCCGGGA GGCCATGCTG 
CCCCTGATGG ATGTCAGCCT GCCGGCTGAA GAAGAAGAGG TAATTAAAGA AATTATCGCC 
CGCCATGCCC ATGAGTATGT TGAATTCCAT AAATTACGCA CCCGCAAGGC CGGCCGGGAC 
CGCCAGGTAG ACCTGCACCT GGTGGTACCG CGTTACAAGC ATATCGATTA TGTCCATAAC 
CTCTGTGAGC ATATTGGCGA TGAGATAAGA GCAGCTCTAC CTTACACCGA TGTTTTAATC 
CATGCCGAAC CCTGCTCTTC AGCGGTGGAT TGCCAGGTGT GTACCACCTG CCCGGAGAAG 
GAAAATCGTT CCTCGAAGGC GAATTGA

Protein sequence

MDVRTRAARV SIFSNIILVL GKLGIGYWMH SVSVMSEAIH SGLDLVAAAI AYFSVREASK 
PADAEHRYGH GKIENISGTI EALLIFLAAL WIIYEAIKRF ISGSHAISEP LTGVAVMGGA 
GVVNYLVSRY LFRVAKDTDS IALEADAWHL RTDVYTSAGV MLGLAALYFT GFQWLDPLVA 
LVVAAMIIKA AYHLTREAML PLMDVSLPAE EEEVIKEIIA RHAHEYVEFH KLRTRKAGRD 
RQVDLHLVVP RYKHIDYVHN LCEHIGDEIR AALPYTDVLI HAEPCSSAVD CQVCTTCPEK 
ENRSSKAN