Gene Moth_2351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2351
Symbol
ID	3832069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2470892
End bp	2472064
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	41%
IMG OID	637830273
Product	CdaR family transcriptional regulator
Protein accession	YP_431179
Protein GI	83591170
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3835] Sugar diacid utilization regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000556727
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.18392
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGC TAATGCTTTC TGCCAATTTG GCCCAAAAGA TAGTAAAGAA GATTATGGGG 
ACTCTGGGGA AAAACATTAA TATTATGGAC GCCCAGGGAA GAATCATTGC CAGCGGTAAC 
CCCCGAAGGG TAGGAGAAAA ACACAGGGCT GCCTTCGAAG CTTCAAGTAA AGGTGAACCC 
ATCATAGTCA GGGAAAATGA TATGAATATG TTTGGTGTGA AATATCAAGG TGTGAATATG 
CCTATAAGAT TTAAAGGAAC CGTTGTGGGA GTAATAGGCG TAACCGGTAA CCCGGATGAA 
ATTCTGTCTT ACGTCGAACT TGTCCGGGAT TTTGCCGAGA TGATGATTGA AGAAGCCGTT 
CTAAGGGAGC AATTTTATTT AGAGACACAA GCCCTGGAGA GTTTTATTCA GAAACTCGTA 
GCCGGTGAGA CAAAGCTTTC CGAAGAAGAG ATTATAGATA AAGCCGAATT GTTCGGCATT 
GATTATCACA TATCCCGGAG CGTTTGCCTG TTCCTTACGT ACCCCCTTAA TGATGGTAAT 
AACATGGTAG AACAAAATGA ACATAAATTT TTATCAATAT TGCAGGCGAG TTTTAAAATG 
GCTGATGGGG AGATATTAGT CCGCGGGGGA GCGGGAAAGT TTATTCTTCT GAAAAAGGGG 
GTTAAAGATA TACCCACCTT TCTTGCCCAA TTAAATACGC TATGTGATAA ATTAACCATT 
GAGAGTAAGC TCGCAGTTTC CGTGGGTATA GGTAGTTTCG GTCCTAACCT GGCTCATGTT 
ATAAAATCCT ATGAGGAAGC CCTTAAGGCT GTTACCATTG GCAGGCAATT TTATCCCCAG 
CTAAAGGTAT TTAATTATGA CGATCTTAAA GTTGAACGTG TCATCTGGGA GGTACCACCT 
GCCAAAAGGA AAAACTTTAT AGATGAAATC CTGGGTGCTT TAATTGAAGA GGATACTTTT 
CACCATAGGC AATTATATTC AACCATGGAG GCCTTTTTTA AAAACGATCT AGATATCGAG 
CGTACGGCTA AGGCATTACA TGTACATCGC AATACCATAA TATACCGCTT GAAAAAAATT 
AAGGAGTGTA CCGGTTACGA CCCCAGGGGA AGCTTCAGGG AATTGTTACA CCTGGGTATG 
GCCTATCTAT TTTATAAATG TGACGGCAAG TAG

Protein sequence

MSQLMLSANL AQKIVKKIMG TLGKNINIMD AQGRIIASGN PRRVGEKHRA AFEASSKGEP 
IIVRENDMNM FGVKYQGVNM PIRFKGTVVG VIGVTGNPDE ILSYVELVRD FAEMMIEEAV 
LREQFYLETQ ALESFIQKLV AGETKLSEEE IIDKAELFGI DYHISRSVCL FLTYPLNDGN 
NMVEQNEHKF LSILQASFKM ADGEILVRGG AGKFILLKKG VKDIPTFLAQ LNTLCDKLTI 
ESKLAVSVGI GSFGPNLAHV IKSYEEALKA VTIGRQFYPQ LKVFNYDDLK VERVIWEVPP 
AKRKNFIDEI LGALIEEDTF HHRQLYSTME AFFKNDLDIE RTAKALHVHR NTIIYRLKKI 
KECTGYDPRG SFRELLHLGM AYLFYKCDGK