Gene Moth_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1101
Symbol
ID	3833067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1128838
End bp	1129788
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	61%
IMG OID	637829029
Product	response regulator receiver domain-containing protein
Protein accession	YP_429958
Protein GI	83589949
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2038] NaMN:DMB phosphoribosyltransferase
TIGRFAM ID	[TIGR03160] nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAACTGC TTGACCAGAC CCTGCAAAGG ATTAAGCCCT TGGACGCAAG GGCCATGGCG 
AAGGCCCAGG CCCACCTTGA TGAACTCACC AAACCCCCGG GAAGCCTGGG AGCCCTGGAG 
GATATTGCCA GACGTTTGGC GGGGATCAGG GGGGAAGTCC CCCGCCGATT GTCCCGTAAA 
GCCCATATCC TCATGGCCGG GGATCACGGC GTGGTCGCCG AAGGGGTCAG CGCTTTTCCC 
CAGGAAGTAA CCCCTCAGAT GGTATTTAAT TTCAGCCGGG GCGGGGCGGC CATCAACGTC 
CTGGCCCGCC ACGCCAGCGC TGAGCTGGTT CTTGTCGATA TAGGTGTCGC CAGCGATCTC 
CCTGAACTTC CGGGGTTACT GAAACGTAAA GTGGCACCGG GAACGGCCAA CCTGGCCCGG 
GGTCCGGCCA TGACCAGGGA ACAGGCCATT GCCGCCCTGG AGGTGGGCAT CGAGGTAGCC 
AGTGCCAAAA TCGAAGCCGG TAATGAGTTG CTGGGAATTG GGGAAATGGG GATCGGTAAT 
ACCACCCCCA GTTCGGCTAT CCTGGCGGTC TTTAGCGGCC GGCCGGTGGA GGAGATTACC 
GGCCGGGGTA CGGGGGTGGA TGCCAACCGG TTACGGCTGA AGATCAAAGC CATTCAACAG 
GGTCTGGCCA TAAATAAACC TAATCCTGAT GATCCCCTGG ATGTCCTGGC CAAGGTTGGG 
GGCCTGGAGA TTGCCGGCAT GGCCGGGGTA ATCCTGGCCG GGGCAGCAAT GCGGGTGCCG 
GTAATCATCG ATGGCTTTAT CTCCGGAGCG GCAGCCCTGG TGGCGACGCG GCTGGCACCC 
CTGGCGGGTG AATTTATCCT GGCTTCCCAT CTCTCAGAGG AACCGGGCCA TGCGGTGGCC 
CTGGAACTGA TGGGTCTTAA GCCCATGCTG ACCATGCAGA TGCGCCTGTG A

Protein sequence

MKLLDQTLQR IKPLDARAMA KAQAHLDELT KPPGSLGALE DIARRLAGIR GEVPRRLSRK 
AHILMAGDHG VVAEGVSAFP QEVTPQMVFN FSRGGAAINV LARHASAELV LVDIGVASDL 
PELPGLLKRK VAPGTANLAR GPAMTREQAI AALEVGIEVA SAKIEAGNEL LGIGEMGIGN 
TTPSSAILAV FSGRPVEEIT GRGTGVDANR LRLKIKAIQQ GLAINKPNPD DPLDVLAKVG 
GLEIAGMAGV ILAGAAMRVP VIIDGFISGA AALVATRLAP LAGEFILASH LSEEPGHAVA 
LELMGLKPML TMQMRL