Gene Moth_1836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1836
Symbol
ID	3832806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1893633
End bp	1894673
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	63%
IMG OID	637829767
Product	nicotinate phosphoribosyltransferase
Protein accession	YP_430679
Protein GI	83590670
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1488] Nicotinic acid phosphoribosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0347625
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGACCG AGGTCATCAC TTCCCTGGAG CAGGTACAAC AATTAGAGGT CAAACCGGAC 
CGGCGGTTCT ATTCGGCCGA GCACGGGGAG ATTGCCAGCG GGGCGACTAC GGATATTTAT 
TTTGTCCGCA CCTATGAGAT TCTTAAAAGC CTGGGCAAGG TCGACACGGT AGTTACGGCC 
GAGATCTTTC CCCGCCGGGC CGGGATCCTC TGCGGGGTCA ACGAGGTCCT GGAGCTTTTG 
CGGGACAAAA AGGTGACCGT TTACGGCCTG CCGGAGGGGA GCCCCTTTGA GCCGAAAGAG 
GTGGTCATGC GCATCCAGGG TCCCTATAGC GAGTTTGGCC TCTTTGAAAC TACCTTGCTG 
GGAATGCTGG CCAGCTCCAG CGGCTGGGCT ACGGCGGCCC GGGAAATCAG GGAAGCGGCT 
GGTGAACATC CCTTTGTCTG CTTCGGGGCG CGCCACGTTC ACCCGGCGGT GGCGCCGGTC 
ATGGAGCGGG CGGCCATTGT CGGCGGCGCC GACGGGGCGA GTTGCATCCT GGCGGCCAAA 
CTGGCCGGCC GGGAGCCCCA GGGAACGGTA CCCCATGCGG TATTCCTGAT CATCGGCGAT 
ACAGTCGAGG GGGCCCTGGC CTACGACCGC CTCATGCCCC CTGACGCCAA GCGGACCATC 
CTGATCGACA CCTTTAAAGA TGAGGCTGAA GAGGCCCTGC GGGTAGCCAG TGCCCTGGGG 
CCGGCCCTGG CCGGGGTACG TTTGGATACC CCCAGCGAGC GAGGCGGCGT CACCCCGGAA 
CTGGTCCGGG AAGTGCGCTA TCGCCTGGAT ATGGCCGGCT TTAACCATGT GGGGATTTTT 
GTCTCCGGAG GCCTGACGCC GGAACGTATC CGGACCCTTA TCGAAGCCGG GGCCGACGCC 
TTCGGCGTGG GCAGCTATAT TTCCGGCGCG GCCCCCATTG ATATGACCAT GGACTTAAAG 
GAGGTCGACG GCCGCCCGGT GGCCAAACGC GGCCGCCTGC CGGGGATCAT TCCCAATCCC 
CGGCTGGTGC AGTTGAAATA G

Protein sequence

MGTEVITSLE QVQQLEVKPD RRFYSAEHGE IASGATTDIY FVRTYEILKS LGKVDTVVTA 
EIFPRRAGIL CGVNEVLELL RDKKVTVYGL PEGSPFEPKE VVMRIQGPYS EFGLFETTLL 
GMLASSSGWA TAAREIREAA GEHPFVCFGA RHVHPAVAPV MERAAIVGGA DGASCILAAK 
LAGREPQGTV PHAVFLIIGD TVEGALAYDR LMPPDAKRTI LIDTFKDEAE EALRVASALG 
PALAGVRLDT PSERGGVTPE LVREVRYRLD MAGFNHVGIF VSGGLTPERI RTLIEAGADA 
FGVGSYISGA APIDMTMDLK EVDGRPVAKR GRLPGIIPNP RLVQLK