Gene Moth_1721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1721
Symbol
ID	3833021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1764781
End bp	1765869
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	62%
IMG OID	637829646
Product	nicotinate-nucleotide-dimethylbenzimidazole phosphoribosyltransferase
Protein accession	YP_430566
Protein GI	83590557
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2038] NaMN:DMB phosphoribosyltransferase
TIGRFAM ID	[TIGR03160] nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.588177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.361889
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGGAT TAAAGCTGGA GGAGACGGTT AAAGGGATCA TGCCTGTCAA CGATGCCTGG 
CGCCGGAAGG CCCGTGAGCA CTTAAACAAC CTGGCCATTC CGGTAGGAAG CCTGGGAAGG 
CTGCTGGACA TCGCCGAACA ACTGGCCGCC ATAAAGGAAA GCCTGAAGCC TTCGACGGGT 
AGCAAGGTGG TCGTCACCAT GGCCGGGGAC CACGGCGTTG TTGAGGAAGG GGTCAGCACC 
TGTCCCCAGA GAGTGACCCT CCAGATGGTT TACAATTTTG TAGCCGGCGG GGCCGGGATC 
AATGCCCTGG CCGGGGCGGC CGGGGCCAGG GTAGTGGTTG TGGATATGGG CGTGGCCGGA 
GATCTGAAGG ACCTGGTGGA GCAGGGGAAG ATCCTTTCCC GCAAGGTGGA TTACGGAACG 
CGCAATATGA CCAGGGGCCC TGCCATGACC AGGCAACAGG CGGTGCAGGC CCTGGAGACC 
GGCATCAACA TCGCCGGAGA CCTGGTCAAT GAAGGCGTTG AACTGCTGGG AACAGGGGAT 
ATGGGGATCG GCAACACCAC CCCGAGCAGC GCCATTCTGG CGGCCCTTTC CGGCCTGCCG 
GTCCGGGAGG TGACGGGGAG GGGCACCGGG ATCGACGACG AGACCCTGGC AAGGAAGGTC 
CAGGTGATCG AGAGGGCCCT TGCCCTGAAC AGGCCGGACC CGGGTGACCC AGTAGACGTT 
CTGGCCAAGG TGGGCGGTTT CGAGATCGGG GGAATTGCGG GGTTGATTCT CGGGGCGGCC 
TACTACCGGG TGCCAGTTGT GGTGGACGGA TTTATATCCA CCGCCGGTGC CCTCCTGGCG 
AAACAACTCG CCCCCCGGGC GGTTGATTAC ATGATCGCCG CCCACCGGTC CATGGAGTAC 
GGGCACAGGT ATATGCTCAA AGAGCTCGGC CTGCGGCCGC TGCTCGATTT AGACATGCGC 
CTGGGAGAGG GTACAGGGGC TGCCCTGGCC ATGTGCATTG TAGAAGGGGC GGCGCGGGTG 
ATCGGCGAGA TGCTCACCTT TGAAGATGCC GGGGTCGCCA GAAATAAGTC CAGGGAGTAT 
GCGGTATGA

Protein sequence

MMGLKLEETV KGIMPVNDAW RRKAREHLNN LAIPVGSLGR LLDIAEQLAA IKESLKPSTG 
SKVVVTMAGD HGVVEEGVST CPQRVTLQMV YNFVAGGAGI NALAGAAGAR VVVVDMGVAG 
DLKDLVEQGK ILSRKVDYGT RNMTRGPAMT RQQAVQALET GINIAGDLVN EGVELLGTGD 
MGIGNTTPSS AILAALSGLP VREVTGRGTG IDDETLARKV QVIERALALN RPDPGDPVDV 
LAKVGGFEIG GIAGLILGAA YYRVPVVVDG FISTAGALLA KQLAPRAVDY MIAAHRSMEY 
GHRYMLKELG LRPLLDLDMR LGEGTGAALA MCIVEGAARV IGEMLTFEDA GVARNKSREY 
AV