Gene Moth_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1100
Symbol
ID	3833066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1127451
End bp	1128851
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	61%
IMG OID	637829028
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_429957
Protein GI	83589948
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATACA AGCGGATTGT TATTGCCGGT ACCAGGAGCG GCGTCGGCAA GACAAGTATT 
GCCACCGGTT TAATGGCCGC CCTGGCCGCC AGGGGGTTAA AGGTCCAAGG GTTTAAGGTC 
GGTCCCGACT ACATCGACCC CGGTTACCAC ACCCTGGCTA CGGGCAGGCC TTCCCGCAAT 
CTGGATACCT ACTTAATGAC CCCGGCGGCC GTCCTGGAGG CCTTTGAGCG CGCCGCTGCC 
ACCAGCGATA TAGCCGTTAT TGAAGGAGTT ATGGGGCTTT ATGACGGTCA CCGTGACACC 
GGCAGCGGGA GTACGGCGAC CATTGCCCGC CTGCTGGCCG CCCCTGTCCT GCTGGTGGTG 
GACGCTACTT CCCTGGGGCA GAGTGTGGCC GCCGAGGTCC TGGGTTACCG CTCCCTGGAC 
CCGGGGGTAA ACCTGGCCGG GGTCATCCTG AACCGGGTCA GTAGTGAGGG TCACCTGGAG 
GTGCTCCGCC AGGCTATAGA AGAATATACC GGCATACCGG TAGTTGGCTG GTTGCGACGG 
GGCTCCCTGC CTCCCCTCCC TTCCCGGCAC CTGGGGTTGA TCCCGGCCGG GGAACAGGAG 
GACCTGAGGC CCGTCCTGGC GGAACTGGCC GCTACCATAG CCACCGGCCT GGACCTGGAG 
AGGGTACTCG ACCTGGCAAC ACAGGCCGGC CCCCTGCCGG CAGGGGGAAG CCGCCTTTTT 
GCTACCGCCG GTGCTGGGGT GAGGGAGAAA ATCCCGGTTG CTGTGGCCCT GGATAAAGCC 
TTTAACTTTT ACTACCAGGA TTCTCTAGAT TACCTGGCGG TTCTCGGAGC CGAATTGCTA 
CCATTCAGCC CCCTAGAGGA CGACAGGTTG CCCGCTGGAG CCGCCGGGAT AATTATTGGC 
GGTGGGTTCC CGGAGATTTT CCTCGCTCCC CTGACGGATA ACAGGCCCCT CCTCGCTGAC 
CTCCGTCGGC AGGTCGCCCG GGGGATACCC CTTTATGCTG AGTGTGGCGG CCTCATGTAC 
CTGGCCCGGG AGATCATTGA CCTGGAAGGC AGCAAGTGGC CCATGGCGGG CATTGTACCC 
GCCGCCTGCC GTATGCAAAA GAGCCTGGCC GGCCTCGGTT ACAGGGAGGC CCGCCTCTGC 
CGGGAAACCC TCGTGGGCCA CCGGGATGAT TGCCTTCGGG GGCATGAATT TCATTATTCC 
ACCATGACAA GTAAGGATAC AGACTTCCCG CCGGCTTACA CCTGGAAACA CCGGGGGTCA 
ATCTGGTACG ATGGCTACGG GACACGGCAG ATAGTAGCCT CTTATTTGCA CTTGCATTTC 
CTGGGCAATG TAGGAGCCGC TCAAAATTTC CTGGCCGCCT GCCGGGCATA CAAAGGAGGA 
AGAAACCTTG AAACTGCTTG A

Protein sequence

MTYKRIVIAG TRSGVGKTSI ATGLMAALAA RGLKVQGFKV GPDYIDPGYH TLATGRPSRN 
LDTYLMTPAA VLEAFERAAA TSDIAVIEGV MGLYDGHRDT GSGSTATIAR LLAAPVLLVV 
DATSLGQSVA AEVLGYRSLD PGVNLAGVIL NRVSSEGHLE VLRQAIEEYT GIPVVGWLRR 
GSLPPLPSRH LGLIPAGEQE DLRPVLAELA ATIATGLDLE RVLDLATQAG PLPAGGSRLF 
ATAGAGVREK IPVAVALDKA FNFYYQDSLD YLAVLGAELL PFSPLEDDRL PAGAAGIIIG 
GGFPEIFLAP LTDNRPLLAD LRRQVARGIP LYAECGGLMY LAREIIDLEG SKWPMAGIVP 
AACRMQKSLA GLGYREARLC RETLVGHRDD CLRGHEFHYS TMTSKDTDFP PAYTWKHRGS 
IWYDGYGTRQ IVASYLHLHF LGNVGAAQNF LAACRAYKGG RNLETA