Gene Moth_1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1098
Symbol
ID	3833064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1124932
End bp	1126485
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	60%
IMG OID	637829026
Product	cobyric acid synthase
Protein accession	YP_429955
Protein GI	83589946
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1492] Cobyric acid synthase
TIGRFAM ID	[TIGR00313] cobyric acid synthase CobQ

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCAAAG CTATTATGCT CCAGGGAACC AGTTCCAATG TCGGCAAGAG TGTCCTGGCA 
GCGGCCCTCT GCCGGATTTT CCACCGGAAC GGCTATCGGG TGAGCCCCTT TAAATCTCAG 
AATATGGCGC TTAACTCCGG AGCCACCCCC GATGGAGGCG AGATGGGCCG GGCCCAGATC 
GTCCAGGCCA TGGCGGCCGG GGTGGTACCC CGCGTAGAGA TGAACCCGAT CCTACTTAAA 
CCGACGGCCC ATGCCAGCTC CCAGGTAATC GTCCTCGGGC GACCGGTGGG CAACCTGGGC 
GCCCGGGAGT ACCACGGCCA TTTCAACCAG AAGCTCTGGT CCCGGGTAGA AGAGGCTTAT 
GCCTTCCTGG AGCGGGAGTT TGAGATTATT GTAATCGAGG GGGCCGGCAG TCCGGCGGAA 
ATCAACCTCA AGGCCGGGGA GATCGCCAAT ATGCGGGTGG CCAGGATGGC CGGAGCCCCG 
GTGCTCCTGG TAGCTGATAT TGACAGAGGT GGCGCCCTGG CAGCTGTAGT GGGCACCCTG 
GAGCTCCTGG AACCGGAAGA GAGGGTAATG GTGGCCGGCA TCATCATTAA CAAGTTCCGG 
GGTGATCTCG ACCTTCTAAA ACCGGCTCTG GACTTTCTGG AAAGCCGCAC CGGTAAACCG 
GTACTCGGCG TGATCCCCTT TTTACCCGAC CACGGGCTGC CGGAGGAGGA TTCCGTTGTC 
CTGGAAGGGG TCACCGGTCG CTCGACGGGT GCCGGTGAAG TGGAGATAGC GGTTATCAAG 
CTGCCCTGCA TCTCCAATTT TACCGACTTT GACGCCCTGG AAAGGGAGAA GGGGGTCAAT 
CTCCGTTATG TAGAAGCAGC GAGCGACCTG GGCAATCCAG ATCTGGTCAT CCTGCCCGGC 
AGCAAAAACA CCATCGGCGA TTTATTATGG CTGCGGTGCC AGGGGCTGGA GACAGCCATT 
AAAGAGCTGG CCGGCCGGGG AACGCCGATT ATCGGGATTT GCGGTGGTTA TCAGATGCTG 
GGAAAGGAGA TCAGGGACCC CGAGCATGTG GAAACCGATG TGGAGATGAT AAAAGGCTTG 
GACCTTTTAC CAATCAAAAC CGTCTTTCAA ACCTCCAAGG CCACCAACCA GGTCCGGGGC 
GTGGTTACGG GTTCAGGACC CTTCCTGGGG CCATTGCAGG GCCAGGAGGT TCAAGGATAT 
GAGATCCATA TGGGTGCCAG CTTTTTGCTG GACGGCAGGC CGGCCTTTAA GATCACCTCA 
CGGGGCGGCC GACTGGTGAC CCTCGACGAT GGGGCCCTGG CCGGGGAGGG ACGCATCTGG 
GGTACCTACA TCCACGGCAT TCTGGATAAC GATTCTCTGC GCCACCAGGT TATCTCAGTC 
TTAAGGGCCA GGCGCGGCCT ACCGGCCAGG CCGGGGATGC TGAACTTTAT GGCCGAGCAG 
GAAAGACGCC TTGATATTCT GGCCGGTGAG GTGGCCCGGC ACCTGGATCT GGGCCGCCTG 
GCGGCAATCA TGGGGTTGGA ACGCCCCCTG GTATGGACCG GCCATGACAA CTGA

Protein sequence

MAKAIMLQGT SSNVGKSVLA AALCRIFHRN GYRVSPFKSQ NMALNSGATP DGGEMGRAQI 
VQAMAAGVVP RVEMNPILLK PTAHASSQVI VLGRPVGNLG AREYHGHFNQ KLWSRVEEAY 
AFLEREFEII VIEGAGSPAE INLKAGEIAN MRVARMAGAP VLLVADIDRG GALAAVVGTL 
ELLEPEERVM VAGIIINKFR GDLDLLKPAL DFLESRTGKP VLGVIPFLPD HGLPEEDSVV 
LEGVTGRSTG AGEVEIAVIK LPCISNFTDF DALEREKGVN LRYVEAASDL GNPDLVILPG 
SKNTIGDLLW LRCQGLETAI KELAGRGTPI IGICGGYQML GKEIRDPEHV ETDVEMIKGL 
DLLPIKTVFQ TSKATNQVRG VVTGSGPFLG PLQGQEVQGY EIHMGASFLL DGRPAFKITS 
RGGRLVTLDD GALAGEGRIW GTYIHGILDN DSLRHQVISV LRARRGLPAR PGMLNFMAEQ 
ERRLDILAGE VARHLDLGRL AAIMGLERPL VWTGHDN