Gene Moth_0445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0445
Symbol
ID	3830969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	446035
End bp	447084
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	63%
IMG OID	637828380
Product	radical SAM family protein
Protein accession	YP_429319
Protein GI	83589310
COG category	[R] General function prediction only
COG ID	[COG2516] Biotin synthase-related enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCAA CCAGTCCGGA GTACGTTAAA ACCAGTACCG CGGCGGCCAT AACCCTGGGC 
TTTCAGCCCG GTAGCTTTCA CCGCGACGCC CGGCTCACCG GCCTCAACCT CCTTCTGACT 
TATAACGAAC CCTGTGCCGG CCGCTGTGCC TACTGCGGTC TCTCCGGTAA CCGCCTACCT 
GACGCCGAAC CGACCTTTAT TCGCGTTGAC TGGCCGGTTT ATGCCCTGGA CGCGATCCTT 
AAGGAAGTCC GGCGGGACTC TCGCGGCCTG GAGCGGGTGT GCATCGGCAT GCCGACCCAC 
CGCCGGTCGT GGGATGACCT CCTTAAAGTC GTCAACCGCT GGCACCGGGA AAGCGATCTC 
CTCATCAGCG CCCTCCTGAC TCCTACCGCC TGCCGCGGCC GGGATTTTTT TGAACTGCGT 
GCAGCGGGTG CGGACATGGT CGGTATTGCC ATCGATTGCG CCACACCGGA ACTATTTGAA 
CGTTACCGCG GCAGGGGGGT CAAAGGTCCC CATCGCTGGG AGGAGTACTG GGAGGGGGTC 
TCCCGGGCCG TAACCGTCTT TGGCCGCGGC CGGGTCGGCA TCCATCTTAT CGTTGGCCTG 
GGGGAAACCG AGGCCGAGAT GATCCAGACC ATCCAGAGGG CCCAGGATAT GGGGGTCAGA 
ACCCACCTCT TCAGCTTTTT CCCGGAAACC GGCACGATTC TGGCCCGCCG CCGCCAGCCG 
CCCCTGGGCC AGTATCGCCG GGTCCAGCTG GCCCGTTATA TCATTAACGA GGGCCTGGGG 
CGGGCTGAGG ACATGACCTT TAATGACGCC GGCCAGGTGA TGGATTTCGG GATGGATATC 
ACCCCCCTGG TCAAAGCCGG GGAAGCCTTC CGGACCTCCG GTTGTCCGGG GAAGGATGGT 
CGCACAGTAG CCTGCAACCG GCCCTACGGT AACGAACGTC CCTCCCAGGC CATCCGCAAT 
TTCCCTTTTG CCCCGGAACC CGGGGATATC CGGGCCGTCG AGCGCCAGCT CCGGCAGGGT 
CTTAAGGGGG CCGTTGCCCA TGCCGGTTGA

Protein sequence

MPATSPEYVK TSTAAAITLG FQPGSFHRDA RLTGLNLLLT YNEPCAGRCA YCGLSGNRLP 
DAEPTFIRVD WPVYALDAIL KEVRRDSRGL ERVCIGMPTH RRSWDDLLKV VNRWHRESDL 
LISALLTPTA CRGRDFFELR AAGADMVGIA IDCATPELFE RYRGRGVKGP HRWEEYWEGV 
SRAVTVFGRG RVGIHLIVGL GETEAEMIQT IQRAQDMGVR THLFSFFPET GTILARRRQP 
PLGQYRRVQL ARYIINEGLG RAEDMTFNDA GQVMDFGMDI TPLVKAGEAF RTSGCPGKDG 
RTVACNRPYG NERPSQAIRN FPFAPEPGDI RAVERQLRQG LKGAVAHAG