Gene Moth_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2137
Symbol
ID	3833137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2234786
End bp	2236015
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	64%
IMG OID	637830062
Product	molybdopterin molybdochelatase
Protein accession	YP_430972
Protein GI	83590963
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACTTT TTCAAGTAAT AACCCTGGCG GAGGCCCGCA GGCAATTGGG GCGCTACTGG 
CCCCTACCTG GGCGGCGGGA GATGGTTGTA CCCCTGACGG AAGCCCTGGG ACGGGAACTG 
GTACGACCGG TGGTGGCCGG GGAAGATGTC CCCGGTTTCG ACCGCGCCAC CATGGACGGC 
TATGCCGTCC GGGCGGTTGA TACCTTTAGC GCCCGGGAAG GTGAACCCGT CCTTTTGCGC 
CTGGCCGGGG AGGTACCCAT GGGGCAAAAA GCCGGAGTCA GGGTTAACCC CGGAGAAGCC 
GTAGCCGTGG CCACAGGAAG TATGCTACCG CCCGGGGCGG ATGCGGTGGT TATGATCGAA 
AACACCGAGG TCCTCGAGGA CGATCGGGTC GCCGTCTATA AGCCGGCAGC CCCCGGCCAG 
GACCTGGTAC GGCAGGGATC CGACGTCCGG GCCGGTGCCA CCGTCCTCGA GGCCGGCCAT 
CGCCTGCGCC CCCAGGACCT GGGCGTACTG GCCAGCCTGG GCATCAACAG GGTTCCGGTA 
TACGAACCCT GGCGGGTGGG CATCCTGGCC ACGGGGAATG AAATCGTCCC CCCGGAGGTC 
CAGGCTGGTC CCGGCCAGGT GCGGGATATT AATTCCTATA CCCTTTACGG CCTGGTACGT 
GATTGCGGTG CTGAAGCCAC CCTCTACGGC ATCGCCCCCG ACGACCTGGA AACCTTGACA 
GCCCGGGTCC AGGAAGCCCT GGCGGAAAAC CACCTGGTGC TCCTCTCCGG AGGAAGTTCC 
GTCGGCACCC GGGATTTAAC CGTGCAGGTC CTGGCTGGCC TGGGACAGCC GGGTATCCTC 
TTCCACGGCT TAGCCATTCG CCCGGGTAAA CCAATCCTGG CGGCCCTGGC CGGCACAAAG 
ATGGTCTTCG GCCTGCCCGG TCACCCGGTT TCCGCCATGG TGAGCTTTAA GGTCCTCCTC 
GAACCCCTGC TACGTTACGG CGGTTATGAG GGCCCGGCCG GCAGGGGGAC GGTCACGGCG 
ACCCTGGGCA GTCCAATTCC TTCTACTCCC GGCCGGGAGG ACTATATCCG CGTCCGCCTG 
GAAGCAGGCC CGGATGGGTT CCTGGCCGTA CCGGTACCAG GAGGTTCGAG TATAATCTCA 
TCCATGATCC AGGCCGACGG CCTGGTAACC ATTCCCCTGG AGGAAGAGGG CCTGGAAGCC 
GGTACGAAGG TAGAGGTGGA ACTCTTTTAG

Protein sequence

MELFQVITLA EARRQLGRYW PLPGRREMVV PLTEALGREL VRPVVAGEDV PGFDRATMDG 
YAVRAVDTFS AREGEPVLLR LAGEVPMGQK AGVRVNPGEA VAVATGSMLP PGADAVVMIE 
NTEVLEDDRV AVYKPAAPGQ DLVRQGSDVR AGATVLEAGH RLRPQDLGVL ASLGINRVPV 
YEPWRVGILA TGNEIVPPEV QAGPGQVRDI NSYTLYGLVR DCGAEATLYG IAPDDLETLT 
ARVQEALAEN HLVLLSGGSS VGTRDLTVQV LAGLGQPGIL FHGLAIRPGK PILAALAGTK 
MVFGLPGHPV SAMVSFKVLL EPLLRYGGYE GPAGRGTVTA TLGSPIPSTP GREDYIRVRL 
EAGPDGFLAV PVPGGSSIIS SMIQADGLVT IPLEEEGLEA GTKVEVELF