Gene Moth_1541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1541
Symbol
ID	3831927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1584022
End bp	1585374
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	62%
IMG OID	637829473
Product	peptidase U62, modulator of DNA gyrase
Protein accession	YP_430393
Protein GI	83590384
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0734056
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACC AGGAACTAGA GAAAAAATAC CTGGACCTGG CCGGTCAGGT GGTCGAGAAA 
GCGGCCAAAC GAGGAGTCCT GGCAGAAGCC TACCTTACTG CCGGGGAAGA ACTGAGCATT 
GAGGTCCGGG ACCAGCAGGT CGAGGCCCTG ACCACAGCCC GGGATCAGGG CCTGGGCTTA 
AGGGTTATCC GGGACCACCG GGTAGGTTTC GCCTTTACCA CCGACTTCAG CCCGGCGGCC 
CTCGACGCCT GCATCGAACA GGCCCTGGCC AACGCCCGGA TGGCCACTCC TGATGAGCAC 
AACTGCCTGC CGGCCCGCTA TCCCGGTTAT CCGGCCCTGG ACCTCTGGGA TCCCGAGATT 
ACCGCTACGC CCCTGGAGAA AAAGATTGAG TTAGCCAAAG AGATTGAGCG CCAGGCCAGG 
GCCTATGACC CGCGGGTCAA GATAACGGAA AGTTGTTCCT ATAATGACTC CCGCTACCTG 
GTGGCCCTGG CGAACTCCCA GGGAATAACG GCAGCCTATC ACGCTGCCAA CTGTGGCGCC 
AGCACCTTTG TGGTGGCAGT AGAAAATGGA GAAAGCCAGA CCGGCTTCGG CCTGGCCTAC 
GGGTTGAAGT TCAAAAACAT CGACCCTGCC AAGGTGGGCC GGGAGGGGGC CAGCAAGGCC 
GTACGCATGC TGGGGGCCAA AAGGGTCAAT ACCCAGCGGG CAGCGGTTGT CTTTGACCCT 
TACGTGGCCA CCAACTTCCT GGGCGTCATC GCCCCGGCCC TGGCCGCCGA TGCCGTCCAG 
AAGGGCAAAT CCCTCTTCCG CGGCCGGGTC GGCCAGCAGG TAGCCGCGCC GGTGATCAAC 
CTCATCGACG ACGGTTGCCG GCCGGACGGC ATTGCCTCCA GCCCCTTTGA CGGGGAAGGG 
GTGCCCACGG AACATACCGT CCTGATTGAA AAGGGCGTTT TGCGGTGCTT CCTCCATAAT 
ACCTACACCG CCGCCCGGGA CGGGGTGAGA TCCACCGGTA ACGGTGCCCG GGGTTCCTTC 
AAGACCACGC CTGAAGTCGG CACCACCAAT TTCTATATCG AGGCCGGATC GCGCTCGCCG 
GAAGAAATCA TCAAGGAGAT TCCAAAGGGT CTCTACGTCA CTGAGGTCAT GGGCATGCAC 
ACGGCCAACC CCATTTCCGG GGATTTCTCC GTCGGCGCCA CCGGTATCTG GATCGAAAAG 
GGCGAGTTGA CCACGCCGGT GCGGGGGGTG GCCATTGCCG GAAACATCAT TGGCCTCCTG 
GAGGCCATTG ACGCCGTGGC CAACGACCTG ACCTTTTTCG GTGCCACCGG CGCCCCCACC 
ATCCGGATCG CCAGCATGAC CATCAGCGGC TAA

Protein sequence

MDYQELEKKY LDLAGQVVEK AAKRGVLAEA YLTAGEELSI EVRDQQVEAL TTARDQGLGL 
RVIRDHRVGF AFTTDFSPAA LDACIEQALA NARMATPDEH NCLPARYPGY PALDLWDPEI 
TATPLEKKIE LAKEIERQAR AYDPRVKITE SCSYNDSRYL VALANSQGIT AAYHAANCGA 
STFVVAVENG ESQTGFGLAY GLKFKNIDPA KVGREGASKA VRMLGAKRVN TQRAAVVFDP 
YVATNFLGVI APALAADAVQ KGKSLFRGRV GQQVAAPVIN LIDDGCRPDG IASSPFDGEG 
VPTEHTVLIE KGVLRCFLHN TYTAARDGVR STGNGARGSF KTTPEVGTTN FYIEAGSRSP 
EEIIKEIPKG LYVTEVMGMH TANPISGDFS VGATGIWIEK GELTTPVRGV AIAGNIIGLL 
EAIDAVANDL TFFGATGAPT IRIASMTISG