Gene Moth_0370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0370
Symbol
ID	3832726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	374694
End bp	375770
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	58%
IMG OID	637828305
Product	hypothetical protein
Protein accession	YP_429247
Protein GI	83589238
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG4942] Membrane-bound metallopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000001896
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.85834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGGC TCATAACCTT GCTGGCCATC TTTTTCTTGC TAATTTCCCC GGTTCCCCCG 
GCTTCGAGTA CCAGTATTAC CGACACCCTG AAGCAGCGGC TCCTGGATAA TGAGAATCAA 
GAAAACCGCC TCCTGCAAGA GATTATGCTC CTGGATGCCC GCCTGCAGAA AGCGGAGCAG 
GAGGGTCAGG AGCTGGCGAA CCGCCTGGCT GCCGTCCGGC AACAACTCCA GGCAGCCCGC 
TCCCGGCAAA TCCAGGCCGA GGCCCGCCTG GCGGCAGGAC GCCGGGACCT GAACCGTAGC 
CTGCGGTTTT TCCAGGTTTA CGGTACCTCT CCTTTCATTC TGGCGGCTTT TTTCAGCAAT 
GATCTGCCAG ATTTCTTTAT TCGCCTGGAA CTTTTAAAAT ACCTGGGCAA TCACTTTGTA 
GGTATCGTGC GCTACAACCT GGCCCTATAC CGCCAGGCCC GGGAAGAAGG CTCCCTGGTG 
GCAGCCAGGG AACAAGAACT CCGGCAGGCG CAAGCAACCC TCCTTGAAAG CGAGGAGCGC 
TTGACAGCCC TAAGATTGAA ACGTGAAACT GACCTGGACA GCTTACGCCG GCAGAGTACT 
ACCTGGTCCC AGGACCTGCT GGCCCTGGAA AAGGCCTGGT CCGGGGCTCT GCCGACACTG 
TACTACCTGT TGCAGCAACT CCCGGCTTTA CCCTGGAAAA ACCTGAAACC CGATGCGGTG 
AGCGTAGACC TTTCGCGGGG TGAGGTCCAG GCTATCTTCA GCCAGCGGAA TCTAAATGCC 
ACCCTCCTGA CACCGGCGGA ACTACCGGGA GTAAGCCTGA TCCTTTCCGG GGAAGGTTTA 
ACCATCCCCG GCCCGGATTT TCAAATTCGG GGCAGCCTGC AGGTAGCCGG TCCCCACCAG 
CTTCTATTCA CCCCCACGGA GGTGACCTTT GCCGGCCTGC CTTTGAGCCC TGCCACCAGG 
AACGAGCTCC TGCCCCGGGA GAAGCTGACC ATCGATTTGC CCCCGCCCGA CTACGGCCTG 
CAGTTTAAAG AGATCAATTT CGCCCCGGGA CGAATGAGCC TGATCCTTAA AAAATAA

Protein sequence

MQRLITLLAI FFLLISPVPP ASSTSITDTL KQRLLDNENQ ENRLLQEIML LDARLQKAEQ 
EGQELANRLA AVRQQLQAAR SRQIQAEARL AAGRRDLNRS LRFFQVYGTS PFILAAFFSN 
DLPDFFIRLE LLKYLGNHFV GIVRYNLALY RQAREEGSLV AAREQELRQA QATLLESEER 
LTALRLKRET DLDSLRRQST TWSQDLLALE KAWSGALPTL YYLLQQLPAL PWKNLKPDAV 
SVDLSRGEVQ AIFSQRNLNA TLLTPAELPG VSLILSGEGL TIPGPDFQIR GSLQVAGPHQ 
LLFTPTEVTF AGLPLSPATR NELLPREKLT IDLPPPDYGL QFKEINFAPG RMSLILKK