Gene Moth_2330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2330
Symbol
ID	3831082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2449812
End bp	2450951
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	56%
IMG OID	637830254
Product	hypothetical protein
Protein accession	YP_431160
Protein GI	83591151
COG category	[V] Defense mechanisms
COG ID	[COG0842] ABC-type multidrug transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAAC AATGCCTGGC AATTATGCGG CGCGAAGTGT TTTACCTCTG GCGCGATAAG 
GGTTTGCGCC ATATCTTACT TTTCGGCTCT ATATTGGGGC TGCTGCTGTT TTACGCCATC 
TACAGCGCCC AGGTATTAAA GGATATCCCT ACTGCAGTCG TCGACCTGGA CAACTCCGGC 
GCCAGCCGCG AACTGGTGGA CAAGATAGGC AAGGCGGAGT ATTTAAAGCT GGTCGCCTCG 
GTCGCGAGTT ACGACGACCT GCAGGAGTTA ATCAAGCAGG GAAAAGCCGT CGTGGGCGTC 
GTCATCCCCG AGAACTTCGC CAGGGACGTG GCCCTCGGCC GGCAGACACG AGTATTGGCG 
GTTATTGACG GCAGCAACAT GATCTATGCC ACCAACGCCT CCGCCGCCTT GCTTACCGTC 
ACCCGCACCA TCAGCGCCCA GGCCGGCGTC AGCGCCCTGG TGGCCCGGGG AGTTCAATTG 
CAACAAGCTA AAGAAGCCTA TCAGGCCATC GATTTCAGCG AGGAACCGTG GTTCAACCCG 
GCCCTCAACT ACGCCTACTT CCTCGTCCTG GCCCTGGCTT TAAACATCTG GCAGCAGTGC 
TGCACCCTGG CAGCGTGCCT GAACGTCATC GGCGAACGGG GTATGAAGAG CTGGTTGCAA 
ATCAAGGCCA GCGGCATTTC CAAATTTCGA TTTTTTGCCA GCAAATCGAT AGCCCAGGTT 
TTTATCTTCA TGGCCATCGT TTTGCCCTTG TATATCCTGG CCTTCGGCGT CTTTAAGCTG 
CCCCTTAACT GTAGCTGGCC GTCCTTTCTC CTCTTCACCC TGGCTTTCGC CATAGCCATT 
CACAGCATCG GCACCCTGGC GTCCAGTTTC GCCCGCAACG CCGTGGACGC CGCCAGGTTC 
GGCATGATTA TCGCCCTGCC CTCCTTTGTA CTGTCAGGCT ACACCTGGCC CCTGGAGGCC 
ATGCCCTATT ACCTTCAGCG GATCGCCAGG ATACTGCCCC AGACGTGGTT CTTCCAGGGG 
TTAAACTACT TCGCCTTCAA AAACGCCGGT TGGAATTTGA TGTCCCATTA TATACTAGCC 
ATGCTGGCCG TAGCCGCCGT ATGCTATGGA GCAGCGGCTA TCTTTATCGC GCGGAGTTAG

Protein sequence

MLKQCLAIMR REVFYLWRDK GLRHILLFGS ILGLLLFYAI YSAQVLKDIP TAVVDLDNSG 
ASRELVDKIG KAEYLKLVAS VASYDDLQEL IKQGKAVVGV VIPENFARDV ALGRQTRVLA 
VIDGSNMIYA TNASAALLTV TRTISAQAGV SALVARGVQL QQAKEAYQAI DFSEEPWFNP 
ALNYAYFLVL ALALNIWQQC CTLAACLNVI GERGMKSWLQ IKASGISKFR FFASKSIAQV 
FIFMAIVLPL YILAFGVFKL PLNCSWPSFL LFTLAFAIAI HSIGTLASSF ARNAVDAARF 
GMIIALPSFV LSGYTWPLEA MPYYLQRIAR ILPQTWFFQG LNYFAFKNAG WNLMSHYILA 
MLAVAAVCYG AAAIFIARS