Gene Moth_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1899
Symbol
ID	3831172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1963752
End bp	1964891
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	52%
IMG OID	637829832
Product	hypothetical protein
Protein accession	YP_430742
Protein GI	83590733
COG category	[V] Defense mechanisms
COG ID	[COG0842] ABC-type multidrug transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCTGGA AACGCATCTG GTCCATTGTC CGCAAGGAGT TTATTCATAT CCGGAGAGAC 
CCCCGGACCA TCGCCCTGAT TTTACTCATG CCCATCATGC AGATGTTTCT TTTCGGTTAT 
GCCGTTTCCA CCAATGTTGA GCACATCAAA ACAATAATCT GGGATCAGGC CAGGGATCAA 
CGGAGCCGGG AGCTGATCCA GGCTTTAGTC CAATCTAATT ACTTTGATGT CGTGGCCTAC 
GTCGAAAGCC ATGACGATAT TCGTGGCTGG GTGGACCGGG GAAAGGCCCG GGTAGGCTTT 
GTCATCCCGG CCGATTTTTC CCGGCGTATT GACCGGGGGG AAACGGCTCC CGTCCAGGTG 
CTGCTGGACG GCTCTGATCC CACCACGGCC AGCACCGTGC TGTCGGCGGC AGGGGCCATT 
GTCCAGGCTA AATCCGCTCA ATTAACGGCG GTGACTTTAG AAAGGCGCGG GATGGCGAGC 
GGTAAGCTGG GCCTGCCCAG GATAGATCTC CGGCCCTGGG TATGGTACAA CCCGGAGATG 
AAAAGCGTCA ATTTCAACAT CCCCGGCCTT ATTGGCGTAA TCCTGCAGAA TATTACCATG 
ATGCTTACCG CCTTTGCCGT TGTCAGGGAG CGGGAAAGGG GGACCCTGGA ACAGCTCATC 
GTAACGCCCA TTAAACCTTT TGAATTGATG TGGGGTAAAG TTATTCCTTA TATTGTCATA 
GGTTTTGCTG ATTTACTGCT GGCAATTATC GTAGGAATTT TATGGTTCGG TGTGCCTGTC 
CATGGGAACC TGTTGCTTTT GCTGGCCCTC TCTTTTATCT TCCTGGTAGG TGCCCTGGGT 
ATCGGCCTCC TTATTTCGAC TATTTCCCGC ACCCAGCTCC AGGCCATGCA GCTGACGATG 
TTTTTGGTTA TGCCCAACAT CCTGCTGTCC GGGTTCATGT TCCCCCAGGA TGCCATGCTG 
GGTTTTATTC AAAAAATTAG CGCCCTCATC CCCCTGACGT ATTTCATTGA AATTTTACGC 
GCCATTATTC TCAAAGGCGT CGGCATAGGT TATCTGTTGT TCCAGGTCTT CTATTTGCTG 
GTTTTTGGGT TGGCTATCAT GGCCATTAGC GCCCTGAAAT TTCGTAAGAA CCTGGAATAG

Protein sequence

MSWKRIWSIV RKEFIHIRRD PRTIALILLM PIMQMFLFGY AVSTNVEHIK TIIWDQARDQ 
RSRELIQALV QSNYFDVVAY VESHDDIRGW VDRGKARVGF VIPADFSRRI DRGETAPVQV 
LLDGSDPTTA STVLSAAGAI VQAKSAQLTA VTLERRGMAS GKLGLPRIDL RPWVWYNPEM 
KSVNFNIPGL IGVILQNITM MLTAFAVVRE RERGTLEQLI VTPIKPFELM WGKVIPYIVI 
GFADLLLAII VGILWFGVPV HGNLLLLLAL SFIFLVGALG IGLLISTISR TQLQAMQLTM 
FLVMPNILLS GFMFPQDAML GFIQKISALI PLTYFIEILR AIILKGVGIG YLLFQVFYLL 
VFGLAIMAIS ALKFRKNLE