Gene Moth_1951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1951
Symbol
ID	3832301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2027649
End bp	2028770
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	61%
IMG OID	637829882
Product	inner-membrane translocator
Protein accession	YP_430792
Protein GI	83590783
COG category	[R] General function prediction only
COG ID	[COG4603] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00563372
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCAGCTA CAGCCGTACC CAAGAATACC AACCGGAGTT CCGGGCCGGG ATCTGGACCC 
GCGTTAACCT TAGAAAAGCG CCTGGAACCC TCGCGCTTTA TGGCCGTGGT AGTACCCGTT 
ATATCCGTCA TCCTGGCCCT GGCCGTCGGG GCCATCTTCC TGGCGGCCAC CGGCTTTCAA 
CCAATGAAGG TCTACCAGAG CATGCTCAAC GGTGCCGTCG GTTCCAAGTA CGGTATCTCG 
GAAACCATCG TCAAGGCTAT CCCCCTGATG CTGGCGGGCC TGGGGGTTTC GGTGGCCTTC 
CGCATGCTCC TCTGGAACAT CGGCGCTGAA GGCCAGTTCT ATATGGGCGC CTTTGGCGCC 
AGTTGGGTGG CCCTGACTTT TCCCCATTTA CCGGCTTACA TTATGCTGCC GGCCATGTTC 
CTTGCCGGGG GCTTGATGGG GGCCCTGTGG GGATTGCTGC CGGCCTTGCC CCGGGCCAAA 
TGGGGCGTCA ACGAGGTCAT TACCACCCTG ATGCTCAACT ATGTAGCCAT CCTCTGGGTG 
GACTACTTGG TTTACGGTCC CTGGAAGGAC CCCAAGGGTT TTAACTTTCC CCTCACGGCC 
ACCTTCAGCG ATGCCGCAGC GCTACCTACC ATTGCCGGCA CCAGGGTGCA CGTGGGATTG 
ATCTTTGCCC TGGTGGCGGC CGTGCTCCTC GCCATTATCC TCTGGCACAC CAGGTGGGGT 
TATGAGATCC GGGTCATCGG CGAGAGCGCC CGGGCCGCCC GTTACGCCGG CATGAATATC 
GAACGCAATA TTATCCTAGT TATGCTCCTT AGCGGCGCCC TGGCCGGGCT GGCCGGCATG 
AGCGAGGTGG CCGGCATCAC CCACCGCCTC CAGCACGGCA TCTCCCCGGG ATACGGCTAT 
ACCGCCATTA TCATCGCCTG GCTGGCCAAG CTGCACCCGG CGACCATCAT CCTGGTTTCT 
ATCCTCTTCG GCGGTCTCAT TGTCGGCGGG TACAGCGTCC AGACTTCCGG GGTACCGGCG 
GCCACGGTAT CAATGCTCCA GGGGGCCATC CTCTTCTTTG TCCTTGGCGG TGAGATCCTG 
ACCCGTTACC GGTTGCACTT CGGTCGTAAG GAGGGAAAAT AA

Protein sequence

MPATAVPKNT NRSSGPGSGP ALTLEKRLEP SRFMAVVVPV ISVILALAVG AIFLAATGFQ 
PMKVYQSMLN GAVGSKYGIS ETIVKAIPLM LAGLGVSVAF RMLLWNIGAE GQFYMGAFGA 
SWVALTFPHL PAYIMLPAMF LAGGLMGALW GLLPALPRAK WGVNEVITTL MLNYVAILWV 
DYLVYGPWKD PKGFNFPLTA TFSDAAALPT IAGTRVHVGL IFALVAAVLL AIILWHTRWG 
YEIRVIGESA RAARYAGMNI ERNIILVMLL SGALAGLAGM SEVAGITHRL QHGISPGYGY 
TAIIIAWLAK LHPATIILVS ILFGGLIVGG YSVQTSGVPA ATVSMLQGAI LFFVLGGEIL 
TRYRLHFGRK EGK