Gene Moth_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1930
Symbol
ID	3832422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2004218
End bp	2005609
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	46%
IMG OID	637829862
Product	amino acid permease-associated region
Protein accession	YP_430772
Protein GI	83590763
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000000372004
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00366235
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCTTGC TATTTCGTAG AAAAAGTATT TCTGAAGCAA CGGAACTGGC GGAGCTGAAA 
GAATATAAAT TAAGGCGGGA TCTTAATCTT CTGGAATTAT TCTTTCTAGT AATAGGGGCA 
ACCATTGGCG CCGGTATTTT TGTGCTCCCG GGTGTAGCTG CTGCCAAATA TTCCGGACCG 
GCAGTAAGCA TATCGTTTTT CCTTGGTGGA TTAGTATGTA TCTGTGTGGG CCTGTGCTAT 
GTGGAATTTG CCTCTATGGT TCCGGTGGCA GGTAGTGCCT ATACTTATGC TTACCTCGCT 
TTAGGTGAAA TTTTTGCTTG GATCGTCGGC TGGGATTTGC TCTTCGAATT TACTGCTGGA 
ACTAGTACCG TATCGGTAGG CTGGTCTGGT TATTTTGTAG AATTTTTAAG GGGTTTCGGG 
ATCCATCTTC CCAAAATGAT TACTACGGAT ATCGCCCATG GTGGTTTCAT AAATGCCCCG 
GCAATAATAG CTATTTTACT TGTAACTTAT ATTGTCTATA GTGGTATAAG GGAAGCAGGT 
AAAATAAATG CCTATTTAAG TCTCGGTAAA CTGTGCGCCC TGGCCCTTTT TTTAGTACTG 
GCAATTCCCT TTATTAAGCC GGTAAACTGG CATCCATTTC TTCCCTTTGG GTGGAAAGGA 
GTAATGACCG GCGCCGCCCT TACTTTTTTC GCCTTTACAG GCTTTGATGG TGTAACCACA 
GTTACTGAGG AAACAAAAAA TCCCCAACGG GATGTCCCAA TAGCCCTCGT TTCAGGACTG 
GGGTTTATCA CTATTCTTTA TATTGTTGTT AGCGCCGTAC TAACGGGTGT TGTTCCTTAT 
ACCAAGCTAG ACGTTCCCGA TCCGGCAGCC TTTGCCCTAG TGTCAATAGG CAAAAGCTGG 
GGGGGAGGAA TCATTGCCAT TGCAGCCATT TTCGGGCTAT TTACAGTCAT GATGGGCAAT 
GGTTTAAGTG CGACCCGCAT TCTTTTTGCC ATGAGTCGTG ATGGGCTTCT CCCACCCATC 
TTTGCCCGGG TACACAAAAC AAGGCGAACC CCCTATATTG CCACCTTGAT CATATTTTCA 
GTAGCCCTTA TTGGTGGCGG CTTCCTCTCT ATCGGCGAAT TGGCTGAACT GGCAAATATC 
GGGGGACTAA CCGCCTTTAC CCTTACAGCT ATTAGTACCC TGGTAATGCG GTACAGCCAG 
CCCGCGGCTA GGCGTCCCTT TAAAGTACCA GCCATCTGGG TGGTAGCACC ATTAGGTACA 
GTAGGTGGAA TTGCTCTCAT TAGCAGCCTA CCACCGATTA CCTTCATCCG CTTTGGTATC 
TGGATGGTAA TAGGCCTCGT TATTTACTTC AGCTATGGAA GAAAATATTC CAAAGCTGAT 
ATAGGAGGAT AA

Protein sequence

MTLLFRRKSI SEATELAELK EYKLRRDLNL LELFFLVIGA TIGAGIFVLP GVAAAKYSGP 
AVSISFFLGG LVCICVGLCY VEFASMVPVA GSAYTYAYLA LGEIFAWIVG WDLLFEFTAG 
TSTVSVGWSG YFVEFLRGFG IHLPKMITTD IAHGGFINAP AIIAILLVTY IVYSGIREAG 
KINAYLSLGK LCALALFLVL AIPFIKPVNW HPFLPFGWKG VMTGAALTFF AFTGFDGVTT 
VTEETKNPQR DVPIALVSGL GFITILYIVV SAVLTGVVPY TKLDVPDPAA FALVSIGKSW 
GGGIIAIAAI FGLFTVMMGN GLSATRILFA MSRDGLLPPI FARVHKTRRT PYIATLIIFS 
VALIGGGFLS IGELAELANI GGLTAFTLTA ISTLVMRYSQ PAARRPFKVP AIWVVAPLGT 
VGGIALISSL PPITFIRFGI WMVIGLVIYF SYGRKYSKAD IGG