Gene Moth_1876 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1876
Symbol
ID	3831220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1938775
End bp	1939932
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	62%
IMG OID	637829808
Product	hypothetical protein
Protein accession	YP_430719
Protein GI	83590710
COG category	[S] Function unknown
COG ID	[COG3949] Uncharacterized membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAC AGTATTCTAC CTGGCAGATT GCCGCTACTT ATATCGGCAC CGTGGTGGGG 
GCCGGGTTCG CTTCCGGCCA GGAAGTGTTG CAGTTCTTCG GGTACTTCGG GCTGCGGGGC 
ATCCTGGGCC TGATCCTGGC CACGGCTCTA TTTATCTTTT TTGGCTACAC CGTCCTTAGG 
CTGGGCTTTC AATTAAAGGC GGAGTCCCAC CTGGAGGTGA TGCACCGGGC CGGCGGCGCC 
TTCATCGGCC GGGCGGTAGA TGCCGTCACC ACCTTCTTCC TATTTGGCGC CCTGGCCGTC 
ATGGCTGCCG GTTCGGGGGC CATTTTCAGG CAGGAATTCC ATCTGCCCGT GCTCCTGGGC 
AGCAGCCTGC TGATAGCCAT CACCCTGGTA ACTGTCCTGG CGGGCATTGA GAAGGTGATT 
GACTCCATCA GTTTGGTAGC CCCGGTCTTG ATAGCCTCTG TACTTGGCAT CAGCCTGGCC 
ACGGTGGCTA AAAACCTGCC CGCCCTGGTA GCCAACCTTT CCTGGGAGGA GACTTACCGG 
GCCGCCGTAT CTTCCTGGCC CCTGGCGGCC CTCCTCTATG CTTCTTACAA CCTGGTATTA 
TCCATTGCTG TCCTGGGCCC CCTGGGAGCC CTGGCCCGGC AGGAGCGCCT CTTGCCGGGG 
GCCTTCCTGG GGGGCCTGGG CCTGGGGCTG GGAGCCATAG CCATTACCCT GGCCCTGATC 
ACCACGGCCC CGGCAGTAAC GGCCCTGGAA GTGCCCATGC TGTATATAGC CGGCAGTTTC 
AGCCCCGTCC TGCGCATTTT TTACAGCGCC GTCCTGCTGG CGGAGATCTA TACTACTGCT 
GTCAGCAGCC TCTACGGTTT TGCCGCCCGC CTGGCCGGAC CGGGAGGAAA TAACTTTCGC 
CGGCTGGCTA TAGGAGCCAG TGCCGTGGCC CTGGCAGCCG GCCAGGCCGG CTTTTCCCGC 
CTGGTGGCCA CCCTTTTCCC CCTGGTGGGT TACGCCGGTT TCCTGCTCCT CGGAGGCCTG 
GCCTATTACG TTCTAAAAGA AATCCTGGCT CTACGACCGG CATTTCCAGG TCGCCTGGTC 
CCTGCCCCGG CCCGCAGGCC GATTTTGGGG GCGGTTTTAG AGAGAAGGGG AAAGGCGGGC 
GAGAAGGAAC GCCCTTAG

Protein sequence

MAKQYSTWQI AATYIGTVVG AGFASGQEVL QFFGYFGLRG ILGLILATAL FIFFGYTVLR 
LGFQLKAESH LEVMHRAGGA FIGRAVDAVT TFFLFGALAV MAAGSGAIFR QEFHLPVLLG 
SSLLIAITLV TVLAGIEKVI DSISLVAPVL IASVLGISLA TVAKNLPALV ANLSWEETYR 
AAVSSWPLAA LLYASYNLVL SIAVLGPLGA LARQERLLPG AFLGGLGLGL GAIAITLALI 
TTAPAVTALE VPMLYIAGSF SPVLRIFYSA VLLAEIYTTA VSSLYGFAAR LAGPGGNNFR 
RLAIGASAVA LAAGQAGFSR LVATLFPLVG YAGFLLLGGL AYYVLKEILA LRPAFPGRLV 
PAPARRPILG AVLERRGKAG EKERP