Gene Moth_1635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1635
Symbol
ID	3831264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1670275
End bp	1671585
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	53%
IMG OID	637829560
Product	hypothetical protein
Protein accession	YP_430480
Protein GI	83590471
COG category	[S] Function unknown
COG ID	[COG2855] Predicted membrane protein
TIGRFAM ID	[TIGR00698] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.972059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACG GTAATAAGCG CAGTCCCTTT CTTGCCAGTG AAGACTGGTG GTCAGTTTAC 
CTGGGCCTTT TTCTGGTGCT ATTAACATAC TTCGCTTTTA AAGCCGGTTC TTCCCTGGAT 
TTTTTAAAGG CTGCCATGCC AGTTGAATGG CCGACCAAAA GCCTGGGGGC CCACTTCGCT 
GCTAATATCG GCGCCTATAT TGCCATGTAC TTTATTCTGC TGGTACTAAC CACCATTGCC 
GTAGCCGTTA TGGGCGGCAA GGTGGGCAAT TATATTGCTT CCTTTACAGT TTTATTCATA 
GCTTCCCTCA TTATTTTAAT TATTGGGAGC CAGCATACGA TCAAGCATTA TGGACTGGAG 
TACCCCTTCT GGTCCCTGGT AATAGGACTC ATTATTGGAA ACTTTACGAC ATTACCTGAG 
TGGTTCCAGG AAGGCGCCAA AAGAACGGAA TTCTTTATTA AGACCGGTAT TGTCCTGCTG 
GGTGCCGGCT TGCCCTTTAC CGTCATCGTT TCTGGCGGCG TCTGGGGCTT CCTGGAGGCC 
ATATGCATTG TTGCCATTGG CTTCACTGTG GCCTTTACCA TTGCCCGCAG GCTGGGTTAT 
GATCCCCGTT TTGCGGCCGT CCTGGGTGCT GGCGGTTCCG TCTGTGGCGT TTCGGCAGCC 
ATTGCCGTCG GGAGTTCGGT TAAAGCTGAA GAGAAGCATG TCGGTTACGT GGTTTCTTTG 
GTGGTCCTGT ATGCGCTAGT TCTCATTTTC CTCTTGCCAG TATTGGGTAG ACTTTTCGGC 
CTCAACGAGT ATGTCACCGG GGCCTGGATT GGCGGTTCCG AACTGGCCGA TGCTGCCGGC 
CTGGCTGCAG CAGCCATGGT TTCAGATAAT GCCGTCAAAG CCTTTACCCT GGTGAAACTC 
AACCGCGACG TGATGATCGG TGTCCTGTCC TTTATCTTTG CTACCCTGGC GGTCACTCGC 
TGGGAGGTTG CAGCCAGCGG CGAGCGGCCC AGCGCCATGG TTATCTGGGA GCGTTTCCCC 
AAGTTCGTCC TGGCCTTCCT GGTAGCTTCG TTCATCACGA CTTCATGGGT CGTGTCCCTG 
GGGAAACCCG CTGTTGATGC CCATATCTCG GCCAACCTCA CTACCATCCG CACCTGGCTC 
TTCGTCCTGG CTTTCCTGTG CATCGGCCTG AACACCAAGA TCCAGGATAT CCGGGCCATG 
GGCCGGAAAC CCATCATTGC CTTCACTACG GTGGTCCTGG TTAACGTCAT CGTGGGCTTC 
ATTGTTGCCA ACCTCTTCTT TGGCGGTATC ATTGCCGCAC CGCTGCATTA A

Protein sequence

MPNGNKRSPF LASEDWWSVY LGLFLVLLTY FAFKAGSSLD FLKAAMPVEW PTKSLGAHFA 
ANIGAYIAMY FILLVLTTIA VAVMGGKVGN YIASFTVLFI ASLIILIIGS QHTIKHYGLE 
YPFWSLVIGL IIGNFTTLPE WFQEGAKRTE FFIKTGIVLL GAGLPFTVIV SGGVWGFLEA 
ICIVAIGFTV AFTIARRLGY DPRFAAVLGA GGSVCGVSAA IAVGSSVKAE EKHVGYVVSL 
VVLYALVLIF LLPVLGRLFG LNEYVTGAWI GGSELADAAG LAAAAMVSDN AVKAFTLVKL 
NRDVMIGVLS FIFATLAVTR WEVAASGERP SAMVIWERFP KFVLAFLVAS FITTSWVVSL 
GKPAVDAHIS ANLTTIRTWL FVLAFLCIGL NTKIQDIRAM GRKPIIAFTT VVLVNVIVGF 
IVANLFFGGI IAAPLH