Gene Moth_1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1079
Symbol
ID	3833192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1109977
End bp	1111023
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	57%
IMG OID	637829007
Product	recA protein
Protein accession	YP_429936
Protein GI	83589927
COG category	[L] Replication, recombination and repair
COG ID	[COG0468] RecA/RadA recombinase
TIGRFAM ID	[TIGR02012] protein RecA

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGCG TGGTCATAAA TGAAAAACAA CGGGCTCTGG AAATGGCCCT GAGCCAGATT 
GAGCGCCATT TCGGTAAAGG TTCCATCATG CGGCTGGGTG AAACCGGCGC CCGCCTCAAT 
GTTGAGGCCA TCTCCACCGG AGCCCTGCCC CTGGATCTGG CCCTGGGAGT AGGGGGGTTG 
CCCCGGGGGC GGGTAATAGA GATCTTTGGC CCGGAATCCT CCGGTAAAAC TACTGTAGCC 
CTACATGTCA TTGCCGAAGC CCAGCGGGCC GGGGGTACAG CAGCCTTTAT CGATGCCGAA 
CATGCCCTGG ACCCAGTCTA CGCCCACAAC CTGGGAGTAG ATACGGATAA CCTGCTGGTG 
TCCCAGCCCG ATACCGGGGA ACAGGCCCTG GAGATAGCTG AAGCCTTGGT ACGCAGCGGG 
GCTATTGACG TTATCGTCAT CGACTCGGTG GCCGCCCTGG TACCCCGGGC CGAACTGGAG 
GGAGAGATGG GCGATGCCCA TGTAGGTCTC CAGGCGCGGT TAATGTCCCA GGCTTTGCGT 
AAATTGGCAG GGATTATCTC CAAATCGCGG ACGGTGGCCA TTTTCATCAA CCAGCTACGG 
GAAAAGGTGG GAGTCCTCTT CGGCAACCCT GAGACTACCC CCGGTGGCCG TGCCCTGAAG 
TTTTATGCTT CCGTACGTCT GGATGTCCGT AAAGTAGAAC AGCTAAAAGC CGGGACAGAG 
ATAGTCGGCA ATCGAACCAG GGTCAAGGTT GTTAAGAATA AGGTAGCACC ACCTTTTCGC 
CAGGCCGAAT TTGACATTAT CTACGGCCGG GGAATCGACC GCGAGGGCTG CCTCCTGGAT 
ATGGGGACTG AACTGGATAT CATTAAAAAG AGCGGTGCCT GGTATTCCCT GGGGGAAGAC 
CGCCTGGGAC AGGGACGCGA AGCCGCCAAG GATTTCCTCC GAGAACACCC CGATCTGGCT 
GCCGCCCTCG AGACCAAGAT CCGGGAAAAA GCAGGCTTAA TTAACTTTAC GGCCGGGAAA 
GAAGATGCCA CTTCGGGGGA AGACTGA

Protein sequence

MQRVVINEKQ RALEMALSQI ERHFGKGSIM RLGETGARLN VEAISTGALP LDLALGVGGL 
PRGRVIEIFG PESSGKTTVA LHVIAEAQRA GGTAAFIDAE HALDPVYAHN LGVDTDNLLV 
SQPDTGEQAL EIAEALVRSG AIDVIVIDSV AALVPRAELE GEMGDAHVGL QARLMSQALR 
KLAGIISKSR TVAIFINQLR EKVGVLFGNP ETTPGGRALK FYASVRLDVR KVEQLKAGTE 
IVGNRTRVKV VKNKVAPPFR QAEFDIIYGR GIDREGCLLD MGTELDIIKK SGAWYSLGED 
RLGQGREAAK DFLREHPDLA AALETKIREK AGLINFTAGK EDATSGED