Gene Moth_2490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2490
Symbol
ID	3831593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2595130
End bp	2596599
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	58%
IMG OID	637830412
Product	DNA repair protein RadA
Protein accession	YP_431315
Protein GI	83591306
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1066] Predicted ATP-dependent serine protease
TIGRFAM ID	[TIGR00416] DNA repair protein RadA

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.858464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0874227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCACCAT CGGTGAATGA AAATAGCGGG GCTGATAAAA GCAAGGGGGC AGAACTCCTG 
ACCAGGATCA AAGAACGCTT CGTTTGCCAG CAGTGCGGTT ATGAATCCCA GGGCTTCCTG 
GGCCGATGCC CGGCGTGTGG TAGTTGGAAT AGCCTGGTGG CCGAGGCCAT AATTCCAGAG 
GGTATAAAAA AAGCGGCAGG CTCCGGGGAA GTCCCCGTCC TGCTATCCCG GGTAAATGAT 
ATCAGTGAAA AGAGGCTGGT GACTACCCTG GGCGAATGGG ACCGGGTCCT GGGAGGCGGG 
CTAGTTCCCG GTTCCCTGGT CCTGGTTGGC GGGGCTCCCG GGATTGGTAA GTCTACCCTC 
CTTCTCCAGG TGGCCCACTT ACTCTCTTCG AGGTACGGTA AAATACTCTA TGTCACCGGA 
GAAGAATCCG CCAGCCAGAC CCGGTTAAGG GCTCGACGCC TGGGCGCCGA GGAAGGCGAG 
ATCTACTTAC TGGCGGAAAC TAATATTGAA GGGATCCTCC TGCAGATAGA ACGGCTGCAG 
CCGGTAGTAG TTATGGTGGA TTCTATCCAG ACGATGCTTC TTCCTGATAT CCAGGCTGCC 
CCGGGCAGCG TTTCCCAGGT GCGGGAAGGA GCGGCCCGCT TTTTACGCCT GGCCAAGGAT 
GGCGGCCCGG CAGTAATTCT GGTGGGTCAC GTCACCAAGG AAGGATTCCT GGCCGGCCCG 
AAGGTCCTGG AACACCTGGT GGATTGTGTC CTCTACCTGG AGGGTGAACG CTACCAGGCC 
TACCGCATTC TGCGGTCCGT TAAAAATCGC TTCGGCTCCA CCAATGAGAT TGGCGTTTTT 
GAGATGACCG GCTCCGGTTT GCAGGAAGTA ACCAACCCCT CGGCCATGCT TATGGCCGAG 
CGCCCGGCCG GAGTGGCGGG CTCCAGTGTC GTCGCCTGCC TGGAAGGCAC CCGGCCCCTT 
CTACTGGAGA TCCAGGCCCT GGTGAGTAAG ACTGCCTTTG GAAACCCGCG GCGGCTAGCT 
ACCGGTATTG ATTTCAACCG GGCCCTCCTG CTGGCAGCGG TCCTGGAGAA ACGGGCCGGC 
CTGCCCCTGG GGGGCTACGA TATATACCTT AACGTGGCCG GTGGTATTGC CATCAATGAA 
CCGGCAGCCG ACCTGGGTAT ATGCCTGGCC ATTGCCTCTG GTTTGAAGGA TCGTCCCCTG 
GAATCCCGGA CCCTTGTCCT GGGGGAGGTT GGCCTTGCTG GAGAGGTAAG GGCCGTCACC 
CAGCTGGAAA GGCGCGTTGA GGAAGCAGCC AGGCTGGGTT TTAACCGCTT TATAATTCCG 
GCTGGCAATA GGGGGGGTCT TAAAGGGCAG AGCGGCTGCG AAATATATAA AGTATCTACA 
ATAAATGAGG CCCTGCGACT GGCCCTCGTT AATACCGGCT CAGGGGCAGG CGATAATACG 
TTGAGTAACC CGTTTTATAA ATACTCTTAG

Protein sequence

MPPSVNENSG ADKSKGAELL TRIKERFVCQ QCGYESQGFL GRCPACGSWN SLVAEAIIPE 
GIKKAAGSGE VPVLLSRVND ISEKRLVTTL GEWDRVLGGG LVPGSLVLVG GAPGIGKSTL 
LLQVAHLLSS RYGKILYVTG EESASQTRLR ARRLGAEEGE IYLLAETNIE GILLQIERLQ 
PVVVMVDSIQ TMLLPDIQAA PGSVSQVREG AARFLRLAKD GGPAVILVGH VTKEGFLAGP 
KVLEHLVDCV LYLEGERYQA YRILRSVKNR FGSTNEIGVF EMTGSGLQEV TNPSAMLMAE 
RPAGVAGSSV VACLEGTRPL LLEIQALVSK TAFGNPRRLA TGIDFNRALL LAAVLEKRAG 
LPLGGYDIYL NVAGGIAINE PAADLGICLA IASGLKDRPL ESRTLVLGEV GLAGEVRAVT 
QLERRVEEAA RLGFNRFIIP AGNRGGLKGQ SGCEIYKVST INEALRLALV NTGSGAGDNT 
LSNPFYKYS