Gene Moth_1928 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1928
Symbol
ID	3830852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2000725
End bp	2001747
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	48%
IMG OID	637829860
Product	spore photoproduct lyase, splB
Protein accession	YP_430770
Protein GI	83590761
COG category	[L] Replication, recombination and repair
COG ID	[COG1533] DNA repair photolyase
TIGRFAM ID	[TIGR00620] spore photoproduct lyase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0376642
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTGTTG AATTAAAACG GGTTGTCTTC GAACCGGAAG CTTTGAACTA TCCCCTGGGG 
CGAAAACTAT ATCAACGCTT CCATGAAGAA AGAGTCGAAG TATTGATGAC CCCATCTCAC 
AACCGTGTTA CTTGTATCCC GGGCAAAACA GCCCGGGAGA GTTTTCTGGA AGCTAAACGT 
ACCCTGGTAG TAGGGGTGCG AAGGAGCAGG GATTTTCAAA CCTGCAAGCC CTCGGCCCAT 
TACCAGTTAC CCCTGGTCAC AAGTTGTCCG GCCATGTGTG AATACTGTTA CCTGTTTACT 
CATTTTGGGC GTAAGCCCTA TCAAAAGATT TATGTTAATA TCGCTGAAAT CCTCGCTCTG 
GCCCGGGATT ATATTAACCG GCGCGACCCC GAAGTAACAT ACTTTGAAGC TTCAGCCACC 
TCAGATCCCG TGCCGGTAGA AAAGTATACC GGCAGCCTTG CCGCTGCTAT TGAATTTATG 
GCCAGGCAAC CCCTGGGGCG CTTGCGGGTT GCTACTAAAT TTACTGATGT AGACGGGCTA 
TTAAACCTGG ACCACCGGGG CCATACCCGC TTTCGCTTTA GTATCAATGC AGAAAACATA 
ATTAAGCGTT TTGAGCATGG TACCCCGCCC CTGGGGCAAC GGCTGGCGGC GGCGGCACAG 
ATGGCCGGGG GAGGTTACCT GACAGGTTTC ATTATTGCTC CTATATTTTA TTTGGAAGGG 
TGGCAGCAGC AATATCGCCA TCTTTTTCAA GTAATTGCCA GGCAACCGTT GCTTGCCGAA 
TCGAATGACC TGACATTAGA GCTAATAACC CATCGCTTTA CCAAACGGGC CAAGACTTCC 
ATTGAAACGC TATTTCCCAA TACAAAATTG CCTCTAGATG AAGAAGAGAG GACTTTTCGG 
TATGGTCAAT TTGGTTATGG TAAGTATGTT TACCCCGCTG AAGTAAGAAC GGCGCTGGAG 
GCTTTTTTCA AAGAAATGGT AGCTACTTAT TTACCGAGGG CTAAAGTTGA GTATTTTATA 
TAG

Protein sequence

MTVELKRVVF EPEALNYPLG RKLYQRFHEE RVEVLMTPSH NRVTCIPGKT ARESFLEAKR 
TLVVGVRRSR DFQTCKPSAH YQLPLVTSCP AMCEYCYLFT HFGRKPYQKI YVNIAEILAL 
ARDYINRRDP EVTYFEASAT SDPVPVEKYT GSLAAAIEFM ARQPLGRLRV ATKFTDVDGL 
LNLDHRGHTR FRFSINAENI IKRFEHGTPP LGQRLAAAAQ MAGGGYLTGF IIAPIFYLEG 
WQQQYRHLFQ VIARQPLLAE SNDLTLELIT HRFTKRAKTS IETLFPNTKL PLDEEERTFR 
YGQFGYGKYV YPAEVRTALE AFFKEMVATY LPRAKVEYFI