Gene Smed_0452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0452
Symbol
ID	5321286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	488506
End bp	489663
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	61%
IMG OID	640789387
Product	radical SAM domain-containing protein
Protein accession	YP_001326144
Protein GI	150395677
COG category	[L] Replication, recombination and repair
COG ID	[COG1533] DNA repair photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.290609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATC TGTCTCAACT CAAGCAGGGC ATCTATGCCC CCGGCAACAG TGTGGATGTC 
GCGGAAGCCC TTGTTGCCGG AACCGGCATC AGGATCGACG TAGACCGTCG GCGCGGCCGT 
GGTGCGGCCC TCAACACATC GGGACGCTTC GAGCCGAAAA CGCACGAAGT CTTCGATGAC 
GGCTGGCAAA CGATCGAGGC GCTTCCACCG TTCAAGACAG AAGTCCAGAT CGAAAAGCCG 
AAGACAGCGA TCACGCGCAA CGATTCTCCC GATATATCCT TCGACCGATC GATCAATCCT 
TACCGCGGCT GCGAACATGG CTGCATCTAT TGCTTCGCGC GGCCTACGCA CGCCTATATG 
GGGCTTTCGG CGGGGCTCGA TTTCGAAGCC AAGCTCTTCG CCAAGCCGGA CGCACCACGC 
CTCCTGGAAC GCGAACTGGC GCGGCCGGAC TACAAGCTCC GTCCGATCGC AATCGGCACC 
AATACCGATC CCTATCAGCC GATCGAGAAG GAATGGCGGA TCATGCGACA GATCCTGGAA 
GTACTGAAGG AGGCCAATCA TCCGGTGATG ATCGTCACGA AATCGGCGAT GGTGACGCGC 
GACATCGATC TGCTGGCGCC GATGGCAGAA AAAGGTCTCG CACGGGTCGG ACTCTCCGTG 
ACCACGCTCG ACGGGAAGCT GGCGCGCAAC ATGGAGCCGA GGGCATCGAC GCCGGCCAAG 
CGGCTGGAGG CGATACGCGC AATTTCCGAA GCCGGCATTC CCGCTGGTGT TCTGGTCGCG 
CCGATCATTC CGGCGCTGAA CGACCACGAG ATAGAGCGGG TGCTCGATTC GGCGAAAGTA 
GCGGGTGCTT CGGATGCGAG CTATGTGCTC CTTCGGCTTC CATTGGAAGT AAGCCCCCTC 
TTCCGCGACT GGCTTCTCAG GAACTATCCG GACCGGTACC GGCACGTCAT GTCCCTCGTC 
CGTTCCATGC GCGGCGGCAA GGATTACGAC GCCGAGTTCG GCAAGCGGAT GAAGGGAAGC 
GGACCTTACG CCTGGCAGAT CGGCCGCCGC TTCGAGCTTG CCGCCAAGCG GCTCGGCCTC 
AATCTGACGC GCCGGCAATT GCGCAGCGAC CTCTTCGTGC CGCCGCTCGG GATGGGCGTT 
CAGCTGTCGT TGCTCTGA

Protein sequence

MNDLSQLKQG IYAPGNSVDV AEALVAGTGI RIDVDRRRGR GAALNTSGRF EPKTHEVFDD 
GWQTIEALPP FKTEVQIEKP KTAITRNDSP DISFDRSINP YRGCEHGCIY CFARPTHAYM 
GLSAGLDFEA KLFAKPDAPR LLERELARPD YKLRPIAIGT NTDPYQPIEK EWRIMRQILE 
VLKEANHPVM IVTKSAMVTR DIDLLAPMAE KGLARVGLSV TTLDGKLARN MEPRASTPAK 
RLEAIRAISE AGIPAGVLVA PIIPALNDHE IERVLDSAKV AGASDASYVL LRLPLEVSPL 
FRDWLLRNYP DRYRHVMSLV RSMRGGKDYD AEFGKRMKGS GPYAWQIGRR FELAAKRLGL 
NLTRRQLRSD LFVPPLGMGV QLSLL