Gene Smed_0543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0543
Symbol
ID	5321377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	586475
End bp	587587
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	67%
IMG OID	640789477
Product	A/G-specific adenine glycosylase
Protein accession	YP_001326234
Protein GI	150395767
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.158225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.629341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCCG AACCGGCGAC GGACGCCGCT GCCCTTCTCC TCGGCTGGTA CGACCGGCAC 
CACCGCGACC TGCCGTGGCG GATCTCGCCA CCGATGGCGC GAAAAGGCGC AGTTGCCGAT 
CCCTACCATG TGTGGCTGTC GGAGGTGATG CTTCAACAGA CCACGGTGAA GGCGGTCAAG 
GCCTATTTTC AGAAATTCCT CGCCCTGTGG CCAACGGTCG GCGACCTCGC CGCAGCGGAT 
ACCGAGGATG TGATGAAGGC CTGGGCCGGC CTCGGATATT ACGCCCGCGC GCGCAATCTG 
AAAAAATGTG CCGAAGCGGT CGTCCGCGAT CATGGCGGCC GTTTCCCGGA TCGAGAAGAG 
GAACTGAAGG CGCTGCCGGG GATCGGCGAC TACACCGCCG CAGCCATCGC CGCCATCGCC 
TTCAACCGAA GAAGTGCCGT TCTCGACGGC AATGTCGAGC GCGTGATCTC GCGCCTCCAT 
GCCGTCGAAA CGCCGCTGCC GGCGGCGAAG CCCGAAATGC GGGCTCTCGT CCACACCCTG 
ACGCCCCTCG GCCGGCCGGG GGACTTCGCC CAGGCGATGA TGGATCTCGG CGCGACGATC 
TGCACGCCGA AACGGCCCGC CTGTTCGCTC TGTCCGTTCC GCGCCGATTG CCGGGCGCTG 
AAAATCGCCG ACCCGGAGAC GTTCCCGCGC AAGGCCCCAA GGAAGGAGAA GCCGCTGCGG 
CTTGGTGCCG CCTTCGTCGC GATCGACGAC TGCGAGGCGG TCTATCTCCG CAAGCGGCCG 
GAAACGGGTC TCCTTGGCGG CATGACCGAG ATCCCGGGTA CGGAGTGGAC CTCACGCCGC 
GACGGCGACA CTTCGGTCGA CGCTCACCCC TTCCCCGCGC CCTGGGAGCC GTGCGGGACC 
GTCAGTCACG TCTTCACGCA TTTCGAGTTG CGCCTCTCGG TGTTTCGAGC CAGTGTCGTG 
CGAGTCAGTG AAGGGGGAGC CGGCGCGGGA GCGGCACCGG CTGGGACGAG CGGATGGTGG 
GAGCCGCTCG ACTCCCTGAA GGCGCAGGCC CTTCCGACCG TCATGAAAAA GGCGATCGCC 
AAGGCTATAC CGCACGCGTT CGCAGCGGGA TAA

Protein sequence

MTPEPATDAA ALLLGWYDRH HRDLPWRISP PMARKGAVAD PYHVWLSEVM LQQTTVKAVK 
AYFQKFLALW PTVGDLAAAD TEDVMKAWAG LGYYARARNL KKCAEAVVRD HGGRFPDREE 
ELKALPGIGD YTAAAIAAIA FNRRSAVLDG NVERVISRLH AVETPLPAAK PEMRALVHTL 
TPLGRPGDFA QAMMDLGATI CTPKRPACSL CPFRADCRAL KIADPETFPR KAPRKEKPLR 
LGAAFVAIDD CEAVYLRKRP ETGLLGGMTE IPGTEWTSRR DGDTSVDAHP FPAPWEPCGT 
VSHVFTHFEL RLSVFRASVV RVSEGGAGAG AAPAGTSGWW EPLDSLKAQA LPTVMKKAIA 
KAIPHAFAAG