Gene Smed_4123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4123
Symbol
ID	5319316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	590487
End bp	592604
Gene Length	2118 bp
Protein Length	705 aa
Translation table	11
GC content	62%
IMG OID	640775929
Product	catalase
Protein accession	YP_001312862
Protein GI	150376266
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0753] Catalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.283917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGA AACCGTCTGC GCCGAACAAT ACGAAACCGG CCACCATTCA TGACCAGAAA 
GCGACACGCG GCAATGGTGG AGAGCTTCAC CAGATCGCCG AAGGTGACAC GCCCGTTCTG 
ACGACGGCGC AGGGCGGCCC TGTCGCCGAC GATCAGAACA GCCTGCGAGC CGGCGAGCGT 
GGCCCCACGC TCATCGAGGA TTTTCATTTT CGCGAGAAGA TCTTCCACTT CGACCATGAA 
CGAATTCCCG AGCGCGTCGT GCATGCTCGC GGTTATGGCG TTCACGGCTT TTTCGAGACC 
TACGAGTCGC TTGCCGCCTA CACCCGGGCG GACCTGTTCC AGCGCCCGGG CGAGCGAACC 
CCCGCCTTCG TGCGGTTCTC GACGGTCGCC GGAAGCAAGG GCTCCTTCGA TCTCGCCCGC 
GACGTGCGTG GCTTCGCGGT CAAGATCTAC ACCAAGGAGG GCAATTGGGA CCTGGTCGGC 
AACAATATTC CGGTCTTCTT CATCCAGGAT GCGATCAAGT TTCCCGACGT GATACATTCG 
GTAAAACCCG AGCCGGACCG GGAGTTTCCG CAGGCGCAGT CCGCCCATGA CAATTTCTGG 
GACTTCATCA GCCTGACACC GGAAAGCATG CACATGATCA TGTGGGTCAT GTCCGACCGG 
GCGATTCCGC GATCGTTCCG GTTCATGGAA GGGTTCGGCG TGCACACCTT CCGCTTCGTC 
AACGCCAAGG ACGAGTCCAC CTTCGTCAAG TTCCACTGGA AGCCGAAGCT CGGGCTGCAG 
TCCGTGGTCT GGAACGAGGC CGTGAAGATC AACGGCGCCG ATCCGGACTT CCACCGGCGC 
GATATGTGGC AAGCCATCCA GTCCGGCAAC TTTCCGGAAT GGGAACTGCA TGTGCAGCTC 
TTCGATCAGG ACTTCGCCGA CAAGTTCGAT TTCGACATCC TCGATCCAAC CAAGATCATC 
CCCGAGGAGG TGCTGCCAAC GAAGCCTGTC GGCCGGCTGG TGCTCGATCG CATGCCGGAG 
AATTTCTTCG CCGAAACCGA GCAGGTCGCC TTCATGACGC AGAACGTCCC GCCCGGCATC 
GACTTCAGCG ACGATCCATT GCTGCAGGGA CGCAACTTCT CCTATCTGGA CACCCAGCTG 
AAGCGGCTCG GCAGCCCGAA TTTCACCCAC CTTCCGATCA ACGCGCCGAA ATGTCCCTTC 
CATAACTTTC AGCAGGACGG CCACATGGCC ATGCGCAACC CTGTCGGGCG CGCGAACTAC 
CAGCCCAATT CCTGGGGCGA GGGACCGCGC GAGTCGCCCG TCAAAGGCTT CCGACACTTT 
GCTTCGGAGG AGCAGGGACC GAAGCTCCGC ATCCGCGCTG AAAGCTTCGC CGACCATTAC 
AGTCAGGCAC GGCAGTTCTT CATCAGCCAG ACGCCACCCG AGCAGCGGCA CATCGCCGAC 
GCCCTGACCT TCGAACTGAG CAAGGTCGAG ACGCCGGTGA TCCGTGAGCG GATGGTCGCG 
CATCTCCTCA ACATCGACGA GACGCTGGGA AAAAAGGTCG GCCACGCGCT CGGCATGGAG 
ACGATGCCGA AACCCGCCGA CGCGGCCGTT GCCACACGCC AGGACCTCGA TCCGTCGCCG 
GCGCTCAGCA TCATCCAGCG CGGGCCCAAG CGTTTCGAAG GACGCAAGCT CGGAATATTG 
GCGACCGACG GGACGGATGC CGCCCTTCTT AACGCCTTGC TGCAGGCGGT CGATACGGAG 
AAGGCGGCTT TCGAACTGAT CGCACCAAAA GTCGGCGGCT TCACCGCCTC AGACGGCAAA 
CGGATAGCGG CCCACCAGAT GCTCGACGGC GGCCCGTCGG TGCTCTACGA CGCCGTGGTC 
CTGCTTGCCT CCGCAGAGGC CGTCGCGGAG CTGATCGACG TCGCCACCGC GCGCGATTTC 
GTAGCCGACG CCTTCGCCCA TTGCAAATAT ATCGGCTATG TCAGCGCCGC GGTTCCCCTT 
CTCGAGAGGG CCGGCATAGC GGGATTGCTC GATGAGGGAA CGATCGAACT CACCGACGCC 
GGGAGTGCAG CCGCTTTCCT GAAGGAACTT GGCAAGCTGC GCGTCTGGGC ACGAGAGCCC 
TCGGTCAAGC TGAAATAG

Protein sequence

MAKKPSAPNN TKPATIHDQK ATRGNGGELH QIAEGDTPVL TTAQGGPVAD DQNSLRAGER 
GPTLIEDFHF REKIFHFDHE RIPERVVHAR GYGVHGFFET YESLAAYTRA DLFQRPGERT 
PAFVRFSTVA GSKGSFDLAR DVRGFAVKIY TKEGNWDLVG NNIPVFFIQD AIKFPDVIHS 
VKPEPDREFP QAQSAHDNFW DFISLTPESM HMIMWVMSDR AIPRSFRFME GFGVHTFRFV 
NAKDESTFVK FHWKPKLGLQ SVVWNEAVKI NGADPDFHRR DMWQAIQSGN FPEWELHVQL 
FDQDFADKFD FDILDPTKII PEEVLPTKPV GRLVLDRMPE NFFAETEQVA FMTQNVPPGI 
DFSDDPLLQG RNFSYLDTQL KRLGSPNFTH LPINAPKCPF HNFQQDGHMA MRNPVGRANY 
QPNSWGEGPR ESPVKGFRHF ASEEQGPKLR IRAESFADHY SQARQFFISQ TPPEQRHIAD 
ALTFELSKVE TPVIRERMVA HLLNIDETLG KKVGHALGME TMPKPADAAV ATRQDLDPSP 
ALSIIQRGPK RFEGRKLGIL ATDGTDAALL NALLQAVDTE KAAFELIAPK VGGFTASDGK 
RIAAHQMLDG GPSVLYDAVV LLASAEAVAE LIDVATARDF VADAFAHCKY IGYVSAAVPL 
LERAGIAGLL DEGTIELTDA GSAAAFLKEL GKLRVWAREP SVKLK