Gene Smed_5507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5507
Symbol
ID	5319809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	472946
End bp	474895
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	63%
IMG OID	640777262
Product	putative molybdopterin biosynthesis protein MoeA/LysR substrate binding-domain-containing protein
Protein accession	YP_001314194
Protein GI	150377599
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme [COG1910] Periplasmic molybdate-binding protein/domain
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAAAA ATCCTTCTTC AATCCCGCGA AACACCGACC AGAAGCAATT TCTGACGATA 
TTGTCACGTG AGGAGGCCCT GGCGCGTTTC GAAGCAGCGC TGTTTCCCTG GCCGGTACCG 
ACCGAAACAT TGAGGTTAGC CGAGGCGCTC GGGCTGGCTC TTGCCGAAGA CGTCGTGGCG 
CAGGTCGACG TTCCACCCTT CGACCGTTCC AATGTCGACG GGTTTGCGGT GCGAGCAGCA 
GATCTGGTTG CCGCCTCTGA CCTACAGCCT GTTCGATTGA CGCTGAACAT GGAGACGATT 
GCCTGCGGCA GCCTCCCGCA ACTCGCGGTA TTGCCCGGGA CCGCCACAGC CATCGCCACG 
GGTGGCCCTC TGCCGCGCGG TGCGGACGCG ATCGTCATGG TGGAATATAC TCAGCCAGCA 
GAAGGTGCGG CCATAGAAGT GTGGCGTGCT GTCTCGCCGG GGCAGTTCGT CTCCAGCGCC 
GGCTCGGACA TGGCGCGAGG AGAAGTCGTG TTGCGGGCTG GGTCGGTGAT CGGTGCGCGT 
GAGATCGGGA TACTCGCAGC CTGCGGAACC GCGCAGGTAA CGGTGGCACG CAAACTGCGC 
GTTGCAGTTC TGTCCACCGG TGATGAGCTC GTGCAACCGG GCGAACCGCT GCAGCCGGCC 
GGCATTTATG ACGCCAATGG GCCGATCGTA AGTGCGGCGG TCACCGAAAA CGGGGGCGAG 
GCCTATTTTT TGGGTGCGTT TCCAGACGAC GAAGCCAGGC TCGAGACCGC GATGCGCGAG 
GCGCTCGACT CACATGACGT CCTGATTCTG TCCGGAGGCA CTTCCAAGGG TGCGGGAGAT 
GTCAGCTACC GTATTATCGG CCGTCTCGGA CAACCGGGCA TCATCGCTCA CGGTGTTGCG 
CTCAAGCCCG GAAAGCCGCT CTGTCTGGCG GTATGTGACG GCAAGCCGGT TATCATCTTG 
CCAGGGTTCC CGACCTCGGC CATGTTCACC TTCCACGATA TGGTGGTGCC CATCCTGCGG 
CGCATGGCGG GGCTGCCGCC GCGCGTCGAT GCGCAAACGA GTGCGCAGCT TCCGTTCCGT 
GTTCCGTCCG AACTGGGGCG CACCGAGTTT GTCATGGTCT CGCTGGTGCA AGGGCGGGAT 
GGACTGATGG CCTATGCGAC CGGCAAGGGC TCGGGAGCGA TTACCGCCTT CGCCCAGGCT 
GACGGTTTTA TTCGCATTGA CGCCTTCGTC GACCATCTGC CAGCGGGCGC ACAACTGCCG 
GTGACGCTGT TCACGCCGCA GGTCAAGGTG CCCGACCTCG TTGTGATCGG CAGTCACTGC 
ACGGGCCTTG ATCTCGTCGT GGGCAAAATC GCGCGCCAAG GGATTTCGGT GCGATCGTTG 
GCCGTCGGAA GCCTGGGCGG TCTTGCCGCC GCCAAACGCT GTGAGTGCGA CCTTGCACCG 
ATCCATCTTT TCGATCCTCA GACACAGGTC TACAACACGC CATTCCTGGG CGAGGGTATG 
GAGCTTGTGC CGGGCTGGCG GCGCATACAA GGCATCGTGT TTCGCCGCGG CGACGCGCGC 
TTCGAAGATC ATGCTGCGCC GGAGGCGGTG GAAGCGGCTC TGGCTGATCC CGAATGCATG 
ATGGTCAATC GAAACCAGGG TGCCGGTACG CGCATTCTGA TCGACCAATT GCTCGGCCAG 
AAGCGCCCTG ATGGCTACTG GAACCAGCCT CGTTCACACA ATGCAGTCGC CGCCGCTGTC 
GTACAGAAAC GCGCCGATTG GGGCGTCACG ATCGGGCCGG TCGCGCGCGC GGCTGGCCTG 
GGATTCATAC CGCTGACGCA AGAGCACTTT GATTTCGCGC TGGTTGCGGA CCGGAAGGAG 
AGGGTGGCAG TTCAGGCATT CCTTGCCGCC TTGCTGTCGC CTGACATGCA GGAGGCGCTG 
GAGCGGGCGG GATTCAGTCG AGCTTGCTAA

Protein sequence

MVKNPSSIPR NTDQKQFLTI LSREEALARF EAALFPWPVP TETLRLAEAL GLALAEDVVA 
QVDVPPFDRS NVDGFAVRAA DLVAASDLQP VRLTLNMETI ACGSLPQLAV LPGTATAIAT 
GGPLPRGADA IVMVEYTQPA EGAAIEVWRA VSPGQFVSSA GSDMARGEVV LRAGSVIGAR 
EIGILAACGT AQVTVARKLR VAVLSTGDEL VQPGEPLQPA GIYDANGPIV SAAVTENGGE 
AYFLGAFPDD EARLETAMRE ALDSHDVLIL SGGTSKGAGD VSYRIIGRLG QPGIIAHGVA 
LKPGKPLCLA VCDGKPVIIL PGFPTSAMFT FHDMVVPILR RMAGLPPRVD AQTSAQLPFR 
VPSELGRTEF VMVSLVQGRD GLMAYATGKG SGAITAFAQA DGFIRIDAFV DHLPAGAQLP 
VTLFTPQVKV PDLVVIGSHC TGLDLVVGKI ARQGISVRSL AVGSLGGLAA AKRCECDLAP 
IHLFDPQTQV YNTPFLGEGM ELVPGWRRIQ GIVFRRGDAR FEDHAAPEAV EAALADPECM 
MVNRNQGAGT RILIDQLLGQ KRPDGYWNQP RSHNAVAAAV VQKRADWGVT IGPVARAAGL 
GFIPLTQEHF DFALVADRKE RVAVQAFLAA LLSPDMQEAL ERAGFSRAC