Gene Smed_4734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4734
Symbol
ID	5319080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1254408
End bp	1255394
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	65%
IMG OID	640776532
Product	molybdopterin dehydrogenase FAD-binding
Protein accession	YP_001313464
Protein GI	150376868
COG category	[C] Energy production and conversion
COG ID	[COG1319] Aerobic-type carbon monoxide dehydrogenase, middle subunit CoxM/CutM homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0105671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCCT TTACTTATCA GCGAAGCGAA GACGCGGCGG GGGCTGTGGC GGCCGTCGCG 
GGAAGACCGG CAGCGCGTTT CATCTCCGGT GGCACCAATC TGCTTGATCT GATGAAGCTG 
GACATCGAGC GCCCGCAGCA TCTCGTGGAC ATCAGCCGAT TGCCGCTGGA CCGTGTCGAG 
CCGACGGAGG AGGGCGGGTT GCATATCGGC GCCCAAGTTC GCAATAGCGA CCTCGCCGCT 
GATCCGGGCG TCAGGTCGCG CTACCCTATT CTGTCTCAGG CGCTGCTGGC GGGCGCTTCC 
GGCCAGATCC GCAATAAGGC TTCCACTGGC GGAAACCTTC TCCAACGCAC GCGATGCCCC 
TATTTCTACG ATAGCAACAT GCCTTGCAAC AAACGGGAGC CCGGCGCCGG CTGCGCCGCG 
CTGAGGGGCT TCAACCGAAT GCATGCGGTG ATCGGAGCGA GCGATTCATG CATTGCCGTG 
CATCCGTCCG ACATGGCGGT GGCCATGGCA GTGCTCGATG CAAGGGTCGA AACAGTGTCA 
CCGGGAGGAG AAACGAGGTC GATCCCGCTC GGTGACCTTT ATCTGCTGCC TGGGACAACG 
GCGGACGAGG AGACGGTGCT CGCCCATGGC GAAATGATCA CTGGCGTCAC TCTGCCGCCG 
CCGCCGGCGG GCCGGCAGGT GTACCGTAAG GTACGCGACC GTGCCTCCTA TGCGTTCGCC 
CTCGTTTCCG TTGCAGCGAT CATCGAAACT TCCGGCAATC GGGTGCGAAG CGCCCGCGTC 
GCCATGGGCG GCGTGGCGCC GAAACCCTGG CGGGCGCCCG AGGTCGAGAG CAGGCTTGCC 
GGTTCGGCTC TTTCGGATCA GGCCTTATCG GAGGCCGCCG AGGCGGCTCT CCCCGAAGCC 
GTCGGGCATG GCGGCAACGA CTTCAAGATA CGCTTGGCCA AGCGGACGGT GCGCTACACG 
CTCGCCGCCG CGGCCGAACT GGTTTGA

Protein sequence

MQPFTYQRSE DAAGAVAAVA GRPAARFISG GTNLLDLMKL DIERPQHLVD ISRLPLDRVE 
PTEEGGLHIG AQVRNSDLAA DPGVRSRYPI LSQALLAGAS GQIRNKASTG GNLLQRTRCP 
YFYDSNMPCN KREPGAGCAA LRGFNRMHAV IGASDSCIAV HPSDMAVAMA VLDARVETVS 
PGGETRSIPL GDLYLLPGTT ADEETVLAHG EMITGVTLPP PPAGRQVYRK VRDRASYAFA 
LVSVAAIIET SGNRVRSARV AMGGVAPKPW RAPEVESRLA GSALSDQALS EAAEAALPEA 
VGHGGNDFKI RLAKRTVRYT LAAAAELV