Gene Smed_4540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4540
Symbol
ID	5319041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1027229
End bp	1028599
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	63%
IMG OID	640776341
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_001313273
Protein GI	150376677
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGTTA TCGAAGAACT CATGGCCGCA CTCGGCAATG CCGTGCTCAC CGGCGACCGG 
ATCACGGAGC GTTACCGCAG CGATGCGAGC CTGTCGGGGC GGACCCTTCC CCTGGCGGTC 
GTTCGCCCGG GAAGCGTCGA CGAGGTCGCC GTGGCTCTCA AGATCTGCAA CGCGCACGGC 
CAGTGCGTGG TGCCGCAGGG CGGGTTGACC GGGCTTGCCG GCGGCGCCAA TCCGCGCGCC 
GGCGACATCG CCGTTTCGCT GGAGAGACTT TCCGGCATTG AAGAGGTCGA CGCGACCGCT 
TCGAGCATGA CGGTGCTCGC GGGAACGCCG CTCGAAGTCG CCCAGCGCGC GGCCGAAGAC 
GCGGGCTTTC TGCTGCCGAT CGATCTTGGT GCGCGGGGTA GCTGCCAGAT CGGCGGCAAC 
CTGGCCACGA ATGCCGGCGG CATCCGGGTC ATCCGCAATG GCGTGGCACG GGACAACGTG 
CTGGGGCTCG AAGCCGTGCT TGCCGACGGC ACCGTCGTCT CGTCAATGAA CAAGATGATC 
AAGAACAACA CCGGCTACGA TCTCCGGCAG TTGTTCATCG GTTCGGAAGG CACGCTCGGC 
ATCATCACGC GCGCGGTGCT GCGCCTTCGT CCTTTGCCAA CCGGCCGGCT GACGGCACTT 
TGCGCGCTCG ACAGCTATTC GGAAGTCGTT ACCCTGCTCA AGCGGGCACA GCAGGAGCTC 
CCCGGCCTCG GCGCCTATGA GGCGATGTGG GAGAGCTACT TCCGTTTCAA TTCCGAGGCC 
GACGGGCTCA GGCTCTTCGA ATCCTGCCCG GCTTTCGCAG TCATTGTGGA GCAGGATTTG 
CAAGGCCATG ATGCGGAGAG CGAGCGGTTC GAAGCGTTTC TCGGGAGAGC CTTGGAGGAC 
GGTGTGATCG GAGACGCGCT CGTCGCTCAA TCGCAGAAGG AGGCACAAGC CTTCTGGCGA 
ATTCGAGAGG GTCATGCGCT CGACCGGCTG CCCCTGCTCC TGAACTTCGA TGTCAGCCTG 
GCGATCGGCG ATATCGGCCG CTTCGCCGAT GAATGCGGCC AGGCGCTTCG GGCAAAGTTC 
CCCGAAGCAC ATGTGTCCTT CTTCGGCCAT GTCGGCGACA GCAACCTCCA TATCGCCTTT 
TCCGATCCGG GCGCTACCGA AGAAACGATC CACGCAGTGG ACGATATCGT TTACGCGCTG 
GTTGGGACCT ATCGCGGATC GGTGTCTGCC GAACACGGGA TCGGCTTGCT GAAGCGCGAC 
TTTCTCCACT ATTCCCGCAG CCCGGCGGAG CTCGAACTCA TGCGGCGGAT AAAGAGCGCT 
CTCGATCCCA ACGGAATCCT CAACCCCGGC AAAGTTCTGG GCTCGGTTTA G

Protein sequence

MSVIEELMAA LGNAVLTGDR ITERYRSDAS LSGRTLPLAV VRPGSVDEVA VALKICNAHG 
QCVVPQGGLT GLAGGANPRA GDIAVSLERL SGIEEVDATA SSMTVLAGTP LEVAQRAAED 
AGFLLPIDLG ARGSCQIGGN LATNAGGIRV IRNGVARDNV LGLEAVLADG TVVSSMNKMI 
KNNTGYDLRQ LFIGSEGTLG IITRAVLRLR PLPTGRLTAL CALDSYSEVV TLLKRAQQEL 
PGLGAYEAMW ESYFRFNSEA DGLRLFESCP AFAVIVEQDL QGHDAESERF EAFLGRALED 
GVIGDALVAQ SQKEAQAFWR IREGHALDRL PLLLNFDVSL AIGDIGRFAD ECGQALRAKF 
PEAHVSFFGH VGDSNLHIAF SDPGATEETI HAVDDIVYAL VGTYRGSVSA EHGIGLLKRD 
FLHYSRSPAE LELMRRIKSA LDPNGILNPG KVLGSV