Gene Smed_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4033
Symbol
ID	5318333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	492310
End bp	494112
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	61%
IMG OID	640775841
Product	putative monooxygenase protein
Protein accession	YP_001312774
Protein GI	150376178
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2072] Predicted flavoprotein involved in K+ transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGAAG AAAGTCCCGG CACCCGCATC GACATTGTGC TCGCCAAACT CGGAAGAGCC 
CTCGAACGTG GCGACATCGA TGCCGCCGTC AACCTGTTCC AGGCCGATTG CTACTGGCGC 
GATCTGGTTG CCTTCACCTG GAATCTCAAA ACCATGGAGG GGCAGGACCA GATCCGCGAT 
ATGCTGACGA GCCAGCTTGC CGCGATCAAG CCGGCGCGGC TGCGCCAGGA CGAGATGGAA 
CGGCCTGGTG ACGCAGACGG TGTCACCGAA GGATGGTTCG AATTCGAAAC GGAGGTGGCG 
CGCGGCCACG GCCATATCCG CCTCAAGAAC GGCCTGATCT GGACGCTTCT GACGACGATG 
ACGGAGCTTA AAGGACACGA GGAGCCAAGG GGAGCCAGAC GTCCGCTCGG CGCCGAGCAC 
GGCCATGACC CGAGCCGCAA GACATGGAAG GAAAAGCGCG AAACCGAAGC GGCCGAACTC 
GGTTATACAA GCCAACCCTA CGTCGTCATC ATCGGCGGAG GTCAGGGCGG AATAGCACTC 
GGCGCGCGCC TCAGGCAGCT CGGCGTTCCG GCCATCATTA TCGAGAAGAA CGAGCGGCCC 
GGCGACAGCT GGCGGAAGCG CTACAAGTCG CTCTGCCTGC ACGATCCGGT CTGGTACGAC 
CATCTCCCCT ATATCCCCTT CCCGGAGAAC TGGCCGGTAT TCGCCCCGAA AGACAAGATC 
GGCGACTGGC TGGAGATGTA TACCAAAGTG ATGGAACTCA ATTACTGGAG TTCGACCACC 
TGCAAATCAG CACGGTATGA CGATGTAACG AAGGAATGGA CGGTCGTCGT CGAGCGCGAT 
GGGGAGGAGG TCGTCCTCCG GCCGAAGCAG CTCGTTCTGG CGACCGGCAT GTCGGGCAAG 
CCGAACGTCC CGAAGCTGAG GGGCCAGGAT ATCTTCAAGG GCGAGCAGCA GCATTCCTCT 
CAGCATCCCG GTCCCGATGC ATATCGTGAG AAGAGGGTCG TCGTCATCGG CTCCAACAAT 
TCCGCGCACG ATATCTGCGC CGCGCTCTGG GAAGGGGGCG CGGATGTGAC GATGGTGCAG 
CGATCGTCGA CGCACATCGT GCGGTCGGAT ACGCTGATGG AGATCGGGCT TGGAGACCTT 
TATTCCGAGC GGGCGCTTGC CGCCGGCATG ACGACGCGCA AGGCTGATCT GATCTTTGCT 
TCGCTGCCCT ACCGGATCAT GCACGAGTTC CAGATCCCGC TATACGAGAA GATGCGCGAG 
CGGGACGCCA AGTTCTATGC CGATCTCGAA AAGGCCGGCT TCATGCTCGA CTGGGGCGCG 
GACGGATCCG GCCTTTTCAT GAAGTATCTG CGTCGCGGAT CCGGCTACTA TATCGACGTC 
GGCGCCTGCG ATCTCGTGAT CGACGGCAGC ATCAAGCTGA AATCCGGTTC TGACGTCAGC 
CATCTGACGG AGGATTCCGT GGTGCTCAAG GACGGCACAG TGCTTCCGGC CGATCTCGTC 
GTCTATGCTA CAGGCTACGG CTCGATGAAT GGCTGGGCAG CCGACCTCAT CTCCAGGGAA 
GTCGCGGACA AGGTCGGCAA GGTCTGGGGC CTCGGCTCCG ATACGCCGAA GGACCCGGGC 
CCCTGGGAGG GCGAGCAGCG AAACATGTGG AAGCCGACGC AGCAGGAGGC GCTCTGGTTC 
CACGGCGGAA ACCTGCATCA GTCGCGGCAT TATTCGCAAT ATCTGTCGCT GCAGTTGAAA 
GCGCGCTGCG AGGGCATATC GACACCCGTC TATGGTCTCC AGGAACGCCA TCACCTCGCC 
TGA

Protein sequence

MLEESPGTRI DIVLAKLGRA LERGDIDAAV NLFQADCYWR DLVAFTWNLK TMEGQDQIRD 
MLTSQLAAIK PARLRQDEME RPGDADGVTE GWFEFETEVA RGHGHIRLKN GLIWTLLTTM 
TELKGHEEPR GARRPLGAEH GHDPSRKTWK EKRETEAAEL GYTSQPYVVI IGGGQGGIAL 
GARLRQLGVP AIIIEKNERP GDSWRKRYKS LCLHDPVWYD HLPYIPFPEN WPVFAPKDKI 
GDWLEMYTKV MELNYWSSTT CKSARYDDVT KEWTVVVERD GEEVVLRPKQ LVLATGMSGK 
PNVPKLRGQD IFKGEQQHSS QHPGPDAYRE KRVVVIGSNN SAHDICAALW EGGADVTMVQ 
RSSTHIVRSD TLMEIGLGDL YSERALAAGM TTRKADLIFA SLPYRIMHEF QIPLYEKMRE 
RDAKFYADLE KAGFMLDWGA DGSGLFMKYL RRGSGYYIDV GACDLVIDGS IKLKSGSDVS 
HLTEDSVVLK DGTVLPADLV VYATGYGSMN GWAADLISRE VADKVGKVWG LGSDTPKDPG 
PWEGEQRNMW KPTQQEALWF HGGNLHQSRH YSQYLSLQLK ARCEGISTPV YGLQERHHLA