Gene Smed_6520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_6520
Symbol
ID	5320823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009622
Strand	-
Start bp	209954
End bp	211174
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	56%
IMG OID	640778069
Product	response regulator receiver protein
Protein accession	YP_001315001
Protein GI	150378407
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0775] Nucleoside phosphorylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.143497
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.120873
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAGTCT TGATAGTCGA GGACGACAAT CAAAAGTACA ATCGCGTTCA TGCCGTGCTC 
GAGCAGGCCG GCGTTGCCGG CAGCGACATC ACCCATGTGA TCGCCGCGGC TCCGGCATAT 
GAACTTTTGC GCCAGACCCT GTTCGATCTG ATGCTTCTGG ATGTCAACAT CCCTCGTCGG 
CTCGGCGATA GGAAGCCACA ACGCGGCGGC GGGCTGGAAT TACTGAAGGA CCTTGGACGC 
GAGAGCGACC TTCGACGGCC GACATACATC GTGGGTTTGA CAGCTTACGA AGACGTCGTT 
GCCGAATTCG GTTCCGCCTT CGAGGATCAG CTTTGGTCGC TTGTGCACTA CAAGGAGTCC 
TCCGACCAGT GGATCGCACA GCTGCTGGTG AAGGTGAATT ATATCCAGGC GGCCAACCGA 
TCGCGCAACT TTAGTGACGG CGAGACATAT GGCTGCGATC TGGCCATCAT CACGGCCTTA 
GATACTGTCG AATTCGACGC AGTTCAGTCG CTCCCGTTAA GCTGGGAGCC TCTTCGCCTT 
CAACACGATG AGACTAGGTA CCTTGCTGGC ACGCTCGCGA CATCGAGCGG TACAAAGAGC 
GTCATCGCGG CGGCGGCCCC GAGAATGGGC ATTCCCGCCT CCGGAATCCT GAGCTCGAAG 
ATCATTCACC AATTCCGCCC CCGTTTCATC GCGATGGTCG GAATCTGCGC TGGTCGCAAG 
GATAAGGTGA GCTTGGGCGA CCTGATCGTC GCGGAACCGA CATGGGACTG GGGAAGTGGC 
AAGATCAGCT CCGAAGAAGG TGAGCCTAAA TTTATGCCTT CTCCGCACCA ACTGGACATC 
GATCCGGACA CTACGTCTCT GTTGAAAGCC ATGACGAAAG ACGCGGTGCT TTTGGCCGGC 
ATCAAAAAAG CCTCCCGGGG AACCAAGCCC AAGACTGAAT TGTCAGCACA CATGGGGCCT 
TTGGTTTCGG GAGCTGCTGT CGTGGCACAT AAGCCGACAT TCGATCAGCT GCTCGATCAG 
CATCGCGGTA TCTTAGGAGT CGATATGGAG GCGTATGCCG TCGCCGCCGC TGCGATGGGC 
AGCGCCAAAC CGCGTCCAAA ATTTCTCATA GTCAAAGGCG TCAGTGACTT TGCTGACGAA 
CACAAGGACG ACGATTACCA GGAATTTGCA GCGTCGGTAA GCGCTAATTT CCTCTTAGTC 
GCGGCCAAAG AGTTTCTTTA G

Protein sequence

MKVLIVEDDN QKYNRVHAVL EQAGVAGSDI THVIAAAPAY ELLRQTLFDL MLLDVNIPRR 
LGDRKPQRGG GLELLKDLGR ESDLRRPTYI VGLTAYEDVV AEFGSAFEDQ LWSLVHYKES 
SDQWIAQLLV KVNYIQAANR SRNFSDGETY GCDLAIITAL DTVEFDAVQS LPLSWEPLRL 
QHDETRYLAG TLATSSGTKS VIAAAAPRMG IPASGILSSK IIHQFRPRFI AMVGICAGRK 
DKVSLGDLIV AEPTWDWGSG KISSEEGEPK FMPSPHQLDI DPDTTSLLKA MTKDAVLLAG 
IKKASRGTKP KTELSAHMGP LVSGAAVVAH KPTFDQLLDQ HRGILGVDME AYAVAAAAMG 
SAKPRPKFLI VKGVSDFADE HKDDDYQEFA ASVSANFLLV AAKEFL