Gene Smed_5012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5012
Symbol
ID	5318751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1533461
End bp	1534639
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	54%
IMG OID	640776794
Product	hypothetical protein
Protein accession	YP_001313726
Protein GI	150377130
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.563946
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0503052
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGACA AAAGGTACTC GGACGCCCGC ACGATTTGCC GGGAGCATAT ATCGACAGGC 
GATCCATCCG GCTTTTGGCG GCATTACGAG AGCTTCGTTG ACGAGCTCGC AAGCTCCTGC 
CGACAGCAAG AAGTGTCTGG CTCGAGAATC AAGATTGCTC TGTTCAACGA TACAGACTTC 
AGGATCAATA TCGGATGCAG GCTGACCAGC CAGGGTCTCA AGCAACAAAT TCTAGATGCG 
TTCCCCGCGG CTGAGATTAC GTCCATCGGT TTCAACTTCG CAGCCTTCAG AAAGGAGTTC 
CCGAACTCCA CATCCGCTGG AGGATATGAA CTCTCGGACA TTGAGACCCG ACTTTCCACT 
GCATATGGCG AAGACGCTGT TGACCATATA ACGGCCGCCG ATTTCGTGAT CCTTCAGCCA 
GAGGGATCGT TGGACCACAG GACAACGGCA GAAGGGCTTG CAACCTTCTT CACTCCTATT 
CTTACCGCCA GGAAGCTAGG GAAGCCATTT GCTGTATTGA ACGGAACGAT ACCAATCTAC 
GAAGGCGAAC GATCGGACTA TCTCAAAGGA CTCTTTCGCG AACTCGGCCA TGTGGCCGCA 
CGCGACGAAA TCTCGGCGGA GTATTACGGG ATCGAATTTC TGGCGGATGC TGCATTTCTT 
CGGATATCGC CGGCGCCCGT CGCGGATCGC GATGGTTGCC TGATAACCAC GGGCGCCAGA 
AACAATGCCG AAGAAGACGT CGAAATTCTA AAAGCTGCAC TGAAGATTTG CGAGGCGTGG 
AAGCTTCGGC CTGTTGTTCT TACGCATGCA GTTGAACGAT TCTCTCCATA TGAGGCAGAG 
ATCATCGACC GTGGCGGCAT CTTTGCTGAG ACAGCAAGCA TTGAACGTGC TGCCGAGACA 
ATTTCAACTT GCCGACTTCA CATTGGTGGC CGATATCATA TGGCGATCTT CAGTCTCCTC 
TGTAACGTTC CTTCTCTCCT GTTCGATGTT AAGACCCACA AGAATCAATG GCTTGAACGA 
TACTCTCCTC TGATAACGCT TGTGCATCCG CACACGGACC TCGATGCCGC GGCAGCCGCG 
GTGCTGAGCG GTGGCGTATC GCAGGGACAT CCGGCATCAA CGGGCGCGGA GAAATACGGT 
CTTTTCCTGA AACGCGCTAT GGCTGAACAG CCGCTATAG

Protein sequence

MADKRYSDAR TICREHISTG DPSGFWRHYE SFVDELASSC RQQEVSGSRI KIALFNDTDF 
RINIGCRLTS QGLKQQILDA FPAAEITSIG FNFAAFRKEF PNSTSAGGYE LSDIETRLST 
AYGEDAVDHI TAADFVILQP EGSLDHRTTA EGLATFFTPI LTARKLGKPF AVLNGTIPIY 
EGERSDYLKG LFRELGHVAA RDEISAEYYG IEFLADAAFL RISPAPVADR DGCLITTGAR 
NNAEEDVEIL KAALKICEAW KLRPVVLTHA VERFSPYEAE IIDRGGIFAE TASIERAAET 
ISTCRLHIGG RYHMAIFSLL CNVPSLLFDV KTHKNQWLER YSPLITLVHP HTDLDAAAAA 
VLSGGVSQGH PASTGAEKYG LFLKRAMAEQ PL