Gene Smed_5642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5642
Symbol
ID	5319944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	607955
End bp	609262
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	59%
IMG OID	640777378
Product	hypothetical protein
Protein accession	YP_001314310
Protein GI	150377715
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCCG ACCAGAGCAG GGAGGAGATC GCATACGCGG TAGGTCTGCA GGCCTATCTC 
TGGGGCTTCC CGCTGTACTA CTACAGCAGA AGCACTCCGA AGAGCGTCGA GGTCGGCGGA 
ACCTTCATCA ATGATTTCCG CAAGTATTCG GAGTTGAAGA CTGCCAAAGA CAGGTTCGTC 
GTCACGCCCA ACAACGTGAC CATCGATGCC TACGCAACGC TCGACCTCAC GGTCGAGCCG 
GTCGTCATCT TCGTTCCCTC TCTTTCGCAA CCGCGCTGGT ATATCGTTCA GATCGGGGAT 
TCCTTCGACG AGATCGTCAG AAACATCGGC GGAACCAAGG GTGCGGAACC CGGCGTCTAC 
ATTGTCACCG GACCGGATTT CAGCGGGGAC GTTCCGGGGG ACATGATCCA GGTGAAGAGC 
CGTACCAAGA TCGGCGTGGC CGCCGTCCGG ATTCTGGCGA ACGGGGAAGC AGACCTTCCA 
AATGCTGTCG AGGCCCAGAA GGGTTTCCAC CTTATGCCCC TATCCGCCTA TCTGCGAGAC 
GGGCTAGCAC ACAAGGCGGC CGATCCACGT CCGCAGATGA GGCTTTTCGA AAGCGATGCC 
CCCGAGGGGA TCAGGTATTT CGACGAGCTC GGCGACGCGA TGACGAAACG TCTTCCCGCG 
TCCGCCGACT CGCAGGATTT CCTCGTCTCA TCGTTCAAGC AGATCGGTTT GAGCGTCGGC 
GGAGGCTTTC AGTGGAAATC GCTCGACGAG TCGACAAAGA AAGGTCTGGA ACGAGCGATC 
AAGACGGGAG AGCAGATCGT CGACAGCAAA TGGGCGGCGA CCGGGGAAAT CACCAACGGC 
TGGAAATACA CCTTCGCTGG CGGCAGGGCG GGATACGATC CCGGCCTTCG CGCGGCGCTC 
GCCAAATACG AGGTCGGAGC CCAGCTTTCC GATCATGTCA TCTATCCCAA CACCAGCGTC 
GACGACAAGG GCGAGCCCCT CAACGGCTCG AAGAGGTACG TCCTGCACTT TGATGCCGGA 
AAACTTCCGC CTGTCTCCGT ATTCTGGAAC ATGGCGATGT ATGGTTCCGA CATGCTGTTC 
GTCGAGAACG AGTTCAAGCG TTACAGCATT GGCAGCACGA CGGACGGGTT GAACAAGGAC 
GCTGACGGCT CGCTGACGAT ACTCATTCAG AAGAACAAAC CAGCAGACAC TGCCAATTGG 
CTGCCCGCTC CCGAGGGCGA CTTCAATTTG ACCATGCGCT TCTACGGTCC TGAGACGACG 
GTTCTGGATG GCTCCTATCG GCTGCCGGCT GTCCGGAGCG TCGAATGA

Protein sequence

MSPDQSREEI AYAVGLQAYL WGFPLYYYSR STPKSVEVGG TFINDFRKYS ELKTAKDRFV 
VTPNNVTIDA YATLDLTVEP VVIFVPSLSQ PRWYIVQIGD SFDEIVRNIG GTKGAEPGVY 
IVTGPDFSGD VPGDMIQVKS RTKIGVAAVR ILANGEADLP NAVEAQKGFH LMPLSAYLRD 
GLAHKAADPR PQMRLFESDA PEGIRYFDEL GDAMTKRLPA SADSQDFLVS SFKQIGLSVG 
GGFQWKSLDE STKKGLERAI KTGEQIVDSK WAATGEITNG WKYTFAGGRA GYDPGLRAAL 
AKYEVGAQLS DHVIYPNTSV DDKGEPLNGS KRYVLHFDAG KLPPVSVFWN MAMYGSDMLF 
VENEFKRYSI GSTTDGLNKD ADGSLTILIQ KNKPADTANW LPAPEGDFNL TMRFYGPETT 
VLDGSYRLPA VRSVE