Gene Smed_4509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4509
Symbol
ID	5318072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	992444
End bp	993622
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	67%
IMG OID	640776310
Product	hypothetical protein
Protein accession	YP_001313242
Protein GI	150376646
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.530694
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAGCG GTCTGGCGGC CACCGCGATC GCCGGCGCGA TAGCCATGGC GGTCGCCATG 
GGCTTCGGCC GGTTCTCCTA CACCCCTATC CTGCCGGCGA TGATGGCCGA CACCGGGATT 
TCTCCGGGGG ATGCCGGGCT GATCGCCGCC GCGAATTTCA TTGGCTATCT CGCGGGCGCG 
GTGCTCGCCG GCTATGGTTG GGCGCACGGC CGCGAACGCG GGCTCGGCCT TGCGGCTCTG 
GTCTCGACCA CCCTGCTGCT CGCCGCGATG GGGCTTACAT CGTCCGTTAT CGCCTTTTGC 
ATCATCCGCT TTCTGGCAGG CCTGGCGAGC GCCTTTGCGA TGATCTTCAT CTCGGGAATA 
GTGCTGGGGC AGGGGCTCGC CGCACGATCC GAACACGTGC CTTCAGTGCA TTTCGGCGGC 
GTCGGTTTCG GCATCGCACT CTCATCGATC GTGGTCTGGG TCGCGCCCCT CGCAGGCGCC 
GCGGGTATTT CTGCGTCGCA AGCCGACTGG TTCGCGGGCG GACTTGTCGC GTTGGTGGGC 
GCTGTCGCGG TGGCCGCGCT GCTGCCAGCG AGCCGCCATG CCAAAAGCGG CGGCCGACCG 
GAGGCGCGCC TTGTCGCGAC GCGGCCTCTC ATAGCCGTGA CGCTCACCTA TGGCTTTTTC 
GGTTTCGGCT ACGTGATCAC GGCGACCTTT CTCGTCGCCA TGGCCCGGGA TGCAAGCGGT 
GGCCACAGCG TCGAGTTCCT CGCCTGGCTG ATCACCGGTA TCAGCGCGGC GCTTTCGATT 
TATCTCTGGC GTTTCGCCGT TCCGCATTTC GGGCTCGCCG GTGTCTATGC GGCCGGCCTG 
CTGGTCGAGG CGGCCGGTCT CGTGCTGACG GTTTCCCTGC CTTCGCCCTA CGCGCCGCTT 
GTCGGCGGGC TGATGCTCGG TGCTACCTTC ATGATGATCA CGGCCTACGG CCTGCAGATG 
GGCCGGCAGC TCGCCCCCGA AAGCCCGCGC CGCGCGCTCG CCTTCATGAC AGCCGCCTTC 
GGACTCGGCC AGATCGTCGG GCCGCTCGTC GCGGGATGGC TTGCGGACCG GACCGGAAGC 
TACGCTTTGC CGACCTTGGT CGCAGCTGTC GTTCTGTTGA TCTGTGGAAT CGTCGTTCTC 
GCCGAACTGC GCAGGATAAA TGCCGCCCTG GCGCAATGA

Protein sequence

MPSGLAATAI AGAIAMAVAM GFGRFSYTPI LPAMMADTGI SPGDAGLIAA ANFIGYLAGA 
VLAGYGWAHG RERGLGLAAL VSTTLLLAAM GLTSSVIAFC IIRFLAGLAS AFAMIFISGI 
VLGQGLAARS EHVPSVHFGG VGFGIALSSI VVWVAPLAGA AGISASQADW FAGGLVALVG 
AVAVAALLPA SRHAKSGGRP EARLVATRPL IAVTLTYGFF GFGYVITATF LVAMARDASG 
GHSVEFLAWL ITGISAALSI YLWRFAVPHF GLAGVYAAGL LVEAAGLVLT VSLPSPYAPL 
VGGLMLGATF MMITAYGLQM GRQLAPESPR RALAFMTAAF GLGQIVGPLV AGWLADRTGS 
YALPTLVAAV VLLICGIVVL AELRRINAAL AQ