Gene Smed_4687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4687
Symbol
ID	5319329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1203272
End bp	1204402
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	62%
IMG OID	640776485
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001313417
Protein GI	150376821
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.161422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.279284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGATA TTGCTCAGAT CCCGGCATCG GCGCCCGAAA CCAGGGGGCG CAGCCTGTTT 
CAGCTCGCGG CGCTGCGTTT CCGCCGGAAC CGCCCCGCCA TGGCGGGCTG CGTCATGCTG 
GTTCTCATCG GCCTCTTTTC CTTCGTAGGG CCGCTTTTTT CTCCCCATAG CTACGATCAG 
GTGTTTCCGT CCTATGTCAC GATCGGGCCA AGCCTCGAGC CGCGACCGGA TAGTTCGACG 
CTTCAGGACG TGATGGAAGG CGTGGCGTCC CGTGCCCGCG TCAGGCTGAC GGAATTCGCC 
GTCGAGGATC AGAGCTTCAC CGCCACGGTC ACGTCGGATG CGCCGATCGA TCCCCGCGCC 
ACGCGCTATT TCGACCGGGC GAACGAGTTC GAGAACACCA AGGTGGTCGC AACGGAGGGC 
GATGGCCGAA CGCTGAAGGT CGAGGGCGAC GTGGCTCGCG AATATTTCCC CTTCGGTACC 
GATTCAAACG GCCGCGATCT GCTTGTCCGG GTCATGCTGG GCGGGCAGAT CTCCATCGCC 
GTCGGCCTGC TGGCGAGCCT CGTTTCACTC GGCATCGGTG TGCTTTACGG CGCGACTTCC 
GGCTATATCG GCGGGCGCGT CGACAACGTC ATGATGCGTT TCGTCGAGAT TCTCTATTCG 
CTGCCCTTCG TCTTCCTCGT CGTGGTGCTC GTCGTCTTCT TCGGCCGCAG CTTCATCCTG 
ATCTTCCTGG TAATCGGTGC AGTCGAGTGG CTGGACATGG CACGCATCGT CCGCGGCCAG 
ACGCTGGCCC TCAAACGCCG TGAGTTCGTT GGTGCAGCAC AGGCGCTGGG TCTGACCGAC 
TGGCAGATCA TCCGCCGGCA CATCATCCCC AACACGATCG GGCCGGTCAT CGTCTTCGTC 
ACCGTCGTCG TGCCGAAGGT CATTCTGCTG GAGAGCTTCC TGTCATTCCT CGGGCTGGGT 
GTCCAGGCGC CGCTCACGAG TTGGGGCGCG TTGATCTCGG AGGGTGCGAA CAACATTCAG 
TCGGCTCCCT GGCTGCTTAT TTTCCCCGCC ATCTTCTTCG TCCTGACGTT GTTTTCGCTG 
AACTTTGTCG GCGACGGCCT GCGCGACGCA CTTGACCCGA AGGACCGCTG A

Protein sequence

MTDIAQIPAS APETRGRSLF QLAALRFRRN RPAMAGCVML VLIGLFSFVG PLFSPHSYDQ 
VFPSYVTIGP SLEPRPDSST LQDVMEGVAS RARVRLTEFA VEDQSFTATV TSDAPIDPRA 
TRYFDRANEF ENTKVVATEG DGRTLKVEGD VAREYFPFGT DSNGRDLLVR VMLGGQISIA 
VGLLASLVSL GIGVLYGATS GYIGGRVDNV MMRFVEILYS LPFVFLVVVL VVFFGRSFIL 
IFLVIGAVEW LDMARIVRGQ TLALKRREFV GAAQALGLTD WQIIRRHIIP NTIGPVIVFV 
TVVVPKVILL ESFLSFLGLG VQAPLTSWGA LISEGANNIQ SAPWLLIFPA IFFVLTLFSL 
NFVGDGLRDA LDPKDR