Gene Smed_5065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5065
Symbol
ID	5319367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	11416
End bp	12384
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	65%
IMG OID	640776845
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001313777
Protein GI	150377182
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCCT CCGATTTCAC GGCGTCACTC ACGCCACCCA TCCCTGCCAC CACGAGCGCG 
CCACGCAGCG CGATCTCGGA ACTCCTGCAC GACAAGGCCG CCGCCATCGG CCTTGCCTTC 
ATCCTACTCA TTGTGTTCCT GGCCCTGTTC GCTCCCCTTG TCGCACCGTA CGATCCGGCC 
GCGCAGTCGA TCATGGCCCG GCTGAAGCCG CCCGTCTGGA TGGCGCGCGG CACGTGGGAA 
CACCTGCTCG GAACTGATAA TCTCGGCCGC GACGTCCTGT CCCGCATCAT CTGGGGCGCA 
AGGGCGACGC TGACGATCGG CGCCGTCACC TGTCTTCTGG CGGCGACGCT CGGGACAGTC 
GTCGGCCTAT GGGCCGGATT CATCGGTGGG CGCACGGATT CGGTCCTGAT GCGTCTGGTC 
GACATCCAGG TCAGCTTCCC CGGAATCCTT CTCATCCTGC TCGTCGTCGC GGTTCTCGGG 
CCCGGCGTCT GGACGCTTGT TGCGGTCCTG TCGGTGACGA ACTGGATGGT CTATGCCCGG 
CTGGTGCGCG GCATTGTCTC GTCGACCCGT CAGACCCCTT ATGTCGAGGC CGCTGAAGTG 
ATCGGCTGTC GCCCCGCACG GGTGATCTTC AGGCATATCC TGCCGAACAT CGTCTCTCCG 
CTTTTGACGC TTGCGATCCT GGAGTTCACC AATATCGTGC TGGCGGAAGC GGCTGTGTCG 
TTCCTCGGCT TCGGCGTTCA GCCACCGGCG ACCTCGTGGG GCCTCGACGT CGCCTCGGGA 
CGCGATTACC TGTTCATCGC GTGGTGGCTC GTGACTTTTC CCGGCCTTGC GATCGTCGTG 
ACAGTGCTGT CCATCAATCT TTTTGCCAAC TGGCTGAGGG TGACGACCGA TCCCGAGGAA 
CGCGAGAAGC GTTTTGCGCG CGCCGAGACG GCGAAGCGGC GCCGCGCCCG GCGGAGGGTG 
GGTGCATGA

Protein sequence

MAASDFTASL TPPIPATTSA PRSAISELLH DKAAAIGLAF ILLIVFLALF APLVAPYDPA 
AQSIMARLKP PVWMARGTWE HLLGTDNLGR DVLSRIIWGA RATLTIGAVT CLLAATLGTV 
VGLWAGFIGG RTDSVLMRLV DIQVSFPGIL LILLVVAVLG PGVWTLVAVL SVTNWMVYAR 
LVRGIVSSTR QTPYVEAAEV IGCRPARVIF RHILPNIVSP LLTLAILEFT NIVLAEAAVS 
FLGFGVQPPA TSWGLDVASG RDYLFIAWWL VTFPGLAIVV TVLSINLFAN WLRVTTDPEE 
REKRFARAET AKRRRARRRV GA