Gene Smed_5166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5166
Symbol
ID	5319468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	118245
End bp	119180
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	62%
IMG OID	640776944
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001313876
Protein GI	150377281
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.627946
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCGCT TCACCCTGCG CCGCACCTTG CAGATCATAC CCACGGTCGT CGTCGTGGCG 
ATGCTCATCT TCGTTATCTT CAGCGTCGTG CCCGGCACCT TCGCCGCAAG CCTCTTCGCT 
GACGGCAAGC GTGCCGCCGA CCCGCAGATG ATCGCCCGCC TCAACGAGGA ATTCGGGCTG 
AACAAGCCGC TGATGGAGCG CTTCGCGACC TATGTCACGG ACCTTGCGCA ATTTGATCTC 
GGCACCAGCT TCCGCACCCG TCAACCGGTA ATAGACCTCA TCAACGACCG CATATGGGCG 
TCGCTGCAGC TGGCGATCGC CGCCATGGCC TTTGCCCTCG TCGTCGGTGT GCCCCTCGGT 
TTCCTTGCAG CGCTGAGGCC GGGGTCGGTG CTCGACACGG TGACGATGAT CGGAGCCGTG 
TCGGGCCTCT CAATGCCGCA GTTCTGGCTG GGTCTCCTGA TGATGTATAT CTTCGCCCTG 
CAGCTGAACT GGCTGCCGAG CTTCGGCTAT GGCGACGGGT CCTTCCGGAA CCTGATCCTG 
CCCGCCGTCA CACTCGGCGT CACGCCGCTT GCGCTTCTCG CCCGCACCAC GCGGGCCGGT 
GTTCTCGATG TGCTGAACGC CGACTTCATC CGCACCGCCC ATTCAAAAGG CATGAGCGAG 
GCCAAGGTGG TTCGTTGGCA CGTGGCGCGC AACGCGCTGG TGCTGATCGT CACGACACTC 
GGCCTGCAAT TCGGCTCGCT GATCGGCCAG GCGGTCGTCA TAGAAAAACT CTTCGCCTGG 
CCCGGTATCG GCTCGCTTCT GGTGGACAGC GTCGCAAGCC GCGACATTCC CGTGGTGCAG 
GGGACCATCC TCATTATCGT GCTCTGGTTC CTCGTCATCA ACACGGCGGT CGATCTGATC 
TATGCCGCGA TCGATCCGCG TATCAAGCAG GAGTGA

Protein sequence

MLRFTLRRTL QIIPTVVVVA MLIFVIFSVV PGTFAASLFA DGKRAADPQM IARLNEEFGL 
NKPLMERFAT YVTDLAQFDL GTSFRTRQPV IDLINDRIWA SLQLAIAAMA FALVVGVPLG 
FLAALRPGSV LDTVTMIGAV SGLSMPQFWL GLLMMYIFAL QLNWLPSFGY GDGSFRNLIL 
PAVTLGVTPL ALLARTTRAG VLDVLNADFI RTAHSKGMSE AKVVRWHVAR NALVLIVTTL 
GLQFGSLIGQ AVVIEKLFAW PGIGSLLVDS VASRDIPVVQ GTILIIVLWF LVINTAVDLI 
YAAIDPRIKQ E