Gene Smed_5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5038
Symbol
ID	5319087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1558248
End bp	1559225
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	62%
IMG OID	640776819
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001313751
Protein GI	150377155
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.642958
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.861569
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTGA TTTCTGTTGT CCTCGGCAGG CTGTCGCAAG CCTTCCTGCT CCTCATCGCC 
ATGTCGCTGA TCGGCTTCAT TGGCGTCCAC AGCGTCGGCA ATCCGGTCTT CAATGTCGTC 
AACATCGAAA CCGCCACGCC GGAGGATATC CGCCAGGCCA CGATCGCGCT CGGCCTCGAT 
CAGCCGATCT GGCGCCAGTA CCTGCTTTTC ATCAACAATG TCGTGCGCGG AAACTTCGGC 
ACCTCATATA TCTATCATCT GCCGGCCTTC GCGCTGGTCA TGAGCAAGCT GCCGGCGACC 
CTGGAGCTCG CATGCGTCGC CATGCTTATC GCGGCGCCGG TTGGAACCGG CCTCGGGCTG 
CTCGCCGGCC GGCGGAGCGG CACGATCTTC GACCGGACGG TCCTCAGATC GAGCGTCTTC 
GCGCTGAGTA TCCCGTCATT CTGGCTGAGC ATGATGCTCA TCCTGCTCGG CGCCATCCTG 
ACAGGCTGGT TTCCATCCGG CGGCCGCGGC ACGACGGCGC GGTTCCTTGG CCAGGAGTGG 
AGTTTTCTGA CCGGGAACGG GCTCTGGCAC ATGGTCCTTC CTGCCCTGGC GCTGGCGATA 
CCGAACGTCG CCTTGATCGC GCGGCTTTCG CGATCGGGCA CGATCGAAGT CGAGAACCTG 
GACTTCACGC GGTTTTGTCG CGCGAAAGGG CTGTCCTCCC GAAGGATCCT GCTTCGCCAC 
ACGCTTCCAA ACATCAGCGT GCCGATCGTG ACAATCATCG GCCTGCAATT TGGCGGCATG 
CTCGCTTTTG CCGTGGTCGT GGAAACGATC TTCTCGTGGC CGGGCGTCGG CAAACTTCTG 
ATCGACTCCA TCCAGCTCCT CGACCGGCCA GTGGTGATGG CGACGCTGAC CTTCATTGCC 
GTCGCCTTCG TCGCGCTGAA TGCCCTCGTC GACTTGTTCT ATGCCGTGCT CGACCCGCGC 
GTGCGCCTGT CTTCATGA

Protein sequence

MPLISVVLGR LSQAFLLLIA MSLIGFIGVH SVGNPVFNVV NIETATPEDI RQATIALGLD 
QPIWRQYLLF INNVVRGNFG TSYIYHLPAF ALVMSKLPAT LELACVAMLI AAPVGTGLGL 
LAGRRSGTIF DRTVLRSSVF ALSIPSFWLS MMLILLGAIL TGWFPSGGRG TTARFLGQEW 
SFLTGNGLWH MVLPALALAI PNVALIARLS RSGTIEVENL DFTRFCRAKG LSSRRILLRH 
TLPNISVPIV TIIGLQFGGM LAFAVVVETI FSWPGVGKLL IDSIQLLDRP VVMATLTFIA 
VAFVALNALV DLFYAVLDPR VRLSS