Gene Smed_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2100
Symbol
ID	5322960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2161142
End bp	2162272
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	61%
IMG OID	640791038
Product	polar amino acid ABC transporter, inner membrane subunit
Protein accession	YP_001327768
Protein GI	150397301
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0765] ABC-type amino acid transport system, permease component
TIGRFAM ID	[TIGR01726] amine acid ABC transporter, permease protein, 3-TM region, His/Glu/Gln/Arg/opine family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.197652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCCA GATTCCTGAA ATGGTCGCGG CACAATCTGT TCGGCAAGCC GTTCGACATT 
CTGCTGTCTC TCACCGTCAT ACCCGGCTTT CTCTGGCTGG CCTACCAGGT CGCGGCCTGG 
ACGGTTACGA CGGCGCGATG GGAGATCATC CCCGAGAGCC TGCGGATCCT GATGATCGGC 
ATTTTCCCGG CCGAGCAGGC ATGGCGCGCC TGGGTCGCGA TCATGATCAT CGCCGCCCTC 
CTCGGCGCGG CGCTGGGATG CGTGTTCGCC TTCAGGAAGC GCCACGCGGC TGGCTTGCTC 
TTGGTGCTGG CTGCCGTCAT CGCGCTTACG GGTTCAAAAG ACCTGACGAA TGCGCTCCTT 
ACCGCCTCGA CCATTGCGAT CTTTGCGAGC GGCTGCGCGG CAATCTCGCT TATCCCCTTG 
CTTCGCAGAG CATTGTTGCC GGCTGGCTTC ATTGCGCTGA TCGCAATCTT CGCCGTCATG 
TCGCCGCCCG GCGCCGGCCT TTGGGGTGGC CTGCTCCTGA GCATTCTGCT GACGCTCGTG 
ACATCGATTG TCTCGCTTCC GGTCGGAATC CTGCTCGCCT TTGGCCGCCG CAGCCGTTTC 
TCGAGCATGC GGTGGATCTG TATGGGCTAT ATCGAGGTGA TGCGGTCCGT GCCATTGATC 
ATGGTCGTCT ACTGGATCTG GATTCTGATG CCAGTCCTGG CGCCGCAATT CGGCCTCGCG 
GACGTCGTGC GCGGCATGAT CGGCTTCACC CTGTTCTATT CCGCCTATGT GGCCGAATAT 
GTCCGGAGCG GCCTGCAAGC CGTTCCCCGC GAACAGACCG AGGCGGCCCG CTCGCTCGGC 
ATGAGCGAGT TCGACATCAA CCGCTCGATC GTACTGCCGC AGGCCCTTCG CGTGGCGGTG 
CCGCCGCTTG TCGGCAATGT GCTCGATATT TTCAATACGG CGCCGCTGGT CTTCATCATC 
GGCCTGACGG ATTTTCTGCG CGCCGGTCAG ATGATCCTGG CCAATCCCCA ATATGGCGAC 
CGGACCTATG AGGTCTACGC CTTCCTGTTT CTCACCTATT TCCTTGTCGG ATCCCTGATA 
ACCTTCGTCG CGCGCAGGCT CGAAACGCAT CTTGCACGAG GCAATCGGTG A

Protein sequence

MIARFLKWSR HNLFGKPFDI LLSLTVIPGF LWLAYQVAAW TVTTARWEII PESLRILMIG 
IFPAEQAWRA WVAIMIIAAL LGAALGCVFA FRKRHAAGLL LVLAAVIALT GSKDLTNALL 
TASTIAIFAS GCAAISLIPL LRRALLPAGF IALIAIFAVM SPPGAGLWGG LLLSILLTLV 
TSIVSLPVGI LLAFGRRSRF SSMRWICMGY IEVMRSVPLI MVVYWIWILM PVLAPQFGLA 
DVVRGMIGFT LFYSAYVAEY VRSGLQAVPR EQTEAARSLG MSEFDINRSI VLPQALRVAV 
PPLVGNVLDI FNTAPLVFII GLTDFLRAGQ MILANPQYGD RTYEVYAFLF LTYFLVGSLI 
TFVARRLETH LARGNR