Gene Smed_5105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5105
Symbol
ID	5319407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	52317
End bp	53432
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	62%
IMG OID	640776883
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_001313815
Protein GI	150377220
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.116998
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGGC TCGAGAATCT GACGAAGCAT TACGGTCCGG CGCATGATCC TCTCATTGCC 
GTCGACAATG TAAGCCTTGA CTTACCGACT GGCGAAATCT GCGTCTTGCT CGGGCCGTCG 
GGCTGCGGCA AGACGACGAC GATGAAGATG ATCAACCGGC TGATCCAGCC CACCGGCGGC 
AAGGTCTTCA TCAACGGCAA GGACACGAGC ACAGTCGATC CGATCGAGCT CAGGCGGTCC 
ATCGGCTACG TGATCCAGCA GATCGGCCTC TTTCCGAACA AGACGATCGA GGAAAACATC 
TGCGTCGTGC CGGACCTGCT CGGCTGGGAC CGCCGCAAAT CTCGCGACCG TGCTAAAGAG 
CTCCTGGAGC TTGTGGGGCT TCAACCCGAC CTTTTCCTCA AGCGCTATCC GAAGGAACTT 
TCAGGCGGCC AGCAGCAGCG CGTCGGCGTT CTGCGCGCGC TGGCGGCCGA TCCGCCGGTC 
ATGCTGATGG ACGAGCCGTT CGGGGCAATC GATCCCATCA ACCGCGAGGT CATCCAGGAG 
GAATTCCTGA AGATGCAGCG GGAGATCCGG AAGACCATCA TCTTCGTCTC GCACGACCTC 
GACGAAGCGG TGAAGATGGC GGACAAGATC GCAATCTTCC GCAGCGGAAA ACTCGAACAA 
TATGCTGCCC CCGACGACCT GCTCGCGCGC CCCGCCAACA GCTTCATCGA AGATTTCCTT 
GGCTCGGACC GGGCACTCAA GCGGCTGAGG CTCGTCTCGG TGGGCGATGC CATGGAGACG 
GATTTCATAA CGGTCCTGGA GACGGATTCG GTCGAGCATG CGCGTGCGCG CATACGGTCG 
TCGCGCAGCG CCGCCGCCTT TGTGCTGGAC GCCGAAGGCG CACCCCGCTC CGTCCTGAGC 
GAGCAGGTGG CGGAGGCGTG CTCCGGCACC GTGGGAGACC ATGCGGAACC GGTAAAGTCC 
ACCGTGCCGC TCACCGGCGA TCTCCGGCAA GCGGTGTCGG TGATGTTCGC TCACGACATG 
CCGTTGCTGC CCTGCATCGA CGAGGCCGGG CGATTGGCGG GTGTGATGAG CTACCGCTCG 
ATCGTGCACC ATCTCGGCCA TGGAGGGAAG GCATGA

Protein sequence

MIRLENLTKH YGPAHDPLIA VDNVSLDLPT GEICVLLGPS GCGKTTTMKM INRLIQPTGG 
KVFINGKDTS TVDPIELRRS IGYVIQQIGL FPNKTIEENI CVVPDLLGWD RRKSRDRAKE 
LLELVGLQPD LFLKRYPKEL SGGQQQRVGV LRALAADPPV MLMDEPFGAI DPINREVIQE 
EFLKMQREIR KTIIFVSHDL DEAVKMADKI AIFRSGKLEQ YAAPDDLLAR PANSFIEDFL 
GSDRALKRLR LVSVGDAMET DFITVLETDS VEHARARIRS SRSAAAFVLD AEGAPRSVLS 
EQVAEACSGT VGDHAEPVKS TVPLTGDLRQ AVSVMFAHDM PLLPCIDEAG RLAGVMSYRS 
IVHHLGHGGK A