Gene Smed_5198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5198
Symbol
ID	5319500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	156791
End bp	158116
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	60%
IMG OID	640776976
Product	amino acid permease-associated region
Protein accession	YP_001313908
Protein GI	150377313
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.043341
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCAC CGTCAAGTGG CAAGAGCCTG GGTCTGGCCG CCTGTACCGC CATCGTCGTC 
GGTAACATGG TTGGCTCCGG CTTCTACCTC TCGCCGGCGG CAGTTGCTCC CTACGGCAAT 
CTCGCTATCG TCATCTGGAT CGTGATGGGA GCGGGTGCGA TCTGTCTCGG GCTGACGTTC 
GCACGACTCG CCAAGCTCTC CCCGGCGGTC GGAGGGCCTT ATGCATATAC GCGCATAGCC 
TATGGAGACT TCCCGGGATT TCTTATCGCT TGGGGATATT GGATTTCCAT CTGGGCGTCG 
CTGCCCGTTA TCGCAGTGGC GTTCGCCGGC GTGGTCATCG ATTTTTTTCC GATCCTCCGC 
GGGCGCGGAA CGGCGACGCT GCTCACGTTG AGCGTGATCT GGCTTGTCGT GCTCGTCAAC 
TTACGCGGCG TCCACGCGGC AGGGCTCTTC TCCGAAATCA CCACCTACGC TAAGATGATC 
CCGTTCGGGG CCGTCGCGCT GCTGGGCCTG TTTTACATCG ACTTCTCCCA CTTCGCCGAC 
TTCAATCCGA GCGGCCAGCC GCTCCTTCAG GCGAGCGCTG CGTTGGCGCC GCTCACCATG 
TTCGCCTATC TGGGGCTTGA ATCTGCCACG GTGCCCGCTG GCGATGTGCG CGACGCCGAA 
CGTACGATCC CGCGTTCAAC GGTGCTTGGA ATCTCCATTG CTGTAACGCT GTACGTTCTC 
GGCACCATTG TCGTTATGGG GTTGGTGCCG AGAGAGGAGC TCGTCCACTC GGTGGCACCT 
TTCTCCGAGG CAGCAAGGAG AATGTGGGGA CCGGCCGGTG AACTAGCGAT TTCCCTGGCA 
GTTGTCCTGT CGTCGATCGG AGCGCTGAAC GGCTGGACCT TGCTGATGGG TCAGGTGCCA 
ATGGCGGCGG CGCGAGACGG ATTGTTTCCA CCGCTGTTCA GCCGGCTCTC GGCGCGAAGT 
GTGCCCGCCA CGGGGATTGT CGTTTCGGCG ACTCTGGCGA CAATTCTCGT GCTCGTTCAG 
GCAGCCGGTT CCGAGGGCTT CTCATCCATT TATCGGCTAT TCGTCGGCTT GAGCACAATG 
ACGGCCGTTA TACCTTATGC GTTCTGCGCT CTTGCCAGCA GTCTGGTCTC AGCACGGGTT 
AGCGGAGGGA CTGTAATACC GCGTGTAACC CTTATCGAGC TTGTTGGTTT CGCTTTTGCA 
ATGTTCACGC TTTACGGCTG TGGTGCGGAG CCTGTCCTCT ATGGACTGAT GCTGCTGTTG 
CTGAGCATCC CCGTTTACAT ATGGCAGCGA CGTCGGAGCT TCGTGCCGGG TGATTTCGGC 
CAATGA

Protein sequence

MSAPSSGKSL GLAACTAIVV GNMVGSGFYL SPAAVAPYGN LAIVIWIVMG AGAICLGLTF 
ARLAKLSPAV GGPYAYTRIA YGDFPGFLIA WGYWISIWAS LPVIAVAFAG VVIDFFPILR 
GRGTATLLTL SVIWLVVLVN LRGVHAAGLF SEITTYAKMI PFGAVALLGL FYIDFSHFAD 
FNPSGQPLLQ ASAALAPLTM FAYLGLESAT VPAGDVRDAE RTIPRSTVLG ISIAVTLYVL 
GTIVVMGLVP REELVHSVAP FSEAARRMWG PAGELAISLA VVLSSIGALN GWTLLMGQVP 
MAAARDGLFP PLFSRLSARS VPATGIVVSA TLATILVLVQ AAGSEGFSSI YRLFVGLSTM 
TAVIPYAFCA LASSLVSARV SGGTVIPRVT LIELVGFAFA MFTLYGCGAE PVLYGLMLLL 
LSIPVYIWQR RRSFVPGDFG Q