Gene Smed_0538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0538
Symbol
ID	5321372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	581506
End bp	582612
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	64%
IMG OID	640789472
Product	extracellular ligand-binding receptor
Protein accession	YP_001326229
Protein GI	150395762
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0513259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.872247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTAT CATTATTGAG GGGAATGACC TTGGCCGCCG GCGTCGCTTT CGCGCCGCTC 
GCCCACGCCG ACATCACCAT CGGCGTCATC ACGCCGCTCA CCGGTCCCGT TGCGGCCTTT 
GGCGAGCAGG TCAAGAACGG CGCCGAGGCG GCAGTCGAAG CGATCAACAG CGCCGGCGGC 
GTCAATGGGG AGAAGCTCGT CCTCAAGATC GTCGACGACG CGGGTGAACC CAAGCAGGCC 
GTTTCCGTCG CCAACCAGCT GGCGGGCGAA GGCGTACGAT ACGTCGTCGG TCCGGTGCTC 
TCCGGTACGT CGATGCCGGC ATCCGACGTA CTGGCGGAAA ACGGAATCCT CATGGTCACG 
CCGACGGCGA CCACGCCCGA CCTTACCACC CGTGGTCTGT GGAACGTGCT GCGCACTTGC 
GGACGCGACG ATCAGCAGGC GGTCGTCGCC GCCGATTACG TCGTCAAGAA CTTCAAGGAC 
AAGCGCGTCG CGGTGCTGCA CGACAAGGGC GCCTATGGCA AGGGCCTTGC CGACGGCTTC 
AAAGCTGCGA TCAACGCAGG CGGCATTACC GAGGCGGTCT ATGAAGGCCT GACGCCGGGC 
GAGAAGGATT TCGGGGCGAT CGTCACCCGC CTGAAGGCCG AGAAAGTCGA CGTCGTCTAT 
TTCGGCGGCT ACCATGCAGA AGGCGGGCTG CTCGCTCGTC AGATGCATGA CCAGGGTGTC 
AAGGCACAAC TCCTCGGCGG TGACGGCCTG TCCAACACCG AGTACTGGGC AATCGGCGGC 
GAAGCCGCAA CCGGCACCAT CTACACCAAT GCAAGCGATG CCACGCGCAA CCCGGCCGCC 
GCACCGGTAA TCGAGGCTCT CAAGGCCAAG AACATTCCGG CGGAAGCTTT CACGCTCAAC 
GCCTATGCCG CCGTTCAGGT CCTCAAGGCA GGCATCGAGA AGGCCGGTTC GACCGAAGAT 
GCGACCGCGG TGGCCACCGC CATAAAGTCC GGCGAGGCCA TCGACACCGT CATCGGAAAG 
CTGACCTATG GCGAAAGCGG CGATCTCACC TCGCCGAGCT TCTCGCTCTA CAAGTGGGAA 
GGCGGACAGA GCGTCGCGGT CGAATAA

Protein sequence

MRLSLLRGMT LAAGVAFAPL AHADITIGVI TPLTGPVAAF GEQVKNGAEA AVEAINSAGG 
VNGEKLVLKI VDDAGEPKQA VSVANQLAGE GVRYVVGPVL SGTSMPASDV LAENGILMVT 
PTATTPDLTT RGLWNVLRTC GRDDQQAVVA ADYVVKNFKD KRVAVLHDKG AYGKGLADGF 
KAAINAGGIT EAVYEGLTPG EKDFGAIVTR LKAEKVDVVY FGGYHAEGGL LARQMHDQGV 
KAQLLGGDGL SNTEYWAIGG EAATGTIYTN ASDATRNPAA APVIEALKAK NIPAEAFTLN 
AYAAVQVLKA GIEKAGSTED ATAVATAIKS GEAIDTVIGK LTYGESGDLT SPSFSLYKWE 
GGQSVAVE