Gene Smed_1948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1948
Symbol
ID	5322807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2002028
End bp	2003008
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	63%
IMG OID	640790886
Product	extracellular solute-binding protein
Protein accession	YP_001327617
Protein GI	150397150
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.113804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.383853
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGC TTCTCCCTGC CGTCGCCGCA GCGCTCGTCG CCGGCCTCCT GTCCACTGCC 
GCTCTCGCCG AAAGCCTCGT GCTTTATACC AGTCAGCCGA ACGAGGACGC GCAGGCGACG 
GTGGATGCAT TCGAGGCGGC CAACCCCGGC GTCGAGGTGG AATGGGTGCG GGAGGGAACA 
ACAAAAATCA TGGCTAAGCT GATGGCCGAG ATCGAGGCGG GCAACCCCGT GGCGGATGTG 
CTTCTGATCG CCGATACGGT GACGATGCAG CGGTTGAAGG AGGCGGGCCA GCTGATGCCT 
TACAAATCTC CGGAAGCCTC AGCTTTCGAG GCCTCTCTCT TCGACCCGGA CGGCACCTAT 
TATTCGACGA AGATGATCAC CACCGGGATC ATCTACAACA CTTCCGCCGC GATGAAGCCG 
GCCGGCTGGG AGGATCTTGC GAAACCCGAG GCCAAGGGGC TCGTCACCAT GCCCAGCCCG 
CTCACGTCAG GCGCGGCGCT GATCCATGCC CAGACGCTTG CCGGCATCGG TGCGCTCGGT 
TGGGACTACT ACGAGGCGCT CGCGGAAAAC GGCGCGACGG CCGCCGGCGG CAATGGCGGC 
GTGTTGAAGT CCGTCGCAAC GGGCGAGAAG GCCTATGGGA TGGTGGTGGA TTTCATGGCG 
ATCCGCGAGA AGGCAAAGGG CGCGCCGGTG GAGTTCGTCT TTCCGGCGGA GGGCGTTTCG 
GCCGTTACCG AGCCGGTCGC CATCCTGAGA ACCGCAAAAA ACCCGGATGC AGCAAAGAAA 
TTCGTCGATT TCCTCCTTTC GGAAGAGGGG CAGCAGGTGG CAGTGACGAT GGGCTACATT 
CCGGCCCGCA ACGGGCTTGC CTTGCCCGAG GGATTTCCCG CCCGCGAGGT TGTTAAGGTG 
CTGCCGGTCG ACGCCGCCGC AGCCGTGAAG AATTCCGACG CGGATCTGAA AACCTTCTCG 
GGGATTTTCG GCACCAACTG A

Protein sequence

MKTLLPAVAA ALVAGLLSTA ALAESLVLYT SQPNEDAQAT VDAFEAANPG VEVEWVREGT 
TKIMAKLMAE IEAGNPVADV LLIADTVTMQ RLKEAGQLMP YKSPEASAFE ASLFDPDGTY 
YSTKMITTGI IYNTSAAMKP AGWEDLAKPE AKGLVTMPSP LTSGAALIHA QTLAGIGALG 
WDYYEALAEN GATAAGGNGG VLKSVATGEK AYGMVVDFMA IREKAKGAPV EFVFPAEGVS 
AVTEPVAILR TAKNPDAAKK FVDFLLSEEG QQVAVTMGYI PARNGLALPE GFPAREVVKV 
LPVDAAAAVK NSDADLKTFS GIFGTN