Gene Smed_1146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1146
Symbol
ID	5321992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1217427
End bp	1218404
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	62%
IMG OID	640790087
Product	TonB-system energizer ExbB type-1
Protein accession	YP_001326832
Protein GI	150396365
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0811] Biopolymer transport proteins
TIGRFAM ID	[TIGR02797] tonB-system energizer ExbB

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.200277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATC GGGTCCGGTC GAAATTGAAC CTGTTGCTGA CCGCAATGCT CACTGTCTTT 
CTTTTCGGTC CGGTTGGTGC CGGGCTTGCG CAGACCGCAC AACAGCCCAA TTCCGTTTCG 
GTCGACGCCC AGCCTGCGGC GCCGGACGTG TCGGGCGCCG ATGGACCGCT CCTGCAGGCG 
GGCGAGTCGG TCGAGGCAGC GACGGACGGC GCAACGGCGG AGGGAGCGAA CCCGGTGCTT 
CCGCACGATC TCTCGCCGGT TGGAATGTTT CTTGCCGCCG ATATCGTCGT TAAAGCGGTG 
ATGATCGCTC TTGCGCTTGC ATCCGTCGCA ACCTGGGCGA TCTTCATCGT CAAGACGCTG 
GAACTCGCCT ATGCCAAGTC GCGTCTCAAG CGCGCCGTAG CAAATCTCGT TTCGGCAAAT 
GGCCTGGCCG AGGTTCATTC CAAGCTCGAG CGCCGCTCCG GCGTCGCCGG AAACATGGTC 
ACTGCGGCGA TCGACGAAAT GACACGCTCC GAGGCCGTTC TGGATCTTAC GCCGTCAGCC 
GGGGTGAAGG AACGCGTCTC TTCGCTGCTT ACGCGTATAG AGGTTCGCGC CGGCAAGAGG 
ATGAGCGCCG GTACCGGGAT TTTGGCCTCC ATCGGGTCCG TCGGACCGTT CGTTGGCCTC 
TTCGGTACCG TCTGGGGTAT CATGAATTCC TTCATAGGCA TCAGCAAGGC GCAGACAACC 
AACCTCGCCA TTGTTGCGCC GGGTATTGCA GAGGCGCTGC TGGCGACGGC AATAGGACTC 
GTCGCGGCGA TACCTGCGGT GGTGATCTAC AATTACTTCG CCCGGTCGGT CGGGGGCTAC 
AAGCTCATCC TTGCGGATGC GGGAGCAGCC GTTGAGAGGT TGGTAAGCCG CGATCTGGAT 
CATCGTCACG CCCGCAAAGC GTCGCGCCGC CAGGACAGCT TCACCCACGG CCCAGACGCT 
ATCGCCAGAA TCGGATAA

Protein sequence

MSDRVRSKLN LLLTAMLTVF LFGPVGAGLA QTAQQPNSVS VDAQPAAPDV SGADGPLLQA 
GESVEAATDG ATAEGANPVL PHDLSPVGMF LAADIVVKAV MIALALASVA TWAIFIVKTL 
ELAYAKSRLK RAVANLVSAN GLAEVHSKLE RRSGVAGNMV TAAIDEMTRS EAVLDLTPSA 
GVKERVSSLL TRIEVRAGKR MSAGTGILAS IGSVGPFVGL FGTVWGIMNS FIGISKAQTT 
NLAIVAPGIA EALLATAIGL VAAIPAVVIY NYFARSVGGY KLILADAGAA VERLVSRDLD 
HRHARKASRR QDSFTHGPDA IARIG