Gene Smed_4301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4301
Symbol
ID	5319305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	794438
End bp	795523
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	65%
IMG OID	640776106
Product	TPR repeat-containing protein
Protein accession	YP_001313039
Protein GI	150376443
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.406426
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.198903
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTTG CCGGCAGGAC ATTCGGTATC ATAGGCGCGC TCGCCGCTTT TCCGCGGCGG 
CTCGCGGCGC GTGAGGTCGA GCGCCAGGGC GGGCACCTCA GGCGCGGCGT CGCGCGCCAG 
ACGAACTACG TGGTCTTCGG GCGGGGGCTG CTCTCCAGAG CAACAGAGGC GGAGATCGAA 
AAGCGCTTCG ACGGCGAGAG CGGAGCGCAT GGGCGCGTTC TCAGCGAAAA CGGCTTCCTG 
CGCCTGCTGG GGCTGGCGCG CGCGGCGGAA ACATCGGCGC TGGCACGACA GTCGCTCATC 
GACCAGTCCG GAATTTCCCC TCGCCACCTC GATCTTCTAT CGCTGTTCGA CGCCTTCGAG 
CATGATGGCG AACCATATTC TTTCCGTGAC CTGATCCTCG CCCGGAAATA TGCGGGGCTG 
ACGGCCAGCG GCGCCGGATG GAGCGCGATC GCGCGATCGG TTCACCGCTC CGGAAATGTC 
GCATCCCTCA CCGCACTCTC CCTGCAACAT GAAGGAAACG ATACGATCTA TGCGCGACGC 
GCCGAGGGCT TGAGCGAGCT CGACGGCCAG ATGCTGCTCG ATGTCGGCTC TCCGGACGAG 
GAGGCGCTCG AAGACCTTTT CGCGCTGGCC GAAGCGGCCG AGGAAGCGGG AGACTACGAT 
GAGGCGGCCG CATTCTACCA GCGCTACCTC GCCATCGACC GCACCGACTC CGTCGCTTCC 
TTCAATCGTG CCAACTGCCT CAGGGCCGCC GGACAGGAGG CGGAAGCGGC GCACGACTAT 
GCCCGCGCCA TCAAGCTCGA TCCTTCCTTC GTCGAGGCAT GGTTCAACCT TGCGGGGCTG 
ATGGAGGAAC GCGGCCGCAG GGACACGGCC AGACGGCATC TCACGAAAGC GATCGAGCTC 
GACGGCGGTT ATGCCGATGC GGTCTTCAAC CTGGCGAAGC TGGAGTTCGA TGCGGGCAAT 
CTCACCGAGG CGCGCCGCTG GTGGATGCGC TACCTCGAAC TCGATCAGGA TTCCGAATGG 
GCGCGCAAGG CCGAACGCGG CGTGCAATTC GTGAACCTTC AACTCCTCTC CAGAACGGCA 
GGGTAA

Protein sequence

MAVAGRTFGI IGALAAFPRR LAAREVERQG GHLRRGVARQ TNYVVFGRGL LSRATEAEIE 
KRFDGESGAH GRVLSENGFL RLLGLARAAE TSALARQSLI DQSGISPRHL DLLSLFDAFE 
HDGEPYSFRD LILARKYAGL TASGAGWSAI ARSVHRSGNV ASLTALSLQH EGNDTIYARR 
AEGLSELDGQ MLLDVGSPDE EALEDLFALA EAAEEAGDYD EAAAFYQRYL AIDRTDSVAS 
FNRANCLRAA GQEAEAAHDY ARAIKLDPSF VEAWFNLAGL MEERGRRDTA RRHLTKAIEL 
DGGYADAVFN LAKLEFDAGN LTEARRWWMR YLELDQDSEW ARKAERGVQF VNLQLLSRTA 
G