Gene Smed_3355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3355
Symbol
ID	5324239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3554032
End bp	3555498
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	63%
IMG OID	640792306
Product	type II secretion system protein E
Protein accession	YP_001329011
Protein GI	150398544
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGGCA AACGCGGAAA TGAAGGTCCT GGCAAGGGTG GTGCACGCGG TTTCACACCT 
GCGCCTTCAA TACCCGCGGT CGAGCTGGCG GTTGTCGAGC GTCCCTCGGC CCCTGATTAT 
GGAGAGCCGG CCGCTCCGCC ATCCCGGCCG CAGGCGGCAG CGCCCCCTCA GCGCCGGCGC 
CCGGCGCGGG CAGAGGATTA CTACGACACG AAATCGCAGG TCTTCTCCGC GCTGATCGAC 
ACGATCGACC TGTCGCAGCT CTCCAAGCTC GATATCGAGA GCGCGCGCGA GGAAATTCGC 
GACATCGTCA ACGACATCAT CACCATCAAG AATTTCGCGA TGTCGATCTC GGAGCAGGAG 
GAACTGCTCG ACGACATCTG CAACGACGTG CTCGGCTACG GACCGCTGGA GCCGCTGCTC 
GCGCGCGACG ATATCGCCGA CATCATGGTC AACGGCGCCG GGCAAACCTT CATCGAAGTG 
GGCGGGAAGG TCGAAGAATC GGAGATACGG TTCCGCGACA ACGGGCAACT CCTGTCGATC 
TGCCAGCGCA TCGTCAGTCA GGTGGGCCGC CGCGTAGACG AGTCCAGCCC GATCTGCGAC 
GCGCGTCTGC CGGATGGCTC GCGTGTCAAC GTCATCGCCC CGCCGCTCGC GATCGACGGC 
ACGGCACTCA CGATCCGCAA GTTCAAAAAG GACAAGCTGA CGCTCGAGCA GCTGGTACGT 
TTCGGCTCGG TCACACCGGA GGCCGCGGTG CTGCTGCAGA TCATCGGCCG CGTCCGCTGC 
AACATCGTCA TCTCCGGCGG TACCGGCTCC GGCAAGACGA CGCTGCTCAA CTGCCTGACG 
CGCTATATAG ACAGCAACGA GCGCATCATC ACCTGCGAAG ACTCCGCCGA ACTGCAATTG 
CAGCAGCCGC ATGTGGTCCG TCTCGAGACT CGCCCGCCGA ACATCGAGGG CGAGGGCGAG 
ATCACCATGC GCGACCTGGT GAAGAACTGC CTGCGCATGC GCCCGGAGCG CATCATCGTC 
GGCGAGGTGC GCGGCCCGGA AGTCTTCGAT CTGCTGCAGG CGATGAACAC CGGCCATGAC 
GGATCGATGG GAACCATCCA CGCGAACACG CCGCGCGAAT GCCTGAGCCG AATGGAATCG 
ATGATCGCCA TGGGCGGTTA CACCCTGCCT GCCAGGACCG TGCGCGAAAT CATCTCCGGC 
TCGGTGGACG TCATCATCCA GGCATCGCGC CTGCGCGACG GTTCGCGCCG GATCACCCAC 
ATCACCGAGG TCGTCGGCAT GGAAGGCGAC GTAATCATCA CACAGGATCT GATGCGCTAC 
GAGATCGACG GCGAGGATGC CAATGGCCGG ATTGTCGGCC GCCACGTTTC GACCGGGATA 
GGCCGGCCGC ATTTCTGGGA CCGGGCCCGC TACTTCAACG AGGACAAGCG GCTCGCCGCG 
ACACTCGATG CGATGGAAAA GCAATAG

Protein sequence

MFGKRGNEGP GKGGARGFTP APSIPAVELA VVERPSAPDY GEPAAPPSRP QAAAPPQRRR 
PARAEDYYDT KSQVFSALID TIDLSQLSKL DIESAREEIR DIVNDIITIK NFAMSISEQE 
ELLDDICNDV LGYGPLEPLL ARDDIADIMV NGAGQTFIEV GGKVEESEIR FRDNGQLLSI 
CQRIVSQVGR RVDESSPICD ARLPDGSRVN VIAPPLAIDG TALTIRKFKK DKLTLEQLVR 
FGSVTPEAAV LLQIIGRVRC NIVISGGTGS GKTTLLNCLT RYIDSNERII TCEDSAELQL 
QQPHVVRLET RPPNIEGEGE ITMRDLVKNC LRMRPERIIV GEVRGPEVFD LLQAMNTGHD 
GSMGTIHANT PRECLSRMES MIAMGGYTLP ARTVREIISG SVDVIIQASR LRDGSRRITH 
ITEVVGMEGD VIITQDLMRY EIDGEDANGR IVGRHVSTGI GRPHFWDRAR YFNEDKRLAA 
TLDAMEKQ