Gene Smed_2738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2738
Symbol
ID	5323608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2850614
End bp	2851873
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	62%
IMG OID	640791683
Product	von Willebrand factor type A
Protein accession	YP_001328403
Protein GI	150397936
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4961] Flp pilus assembly protein TadG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGAC GTAACAATGC AGGCCTGTCC TTCATGAGGA TGCTGCGGGA TCGAGGCGGG 
AATTTCGGGA TGATGACGGC GCTGGTCGCG CCGCTACTCC TTGCCGTCGG CGGGGTATCC 
GTCGACGTCG CCAACATGCT GATGACCAAG AACCAGCTTC AGGACGCAAC CGACGCGGCA 
GCGCTCGCGG CCGCCTCCGC TCTCGTATCC GACGCGAGGC CAGACATCGA AGAGGCAAAG 
GACCTCGCGC GCAAGTTCCT GAAGACGCAG GCGGCAGCGG CGACCGCGTC GGACCTCCCG 
GACGAGGGGC CGTCGATAGG GGCGCGCGGC GGCGGGAATG CGGATGACGA AGTACCTGCG 
ACGCCCCGGT GGGAGGATGT GAATGCTACG GAAATCGACA TCACCGCGAC GCCGAACGGT 
GCAAAGGGGA AGTCTTTCCA GGTTACCGTC GCCAACAAGC ACCTGCTCCA GTTCAATGCC 
ATGACGCGTC TGCTCGGCCC GGAGTCGATC GAGATCGAAA CCCGATCCAC CGCCGAGAGC 
GCGACGGAGA GCAAGAACGC CCTGTCCATG TATCTGGTGC TCGACCGGTC CGGGTCGATG 
GCGTGGAAAA CCAACACGAT AAACACAGGC AAGGCGAAAT GCCCCAACTA CACGGAGGCG 
AACTGGAGCA AGTATCCGGA CCTCAAGGCT ACCGGCCCCT GCTATGTAAC GAAGATTGAT 
GCCCTGAAGA CAGCGGTTGG CGACCTCCTC GCCCAGCTTG TCACGGCGGA CCCGGAATCG 
GCCTATGTCC GCACCGGTGC GATCTCCTAC AATTCCGCCC AGGACGCGGC GAGCAGTCTT 
TCCTGGGGAA CGAGAGGTGC AGCCGGTTAT GTCGACGCCC TGGTCGCCAT AGGCGGGACC 
GCCTCCGGCA ACGCCTTCAA GACCGCGTTC CAGAAGGTCA CCAACGCTGC GGAAGACAGC 
GAGCACGGTG CAAAGAACGG TCAGGTGCCG ACGAAGTACA TCGTGTTCAT GACCGATGGC 
GAAAACAACC ATGCCAATGA CGACACCGTC ACCAGGCAGT GGTGCGACAC AGCCAAAGCA 
AGCAAGGTCC AGATCTACAG CGTTGCATTC ATGGCGCCGG ATCGCGGCCA GAAGCTGCTG 
AAGTCCTGTG CTTCGTCTTC CTCCCACTAT TTCGAAGCGG AGGAGGCGTC CGATCTCGTC 
GCCGCCTTCA AGGCGATCGG CGAACGCGCG GCCGCGTCGG TATCCCGCTT GACGAAATGA

Protein sequence

MGRRNNAGLS FMRMLRDRGG NFGMMTALVA PLLLAVGGVS VDVANMLMTK NQLQDATDAA 
ALAAASALVS DARPDIEEAK DLARKFLKTQ AAAATASDLP DEGPSIGARG GGNADDEVPA 
TPRWEDVNAT EIDITATPNG AKGKSFQVTV ANKHLLQFNA MTRLLGPESI EIETRSTAES 
ATESKNALSM YLVLDRSGSM AWKTNTINTG KAKCPNYTEA NWSKYPDLKA TGPCYVTKID 
ALKTAVGDLL AQLVTADPES AYVRTGAISY NSAQDAASSL SWGTRGAAGY VDALVAIGGT 
ASGNAFKTAF QKVTNAAEDS EHGAKNGQVP TKYIVFMTDG ENNHANDDTV TRQWCDTAKA 
SKVQIYSVAF MAPDRGQKLL KSCASSSSHY FEAEEASDLV AAFKAIGERA AASVSRLTK