Gene Rleg2_3346 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3346
Symbol
ID	6982100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3449063
End bp	3450298
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	58%
IMG OID	643398064
Product	von Willebrand factor type A
Protein accession	YP_002282839
Protein GI	209550922
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4961] Flp pilus assembly protein TadG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.688988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCT CTTTTTTGTA TCCCCGCCTG CGTCGCATGT TCAGCGATCG AGGCGGTAAC 
TTCGGTATCA TGACGGCGAT TATGGCGCCG GTTCTTCTCG GCGTTGCCGG CGTGGCGATC 
CAGGTCGGGG ATATGATGCT CTCAAAGCAG CAGTTGCAGG AGGCGGCCGA TTCAGCGGCG 
CTGGCGACCG CTACGGCGCT AGCAAACGGC ACGATCCAAA CGTCGCAAGC CGAGGCCTTT 
GCGCAGAATT TCGTCGCCGG CCAGATGGCG AATTACGTGC AGAGCGGCGT CGATTTCAAA 
AGCGGCACGA GCGTCAATGT GCAGACAAGC ACATCGGGCA AATCGACATC CTACCAGGTA 
ACGGTTTCAC CGAGTTACGA CCTGACGGTC AATCCGCTGA TGCAGGCGGT CGGCTTCAAG 
ACCCAGCATC TCTCGACCTC CGGCACGACG GTCGGCGGGC ACTCACAGAC TCAAGGCTCG 
ATCTCGATGT TTCTCGCGCT CGATAAATCA GGGTCGATGG GAGAGGCTAC CGCGACCGTC 
AATGCGGACG ACCCAACGGA ATCGTACACC TACGACTGCA ACCTCCATTA CAACAGCAAG 
AATAATAAGT GGGTTTACGA CAAATGCACC GGCAGCCGCA CAAATTACTA CACCAAGATC 
GAGGCGCTTA AGATCGCCGC CGGCAATCTC TTCGGCCAGC TGAACAGCGC CGATCCCAAT 
GCGGAGTACG TGCGCACTGG CGCCGTGTCC TATGATATCA ACCAATACAC TCCGAGCAAT 
CTCGCCTGGG GAACCGCCGG TGTCACCAGC TATGTCAACG CACTTCAGGC GAATGGCGGC 
ACGAATTCGA GCGGCGCAAT GAGCACCGCC TATTCGTCCC TGACGGCGAA GAATGCTGCG 
GGGAACGACG CCGAGGACTC CGCCCACAAG CTGAAGACCG GGCAAACACC CAAAAAGTAC 
ATCGTCTTCA TGACGGACGG CGACAATAAC GACGATAGCA GCGGCGGCCG TTCATATGAT 
ACGCTGACCA AGGCAACATG CGACACGGCC AAATCGAAGG GCATCGAGAT CTATACGATC 
GCCTTCATGG CCCCGGCGGG GGGACAAACG CTGCTGCATT ATTGCGCCTC CGATGACTCC 
CACTATTTCC AGGCGGAAAA AATGGAAGAC CTGCTCGCCG CGTTCAAAGC GATCGGAGCG 
AAGGCCTCTG CTCAGATGAC ACGTCTGACG AACTGA

Protein sequence

MSTSFLYPRL RRMFSDRGGN FGIMTAIMAP VLLGVAGVAI QVGDMMLSKQ QLQEAADSAA 
LATATALANG TIQTSQAEAF AQNFVAGQMA NYVQSGVDFK SGTSVNVQTS TSGKSTSYQV 
TVSPSYDLTV NPLMQAVGFK TQHLSTSGTT VGGHSQTQGS ISMFLALDKS GSMGEATATV 
NADDPTESYT YDCNLHYNSK NNKWVYDKCT GSRTNYYTKI EALKIAAGNL FGQLNSADPN 
AEYVRTGAVS YDINQYTPSN LAWGTAGVTS YVNALQANGG TNSSGAMSTA YSSLTAKNAA 
GNDAEDSAHK LKTGQTPKKY IVFMTDGDNN DDSSGGRSYD TLTKATCDTA KSKGIEIYTI 
AFMAPAGGQT LLHYCASDDS HYFQAEKMED LLAAFKAIGA KASAQMTRLT N