Gene Rleg2_4188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4188
Symbol
ID	6982961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4361518
End bp	4363017
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	63%
IMG OID	643398919
Product	type II and III secretion system protein
Protein accession	YP_002283676
Protein GI	209551759
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4964] Flp pilus assembly protein, secretin CpaC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAATT CAACGCGGCG CGCCGGGCTT CTCCTCACAG GTTTTTTCTC GCTGGCGGTC 
GGTATCTCCG GTATTGCGCC GGCCTCTTTC GCGCCGCTTC TGGGCTCCAG CGAGGCGCGT 
GCCGATTCCG AGAACCTGGT TCGCATCTCG CAGACCGGCC GCGATGCCCA TCGTCGGCTG 
AAGCTCGGGC TGAACAAGGC CGTTGTCGTC GATCTGCCGG AGGATGCGCA TGATATTCTC 
GTCTCCGATC CGACCATGGC CGATGCCGTC ACCCGCACCT CGCGGCGCAT CTACCTGTTC 
GGCAAGAAGG TCGGCCAGAC GAATATTTTC GTTTTCGGCG CCGGCGGGCA GGAGATCGTC 
AATCTCGACA TCGAGATCGA GCGCGATGTT TCCGGCCTCG AAGTCAATCT CCACCGCTTC 
ATTCCAGACT CCAACATCAA TGTCGAAATC GTCTCCGACA ACATCGTGCT GACCGGCACC 
GTGCGCACGC CGCAGGATGC CACGCAGGCG GCCGATCTGG CGCAAGTCTT CCTGAAGGGC 
GGCGAGGCCA CGACCAGAAC CGAGACGGCA TCGGGTACCG GCGGCGACAG CTCGGTGGCG 
CTTTTTGCTG AAGGCCGCCA GACCTCGCAG GTCGTCAACC TGCTGCAGAT CGAAGGCGAA 
GACCAGGTCA CCCTCAAGGT GACGATCGCC GAGGTTCGTC GCGAGGTGCT GAAGCAGCTC 
GGCTTCGACA ATCTGGTTTC CAATTCCTCC GGCATGACGG TCGCCCAGCT CGGCAGCCCC 
AGCGCCGACA GCGCCACATC CGTCGTTGGC GGTGGCCTGG CGGCGCTCTT TAAGAGCTCG 
ATCGGGAAAT ATGACATTTC GACCTACCTC AACGCGCTGG AGCAGGCCAA GGTCGTCAAG 
ACGCTCGCCG AGCCGACGCT GACGGCAATA TCGGGCCAGG CCGCGACCTT CAATTCCGGC 
GGCCAACAGC TCTATTCGAC AACCGACAGC AACGGCAACG TCACCGTCGT GCCGTTCAAC 
TACGGTATCA ACCTCGCCTT CAAGCCGGTC GTGCTCTCAT CGGGACGCAT CAGTCTGCAG 
ATCAAGACCA ATGTCTCCGA ACCGGTCGCC GGCAGCAGCG GCGCGACCTA TCAGCGCCGC 
TCGGCGGAAA CCTCGGTGGA ACTGCCCTCG GGCGGCTCCA TCGCGCTGGC CGGCCTGATT 
CGCGACAACG TCTCGCAGAC GATGGGCGGC ACACCTGGCG TATCGAAAAT CCCGCTGCTC 
GGTACCCTCT TCCGCCAGAA GGGGTTCGAG CGTCAGGAAA CCGAGCTTGT CATCATCGCG 
ACGCCCTATC TGGTGCGCCC GGTGGCGCGC AATCAACTCA ATCGGCCGGA CGATAATTTC 
AGCCCCGAGA ACGACGGTGC GACCTTCTTC CTCAACCGTG TCAACAAGGT CTATGGCCGC 
CGCGAGGCGC CCGTCGCCGA TGCGCAGTTC CACGGATCGA TCGGGTTCAT CTACAAATGA

Protein sequence

MGNSTRRAGL LLTGFFSLAV GISGIAPASF APLLGSSEAR ADSENLVRIS QTGRDAHRRL 
KLGLNKAVVV DLPEDAHDIL VSDPTMADAV TRTSRRIYLF GKKVGQTNIF VFGAGGQEIV 
NLDIEIERDV SGLEVNLHRF IPDSNINVEI VSDNIVLTGT VRTPQDATQA ADLAQVFLKG 
GEATTRTETA SGTGGDSSVA LFAEGRQTSQ VVNLLQIEGE DQVTLKVTIA EVRREVLKQL 
GFDNLVSNSS GMTVAQLGSP SADSATSVVG GGLAALFKSS IGKYDISTYL NALEQAKVVK 
TLAEPTLTAI SGQAATFNSG GQQLYSTTDS NGNVTVVPFN YGINLAFKPV VLSSGRISLQ 
IKTNVSEPVA GSSGATYQRR SAETSVELPS GGSIALAGLI RDNVSQTMGG TPGVSKIPLL 
GTLFRQKGFE RQETELVIIA TPYLVRPVAR NQLNRPDDNF SPENDGATFF LNRVNKVYGR 
REAPVADAQF HGSIGFIYK