Gene Rleg_3266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3266
Symbol
ID	8014155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3267585
End bp	3268940
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	64%
IMG OID	644825825
Product	TonB family protein
Protein accession	YP_002977052
Protein GI	241205956
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0810] Periplasmic protein TonB, links inner and outer membranes
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0913504
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTT CAGCGAAGAC CAGATCGAGA CAGGTGCTCA TCGGGGAGCC GGACGCTGAC 
GGCGGTCTGA ACGACAACAA CATGCATCCC GGCCACGAGC TTTCCGACCT GCGCAATGTG 
CAGCGGCAGC CGGCTGGCGA GGCGGTGGTC CATTATGCGC GTTTCGCGCA GATACCCTCC 
TTTCCCGATC ATCCGGAGGC CGAACCGACA GCCTCTGTTC CTGCGCCGCC GATGGATGCA 
GCGGTAGAAA AGCAGGGAGA CGAGAAGGCA CCGGTGCGGA GACGGGTGGC GCTGACGTAC 
ATCTGCTCGC TGATCTTTCA CGCGACACTG GCGGCTGTGC TGCTGATTGC TTTCCCCAAA 
GCGCCGGAGG AGGCAATCGA AGAAGCCGGT CAGGCGATGA GCGTCGTCAT GTATGGCGAT 
TCCGATATCG ACCAGGCTGC TGCTGGCGAG ACCGAAACGA CCATCCAGCA GGAAATCATT 
CCCGAAGAAG TGCAGCCTGA CACGATCCAG CCGACGCAAA CGGCGGAAGT TCAACCGGAA 
ACCGTGCAGC CGACCGAAGT TTCGCCCTTC GAAGCGCAGG ATCCTATTCA GCAGGCGCCG 
GCACCGGAAG TGACGCGCGT TTCGCCCGAA ACGGCCGCGG CCGTCGAGCC GGAGATTCTG 
GTGTCCGAGG TGCCGGCGGA GGAGTCCGTC GCGCAGCCAA TGTCGACGGT TGTTCCCGAA 
CAGCAGCAGG TGCCGCTCGA CGCAGTGCCG CCATCCGAGG TACAGCCGAC TGCGGTCCAG 
CCGAGCGAGG TGCAGCCTGC GGAAACCCCG GCGGAAGTCG CGGAGGAGAC TCCACAGGGG 
GTGAAGCCCA TAGAAACGGC AGAAATCCAG CCGAAACCGG AACAGCCGCC CGAGGTTGTA 
ACGCCGACGC CAAAGCCGAA AGTGGCACAG GAGAAGCCCA AGCCGGTCGA GAAGAAGCGT 
CCGCCGCAGA AGGCCGCTGG CGACAAGGGG GAGGGGCAGC AGACTTCAAC GCGTGGCGTT 
GCCGAAGGCA ATTCATCGGC GCAATCCGAC AACAGTTCGC AGGCCGCCAA CGGCAATAAC 
GGGGTGGGGA CGGCCGCGAC CGCAAACTAT AAAGGCAAGG TCCGTAGCCG TATTCGGCGT 
GCGATCAGGA AGCCCCGAGG TGTCGAAGGC AGCGTTGTTG TCACCTTCTC AGTCAACGGC 
GGCGGCGGCC TGACCTCCGC TCGTGTCTCG CGTGGGTCCG GCGTTCCGGA GATCGATCAG 
CTTGCTCTCG ATGCGGTGCG TCGTGCGGCA CCCTTCAGCC CCCCGCCCGG TGGGCAGGCG 
ATGACCATGT CAGCGCCTAT CGAGATCGTG CCATGA

Protein sequence

MAISAKTRSR QVLIGEPDAD GGLNDNNMHP GHELSDLRNV QRQPAGEAVV HYARFAQIPS 
FPDHPEAEPT ASVPAPPMDA AVEKQGDEKA PVRRRVALTY ICSLIFHATL AAVLLIAFPK 
APEEAIEEAG QAMSVVMYGD SDIDQAAAGE TETTIQQEII PEEVQPDTIQ PTQTAEVQPE 
TVQPTEVSPF EAQDPIQQAP APEVTRVSPE TAAAVEPEIL VSEVPAEESV AQPMSTVVPE 
QQQVPLDAVP PSEVQPTAVQ PSEVQPAETP AEVAEETPQG VKPIETAEIQ PKPEQPPEVV 
TPTPKPKVAQ EKPKPVEKKR PPQKAAGDKG EGQQTSTRGV AEGNSSAQSD NSSQAANGNN 
GVGTAATANY KGKVRSRIRR AIRKPRGVEG SVVVTFSVNG GGGLTSARVS RGSGVPEIDQ 
LALDAVRRAA PFSPPPGGQA MTMSAPIEIV P