Gene Rleg2_3622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3622
Symbol
ID	6982384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3743779
End bp	3745017
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	60%
IMG OID	643398346
Product	extracellular solute-binding protein family 1
Protein accession	YP_002283113
Protein GI	209551196
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGC GTCTTTTGGC GGCGACCAGC ATCGCTAGCT TATGCCTGTT TTCGGCTGCG 
TCGGCGGCTG AAAATGTCGA AATGTGGGTT CGCTCGGGCA TCGGCGACGC CTTCAAGAAG 
GTCGTCGAAG CCTATAATTC CGGCCATGAG ACCAAGGTCG TGATGACCGA AGTGCCGTTC 
TCCGAACTGG TGCAGAAATA TGCGACGGCG ATCGCCGGCG GACAGGCGCC CGACGCCCTG 
TCGATGGACC TCATCTATAA TCCTGCCTTT GCCGCCGCCG GCCAGCTTGA GGATCTGACG 
GACTGGGCGA AATCGCTGCC CTATTTCAAC TCGCTGTCGC CGTCGCATGT ACGGCTCGGC 
ACCTATCAGG ACAAGATTTA CGGCCTGCCG CTCTCGGTGG AGACATCGGT CTTCGCCTGG 
AACAAGGATC TCTACAAGAA GGCCGGCCTC GACCCGGACA AGGCGCCTGC CAACTGGGAT 
GAAATCACCG CCAATGCCGA GAAGATCCGG GCCCTCGGTG ACGACACCTA TGGCTTTTAT 
TTCTCCGGCG GCGGCTGCGG CGGCTGCATG ATCTTCACCT TCACGCCGCT CACCTGGGGT 
GCAGGCGCCG ATATCCTGTC GGCCGACAGC AAGACGGCGA CGCTTGATAC CCCGCAGATG 
CGCAAGGCTG TCGATATCTA CCGCAACATG GTCAAGAAGG ACCTGGTGCC GGCGGGCGCG 
GCCAGCGATA CCGGCGCCAA CTTCCTGACC TTCACCAACG GCAAGATCGG CCAGCAGAGC 
CTCGGCGCCT TTGCCATCGG CACGCTGGTG ACCGAGCACC CCGACATCAA TTTCGGCGTG 
ACGCTTATCC CGGGCGTCGA CGGCAAGCCT TCGTCCTTTG CCGGTGGCGA CAATTTCGTC 
ATCACCAAGG GCACGAAGAA GATCGATGCG GTGAAGGGCT TCCTCGAATA TGTCTATTCG 
GAAGACGGCC AGAAGATCAT GGCGAAATAC GGCAGCCTGC CGACGCGCGG CGATATTGCC 
GACAAGGTGC TGGAAGGACT CGATCCGCGC ATGCAGGTCG GCCTCAAGGC GATCAGTGTC 
GCCAAGACGC CCTATACGCT GCAGTTCAAC GACTTGATCA ACAGCGCCAA CGGGCCGTGG 
GCGAGCTTCA CCAACGCCGC GATCTTCGGC GACGATGTCG ACGGCGCGTT TTCGAGCGCC 
CAGTCGGAAA TGCAATCGAT CATCGATAGC GGCCAGTAA

Protein sequence

MIKRLLAATS IASLCLFSAA SAAENVEMWV RSGIGDAFKK VVEAYNSGHE TKVVMTEVPF 
SELVQKYATA IAGGQAPDAL SMDLIYNPAF AAAGQLEDLT DWAKSLPYFN SLSPSHVRLG 
TYQDKIYGLP LSVETSVFAW NKDLYKKAGL DPDKAPANWD EITANAEKIR ALGDDTYGFY 
FSGGGCGGCM IFTFTPLTWG AGADILSADS KTATLDTPQM RKAVDIYRNM VKKDLVPAGA 
ASDTGANFLT FTNGKIGQQS LGAFAIGTLV TEHPDINFGV TLIPGVDGKP SSFAGGDNFV 
ITKGTKKIDA VKGFLEYVYS EDGQKIMAKY GSLPTRGDIA DKVLEGLDPR MQVGLKAISV 
AKTPYTLQFN DLINSANGPW ASFTNAAIFG DDVDGAFSSA QSEMQSIIDS GQ