Gene Rleg_6755 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6755
Symbol
ID	8022685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012858
Strand	+
Start bp	191774
End bp	192799
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	644833622
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_002984756
Protein GI	241666672
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACAC AACGGCTCAC CCGGCTCATC GCAGCTGCGG TCATGGCAGG CAGCTTCGCG 
ATCGGAAGCA TTGCTCCGGC ATTCGCAGAT CAGACGCTTC TTAACGTTTC CTACGATCCG 
ACCCGCGAAT TGTATAAGGA TTTCAATGCC GCCTTTGCCG CCAAGTGGCA AAAGGACAAT 
GGTGAAACCC TGACGATCCA GGCTTCGCAT GGCGGTTCCG GCGCCCAGGC CCGCTCGGTC 
ATCGACGGTC TCGACGCCGA TGTCGTGACA CTTGCCCTCG AAGGCGATAT CGACGCCATC 
GCCAAGGCGA CCGGCAAGAT CCCGGCCGAC TGGAAGACCA AGTTCCCCAA CAATTCGACG 
CCTTATACGT CGACGATCGT CTTCCTCGTG CGCAAGGGCA ACCCGAAAGG CATCAAGGAT 
TGGGGAGACC TGGTCAAGGA CGACGTGCAG GTGATCACCC CGAACCCGAA GACATCGGGC 
GGCGCGCGCT GGAACTTCCT TGCCGCATGG GCATGGGCCA AGCAGTCAAA TGGCGGCGAC 
GAAGCCAAGG CGCAGGAATA CGTTGCGAAA CTCCTGCAGC ACGTCCCGGT TCTCGACACC 
GGCGCTCGCG GCGCCACGAC CACCTTTGTC CAGCGCGGCC TCGGCGATGT GCTGCTCGCC 
TGGGAAAACG AAGCCTATCT TTCGCTCGAA GAGCTCGGTC CCGACCAGTT CGAGATCGTA 
ACACCGACCT TCTCCATCCG CGCCGATCCG CCGGTCGCCG TCGTCGACGG CAATGTCGAC 
AAGAAGGGCA CGCGCAAGGT CGCCGAAGCC TATCTCAACT ACCTCTATTC GGACGAAGGC 
CAGAAGATCG CCGCCAAGCA CTACTATCGG CCGACCAAGC CGGAAGCCGC CGATCCGGCT 
GACATCGCCC GCTTCCCGAA GCTGACGCTG GCGACCATCG ACGACTTCGG CGGCTGGAAG 
GACGCACAAC CTAAATTCTT CGGCGACGGC GGCGTATTTG ACCAAATCTA CAAGCCGGCC 
CAATAA

Protein sequence

MQTQRLTRLI AAAVMAGSFA IGSIAPAFAD QTLLNVSYDP TRELYKDFNA AFAAKWQKDN 
GETLTIQASH GGSGAQARSV IDGLDADVVT LALEGDIDAI AKATGKIPAD WKTKFPNNST 
PYTSTIVFLV RKGNPKGIKD WGDLVKDDVQ VITPNPKTSG GARWNFLAAW AWAKQSNGGD 
EAKAQEYVAK LLQHVPVLDT GARGATTTFV QRGLGDVLLA WENEAYLSLE ELGPDQFEIV 
TPTFSIRADP PVAVVDGNVD KKGTRKVAEA YLNYLYSDEG QKIAAKHYYR PTKPEAADPA 
DIARFPKLTL ATIDDFGGWK DAQPKFFGDG GVFDQIYKPA Q