Gene Rleg2_6173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6173
Symbol
ID	6983246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	+
Start bp	113944
End bp	114993
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	643399188
Product	ABC transporter related
Protein accession	YP_002283944
Protein GI	209552028
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.204705
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATG CCTATCACCA TTCACCCGGC CGGACGGCAC CTCCCGCGCT CGAAGCCAGG 
GGCGTGTGGA AAGTCTTTGG TACCGATGCC GGCTCTTTTG GCCAGCGTCC CGCCTCCGCC 
CGCGCGCCTG AGGCATTGGC CGCCGCCAAT GTCGTCGGCG CGGTGCAGGA TGCGACGTTC 
CGGATCGCGC GCGGCGAGGT CTTTGTCATC ATGGGCCTTT CCGGCTCGGG GAAATCCACG 
CTGCTTCGTT GCCTCACCCG GCTGATCGAA CCCACCGAGG GGGAGGTTCA TTATGACGGC 
GAGAATATCT TGAAGCTGAG CGACAAGGCG CTGGTGGAGA TCCGCCGCCG CCGAATGGGC 
ATGGTGTTCC AGCATTTTGC ACTGCTGCCC AACCGCACCG TTCTCGGCAA TATCGCTTTC 
CCCCTGGAAG TTCAGGGAAT GCCGCGCGCC AAGGCCGAGG CGCGGGCACA GGAGCTGATC 
GACACCGTGG GACTGGCGGG GCGAGAAGCC CGCTTTCCCG CCGAACTTTC CGGCGGCCAG 
CAGCAGCGCG TCGGCATCGC CCGGTCGCTG ACCACCAATC CGGAATTCTG GTTTCTGGAC 
GAGCCGTTTT CGGCGCTGGA TCCGCTGATC CGTGCCGACC TCCAGGCTGA GGTGCTGCGG 
CTCCAGCAGA CCCAGACGCG CACGGTCGTT TTCGTCACCC ATGATCTGGA TGAAGCCATT 
CGGCTTGCCG ACCGGATCGC CATCATGGAA GGCGGGCGCA TCGTCCAGAT CGGAACACCC 
GAAGAGCTGG TGACGCGGCC GGCGACCGAC TATGTCCGCC GCTTCGTCGC CAAGATACCG 
CCGGCCCGCG TGGTTCGGGT TTCCTCGCTG ATGACGCCTG CGCAGGGGCA GAATGCCGCC 
GGCGGCGTGA AAGCGGCTTG CACGATTTCC GAGATCGCGC CGGAACTTGT CTCCGCCACC 
GGACCTTTGC CGGTCCTCGA TGCCGGCGGC AGACAGATCG GATCGCTCGA CCGCCAGCGG 
GCGCTTGTGA CGCTGGCGGC GGGGGCCTGA

Protein sequence

MSDAYHHSPG RTAPPALEAR GVWKVFGTDA GSFGQRPASA RAPEALAAAN VVGAVQDATF 
RIARGEVFVI MGLSGSGKST LLRCLTRLIE PTEGEVHYDG ENILKLSDKA LVEIRRRRMG 
MVFQHFALLP NRTVLGNIAF PLEVQGMPRA KAEARAQELI DTVGLAGREA RFPAELSGGQ 
QQRVGIARSL TTNPEFWFLD EPFSALDPLI RADLQAEVLR LQQTQTRTVV FVTHDLDEAI 
RLADRIAIME GGRIVQIGTP EELVTRPATD YVRRFVAKIP PARVVRVSSL MTPAQGQNAA 
GGVKAACTIS EIAPELVSAT GPLPVLDAGG RQIGSLDRQR ALVTLAAGA