Gene Rleg2_4135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4135
Symbol
ID	6982907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4316258
End bp	4317895
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	63%
IMG OID	643398865
Product	ABC transporter related
Protein accession	YP_002283623
Protein GI	209551706
COG category	[R] General function prediction only
COG ID	[COG4172] ABC-type uncharacterized transport system, duplicated ATPase component
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACA TGACAGAACC GCTCCTTTCC GTCCGCGATC TCTCGGTTGC CTTTCATCAG 
GGCGGCGCGA CCTCGCTTGC CGTCGATCGC ATCTCCTTCG ATATCGCCAA GGGTGAAGTC 
GTGGCGCTGG TCGGCGAATC CGGTTCCGGC AAATCGGTCT CGGCCAATTC GATCCTGCGG 
CTTCTGCCTT ATCCCTCGGC CAGCCATCCC TCCGGCGAGA TCCTGTTCAA GGGCAAGGAT 
CTCTTGAAGG CATCGGAACG TGCGTTGCGC GAGGTGCGCG GCAACGACAT CACCATGATT 
TTCCAGGAGC CGATGACCTC GCTCAATCCG CTTCATACGA TCGAGAAGCA GATTGCCGAG 
ATCCTGGCAC TGCACCAGGG GCTGACCGGC CAGCCGGCGC GCCAGCGTAT ACTGGAATTG 
TTGAACCAGG TCGGCATCCG CGAGCCGGAG AAGCGATTGA AGGCCTATCC GCACGAACTG 
TCAGGCGGCC AGCGCCAGCG CGTCATGATC GCCATGGCGC TCGCCAACCG GCCGGAACTG 
CTGATCGCCG ACGAGCCGAC CACGGCGCTT GACGTTACCG TTCAGGCGCA GATCCTCGAG 
CTGTTGCGGC AGCTGAAGGG CGAACACGGC ATGTCGATGC TGTTCATCAC CCATGATCTC 
GGCATCGTGC GCAAATTCGC CGATCGCGTC TGCGTCATGA CCAAGCGCAA GATCGTCGAA 
ACCGGAACGG TCGAGGAGGT CTTCGCCAAT CCGAAGCACG ACTATACCCG CCACCTGCTT 
GCCTCCGAAC CGCGCGGCGA GCCGCCGCTT GCCGACCCCG CCAAGCCGAT GGTGATGGAA 
GGTTCCGACA TTCGCGTCTG GTTCCCGATC AAGGCAGGGC TGATGCGCCG TGTCGTCGAT 
CACGTGAAAG CGGTCGACGG CATCGATCTT TCGCTACGGG CGGGACAGAC GCTCGGTGTC 
GTCGGCGAGT CCGGTTCCGG CAAGACCACG CTCGGCTTGG CGCTCACCCG GCTGATTTCC 
TCGCAAGGGC GAATCGCCTT TGTCGGCAAG GATATAGCCG GCTATTCGTT CAGCGAGATG 
CGGCCGCTGC GTAACCAGCT GCAGGTGGTC TTCCAGGATC CTTACGGGTC GCTCAGCCCC 
CGCATGTCGG TCGGCGATAT CGTCGCCGAA GGGCTGAAGG TGCATGAGCG CTCGTTGACA 
GCGGAAGAGC GCGACCAGCG CGTCTGCTGG GCGCTGGAGG AAGTCGGACT CGATCCCCTG 
ACCCGCTGGC GTTACCCGCA CGAATTTTCC GGTGGCCAGC GCCAGCGCAT CGCGATTGCC 
CGCGCTATGG TGCTGAAACC GCGCTTCGTC ATGCTCGACG AGCCGACCTC CGCGCTCGAC 
ATGAGCGTGC AGGCCCAGGT GGTCGATCTC CTGCGCGATC TGCAGAAGAA GCATGACCTC 
GCCTATCTCT TCATCAGCCA CGACCTGAAG GTGGTGAAGG CGCTCGCCAA CGACGTCATC 
GTCATGCGTT TCGGCAAGGT GGTGGAACAG GGCCCGTCAT CGCAAATCTT CCGCGCTCCG 
AAGGACGAAT ACACCAGGGC GCTGATGGCG GCCGCCTTCA ACATCGAGGC GGTGCCGACA 
TCCGCCGTGC AGCAGTAA

Protein sequence

MSDMTEPLLS VRDLSVAFHQ GGATSLAVDR ISFDIAKGEV VALVGESGSG KSVSANSILR 
LLPYPSASHP SGEILFKGKD LLKASERALR EVRGNDITMI FQEPMTSLNP LHTIEKQIAE 
ILALHQGLTG QPARQRILEL LNQVGIREPE KRLKAYPHEL SGGQRQRVMI AMALANRPEL 
LIADEPTTAL DVTVQAQILE LLRQLKGEHG MSMLFITHDL GIVRKFADRV CVMTKRKIVE 
TGTVEEVFAN PKHDYTRHLL ASEPRGEPPL ADPAKPMVME GSDIRVWFPI KAGLMRRVVD 
HVKAVDGIDL SLRAGQTLGV VGESGSGKTT LGLALTRLIS SQGRIAFVGK DIAGYSFSEM 
RPLRNQLQVV FQDPYGSLSP RMSVGDIVAE GLKVHERSLT AEERDQRVCW ALEEVGLDPL 
TRWRYPHEFS GGQRQRIAIA RAMVLKPRFV MLDEPTSALD MSVQAQVVDL LRDLQKKHDL 
AYLFISHDLK VVKALANDVI VMRFGKVVEQ GPSSQIFRAP KDEYTRALMA AAFNIEAVPT 
SAVQQ