Gene Rleg2_5449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5449
Symbol
ID	6978543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	1093128
End bp	1094249
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	62%
IMG OID	643394550
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_002279368
Protein GI	209547450
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00647572
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGACA TTGCCGTTAC AAATATTCAG CCGGATCGCG CCGCCGTCGC ATCGCAATGG 
CAGCTGATCT GGTGGGCTTT CCGCCGGCAC CGGCTGGCCA TGGTGGCGCT CGTCGTCACC 
GTGATGATGT ATATCGTTGC CCTGGTGCCC GGCTTCTTCG CCATCAACGA TCCGAACCTG 
CAGAATGCGC GGGCGACCTT TCACCCGCCG CAGAAACTGC ATCTGATCGA TACCGAGAAC 
GGGTTTTCCT TCGGCCCGCA TTATTATCCG ATGAAGCTCA CCCGCGATCC GGAAACGCTG 
GCCGCCATCT TCAGGGAAGA CACGACGAAG CGTGTCGACG TCCAGTTCTT CGGGCGCGGC 
TATGAATATT CCGTGTTTGG CCTGTTCAAC ACAAACATCC ATCTGATCGC CTCGCCCGAC 
AAGACCGCGC CGCTGCTTCT CTTCGGCGCC GACCGGCTAG GGCGCGACGT CTTCAGCCGA 
ACGGTGCAGG GGTCGCAGGT TTCCCTATCG ATCGGTCTCG TCGGTGTCTT CCTGTCGTTG 
ATGCTCGGCA TCGTGATCGG CGGCATCTCC GGCTATTACG GTGGCCGCAT CGATTTCTTC 
ATGCAGCGGC TGATCGATTT CGTGCTGTCG TTGCCGACGA TCCCGATCTG GCTGGCGATG 
GCCGCGGCGC TGCCGCAGGA TTGGCCGGCG ACGCTGCAAT ATATGATGAT CACGATCATC 
CTGTCGCTGA CCGGCTGGGC GCAGCTCGCC CGCGTCGTTC GCGGCCGCTT CCTGTCGCTG 
CGCACCGAGG AATTCGTCGC TGCCGCCAGG CTCGACGGCG TTCGCGAAGG ACGCATCATC 
TTCCGCCATA TGCTGCCGAG CTTTGCCAGC CATATCATCG CGTCGATCAC CCTTGCGGTG 
CCGGCGATGA TCCTTGCCGA AACCTCGCTT TCCTTCCTGG GGCTCGGGCT GCAGCCGCCG 
ACCATCTCCT GGGGCGTGCT GCTGCGCGAG GCCCAGAACA TTCGTTCGAT CGCCACGGCA 
CCCTGGCTCT TCATGCCGGG CTGCGCTGTC GTTGTTGCCG TGATGGCGCT CAACCTTCTC 
GGCGACGGCC TGCGCGACGC GGCCGATCCC TACAACAAAT GA

Protein sequence

MADIAVTNIQ PDRAAVASQW QLIWWAFRRH RLAMVALVVT VMMYIVALVP GFFAINDPNL 
QNARATFHPP QKLHLIDTEN GFSFGPHYYP MKLTRDPETL AAIFREDTTK RVDVQFFGRG 
YEYSVFGLFN TNIHLIASPD KTAPLLLFGA DRLGRDVFSR TVQGSQVSLS IGLVGVFLSL 
MLGIVIGGIS GYYGGRIDFF MQRLIDFVLS LPTIPIWLAM AAALPQDWPA TLQYMMITII 
LSLTGWAQLA RVVRGRFLSL RTEEFVAAAR LDGVREGRII FRHMLPSFAS HIIASITLAV 
PAMILAETSL SFLGLGLQPP TISWGVLLRE AQNIRSIATA PWLFMPGCAV VVAVMALNLL 
GDGLRDAADP YNK