Gene Rleg_5584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5584
Symbol
ID	8016475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	+
Start bp	166733
End bp	167863
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	63%
IMG OID	644827750
Product	hypothetical protein
Protein accession	YP_002978950
Protein GI	241518322
COG category	[S] Function unknown
COG ID	[COG4641] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.348361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0177217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATC CGCTCGATAT CCTCATCCTC GGCCTCTCCT TGTCGTCGTC GTGGGGCAAC 
GGTCACGCGA CGACCTATCG CGCCCTCATC GGCGGCTTGC ACGCCGGGGG GCATCGAGTG 
TTGTTCCTGG AGCGCGACGT GCCCTGGTAT GCGGCGCACC GAGATCTTCC CGATCCCGAC 
TTTTGCCAGC TCGTCCATTA CAGCGACATC GAAGAGATGA TCGAAAACCA TGCCGATCGG 
ATCAAGGCGG CGGACGCGGT CATCATCGGG TCCTACGTTC CATCCGGCGT GGCGGTTATC 
GACAGGATCG CCGCCCTGAA GCCCCGACGG CTGTGCTTTT ATGACATCGA CACGCCGGTG 
ACGCTGGCGA AGCTCGACCG CGGCGACGAG GAATATCTGG CGCGCCGACA GCTTGCGACC 
TTCGACGCCT ACTTCTCGTT TTCGGGCGGT GACGTGTTGG CGGGTCTCGA GCGCGGATAC 
GGCGCGCGCA AGGCGATCCC TCTCTACTGC TCCGTCGATG CGAGCCGATA TCGGCCAACG 
GACGAAGCCT TCCGCTGGGA TTTCGGCTAT CTCGGCACCT ATAGCCCCGA CCGACAGCCA 
ACGCTGGAGC GGCTGCTGAT TGAGCCTGCC AGGCAACTGC CGCATCTGAG CTTCGTGGTC 
GCCGGTCCTC AATATCCTGA AAATATTGAC TGGCCGGCGA ATGTGGAGCG GATCGAACAC 
CTGCCGCCTG CCGATCATCC GAGCTTCTAC AGCCGGCAGC GTTTCACGCT CAACGTCACG 
CGAACCGACA TGATCGCAGC GGGCTGGTCG CCGAGCGTGC GGCTATTCGA GGCCGCTGCG 
TGCGGCACGC CGATCATCAG TGACGAGTGG CGCGGCTTGA ACGAGTTCTT CGCCGACGGT 
CAGGCGATCA TCATCGCCAA AGGATCGGGG GATGTCGTCG ACGCCCTGAC AACCATCGCC 
GCCGCGGGGC GCCGTGCGCT CGCATCGGCC GCCAGGGCGA CGGTGCTTGA ACGCCATACC 
GGCGAGGTGC GCGCTCGTGA ACTCGCCGCC GCCTTGCGAG AACTGCCAGA AGAAGGGGGA 
GAACGACAAT CGTCCCCAGC CTCAATCCAT TTCAGCTTAG GAGACGCATG A

Protein sequence

MTNPLDILIL GLSLSSSWGN GHATTYRALI GGLHAGGHRV LFLERDVPWY AAHRDLPDPD 
FCQLVHYSDI EEMIENHADR IKAADAVIIG SYVPSGVAVI DRIAALKPRR LCFYDIDTPV 
TLAKLDRGDE EYLARRQLAT FDAYFSFSGG DVLAGLERGY GARKAIPLYC SVDASRYRPT 
DEAFRWDFGY LGTYSPDRQP TLERLLIEPA RQLPHLSFVV AGPQYPENID WPANVERIEH 
LPPADHPSFY SRQRFTLNVT RTDMIAAGWS PSVRLFEAAA CGTPIISDEW RGLNEFFADG 
QAIIIAKGSG DVVDALTTIA AAGRRALASA ARATVLERHT GEVRARELAA ALRELPEEGG 
ERQSSPASIH FSLGDA