Gene Rleg_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2036
Symbol
ID	8013067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2029783
End bp	2030922
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	62%
IMG OID	644824622
Product	hypothetical protein
Protein accession	YP_002975853
Protein GI	241204757
COG category	[S] Function unknown
COG ID	[COG4222] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00898362
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGC GTTTTCTCGC GGCTGCCGCT CTCGCCCTTC TGTCAAGCAC AGTCTCCGCC 
AGCGCCACAG ATATCGGCGC CACCTTCGCG ACCGCCTGCC CCTTCGGCGA TTGCGCCGCT 
GGCATCTCGC TCTCCTATCT CGGTGAATTC GTCATCCCCA CAGGCCATAT CGAAAACGGC 
GTCGAATTCG GCGGCATTTC TGGCCTCGAT TTCGATGTCG CCACCGGCCA TTATATCGCC 
ATCAGCGACG ACCGCTCGGA AAGAGGCCCG GCCCGCTTCT ATGAACTCAA CGTCGATGTC 
GACGCGTCGG GCCTTAAGCG CGTTTCGGTC GTCAAGCAGG TGACGCTGAA AGACAAGAAC 
GGCGAGCTCT TCGTTGCCCG GACCGTCGAT CCAGAATCGA TCCGCCTTGG CAAGGATGGC 
ATCTATTGGG GCAGTGAGGG CGACGGCAAG GCGCTGCTGG CGCCCTTCAT CCGCGTCGCA 
TCGCCGGACG GTTCCTTCGT CCGCGAATTC AAGCTGCCGG AGGGCTTTGC ACCGACCGCA 
GACAAGTCAA CAGGCATCCG CGACAACCTC GCTTTCGAGG ATCTCGCGGT CGCGCCCTCC 
GGCGATGTTT TCGTCGGTGT CGAAGCGGCC CTTTACCAGG ACGGTCCGAA CCCCTCGCTG 
ACGTCGGGCA GCCTGTCGCG CATCGTCCGC TACGACGGCG CCACCGGCGC GCCGAAAGCC 
GAGTACGTCT ATCCCGTCTC GCCGATCCCG CAGGCCGCCA CCAAGGCCGA CGGCGGTAAT 
GACAACGGCA TGTCTGAAAT GCTTGCCCTC GACGATCACC GCCTGCTCGC CGTCGAGCGG 
AGTTATGCCC AGGGCTTCGG CAACAGCATC GAGATCATGA TGATGGATCT GACTGATGCC 
ACCGATGTAT CCGCCATCGC GTCCCTCGCC AAAAACGACC AGCGCGTCGT CCCTGTCCGC 
AAGAGCCAGG TCCTCGATTT GAGGGCGATC GGCCTCGTTC CCGACAATAT CGAGGCCATG 
TCGCTCGGCA AGGCCAAGGA CGGCACCGAT CTTCTCATTC TCGGCTCCGA CAATAATTTT 
TCGACCAGCC AGAAGACGCA ATTCTATGCC TTCAAGGTTC TCAACCGCCC GCAGCAGTAA

Protein sequence

MTKRFLAAAA LALLSSTVSA SATDIGATFA TACPFGDCAA GISLSYLGEF VIPTGHIENG 
VEFGGISGLD FDVATGHYIA ISDDRSERGP ARFYELNVDV DASGLKRVSV VKQVTLKDKN 
GELFVARTVD PESIRLGKDG IYWGSEGDGK ALLAPFIRVA SPDGSFVREF KLPEGFAPTA 
DKSTGIRDNL AFEDLAVAPS GDVFVGVEAA LYQDGPNPSL TSGSLSRIVR YDGATGAPKA 
EYVYPVSPIP QAATKADGGN DNGMSEMLAL DDHRLLAVER SYAQGFGNSI EIMMMDLTDA 
TDVSAIASLA KNDQRVVPVR KSQVLDLRAI GLVPDNIEAM SLGKAKDGTD LLILGSDNNF 
STSQKTQFYA FKVLNRPQQ