Gene Rleg_0739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0739
Symbol
ID	8015476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	769872
End bp	771092
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	59%
IMG OID	644823328
Product	hypothetical protein
Protein accession	YP_002974579
Protein GI	241203483
COG category	[S] Function unknown
COG ID	[COG5397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTTC GGCCGGTCGA ACGCGGTGTT ATAATCTTTT TACAGGAAAG TTATAACCGG 
AGAAAATCCG TGCCCATCCG CGAGATCGAT TTGATGTACC AGACCATGCT GGCGGAGCTC 
GGCCAGCGTT CGCTGGACGG AAGTTTTGTC GCCGAGTTCC CGCTGGAGGG TCGGTTCGTC 
TCCGTCCCCG TGAAGGGCAA GGAATACTGG TATTTCGATC ATCCGGGCCA AGACGGAGTC 
AAACGGTCTT ATGTCGGGCC AAAGAATGAC GAGGAGCTTA CGAAAAGAGT GACCGACTTC 
GGCGCGATCA AGGATGATCT CCGAAACCGC CGGCGAATGG TGGCCACTCT TACGAGAGAA 
GGCGGCATGA ACGCACCGCC CAGGTTTACG GGCGACATCA TCGAGGCGCT TGCCAATGCA 
GGGCTCTTCC GTCTGCGCGC GGTTCTCGTC GGAACCGTGG CATTCCAGAC CTATTCCGGC 
ATTCTCGGCG TTCGACTGCC GGCGTCGCTT ATGCAGACGA GCGATGCCGA CTTCGCCCAG 
TTCCATTCGA TCTCGACGGC GGTCAACGAC AGCATCCCTC CCATAGGCGA GGTTCTTGAA 
AAGCTGGACC CGACATTCCG GGAGGTCCCA CATCTCAACC ATCCCACGCG CTCGACCCAG 
TTCGTGAACG CGAAGAACTA CAAGGTCGAA TTCCTGACGC CGAATACGGG CAGCGACGAC 
AATCAGCAGA AGCCCGCTGA TATGCCCGCC CTTGGGGGAA TTTCTGCCGA ACCGCTCAGA 
TTCCTCGATT ACCTCATCTA CAACCCGATC AGGACCGTGA TCCTTCACAA GAGCGGCATT 
ACGGTCAATG TTCCCGCTGC GGAGCGCTAC GCAGTTCACA AGCTGATCGT CGCCTCGCGG 
CGGCAGAACG ACGACAATGG CGTGCTCAAG CGCGAAAAGG ACGTGCAGCA GGCTTCCCAT 
CTTTTCGAAG CGATGGGCGC GACACGCCGC CATTCTGATC TTGCGCTGGC CTATTGCGAG 
GCGTGGGAAC GCGGTCAGTC ATGGCGTGAC GCAATTGCAC GCGGATTGTC GTTCATGCGA 
CCGGACCGCC GTCTACAGCT CATGTCCGTT CTCGCCGAAG GCATGGCGGA AATTGGCGAA 
GATCCCGCCC GTTACGGAGT TGAAACTGGC CCCGACGGAG CCGGGGGAAC TTCAACACCT 
GCGCCAAAGT CCCGCCGTTA G

Protein sequence

MGFRPVERGV IIFLQESYNR RKSVPIREID LMYQTMLAEL GQRSLDGSFV AEFPLEGRFV 
SVPVKGKEYW YFDHPGQDGV KRSYVGPKND EELTKRVTDF GAIKDDLRNR RRMVATLTRE 
GGMNAPPRFT GDIIEALANA GLFRLRAVLV GTVAFQTYSG ILGVRLPASL MQTSDADFAQ 
FHSISTAVND SIPPIGEVLE KLDPTFREVP HLNHPTRSTQ FVNAKNYKVE FLTPNTGSDD 
NQQKPADMPA LGGISAEPLR FLDYLIYNPI RTVILHKSGI TVNVPAAERY AVHKLIVASR 
RQNDDNGVLK REKDVQQASH LFEAMGATRR HSDLALAYCE AWERGQSWRD AIARGLSFMR 
PDRRLQLMSV LAEGMAEIGE DPARYGVETG PDGAGGTSTP APKSRR