Gene Rleg_6784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6784
Symbol
ID	8022714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012858
Strand	-
Start bp	220393
End bp	221400
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	61%
IMG OID	644833651
Product	putative DNA topoisomerase I protein
Protein accession	YP_002984785
Protein GI	241666701
COG category	[L] Replication, recombination and repair
COG ID	[COG3569] Topoisomerase IB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCCG AAGCCATCAC CGACCTTGGT CTTGTCTATG TCAGCGACAC CGAACCAGGC 
ATCCGCAGGC GAAGGAAGGG TAAGGGCTTC AGCTATGTGA TGCCCGACGG TACGACGCTT 
GCCGACGAAT TGCAGCGGGC GCGCATAGGC GCGCTCGGTC TGCCCCCAGC CTATGAGAAT 
GTCTGGATCT GCCTCTACGA CAACGGCCAT TTGCAGGCGA CAGGCTTCGA TGCGCGCGGG 
CGCAAGCAAT ACCGCTACCA TAAGGAATGG CAATCCTTCC GAAGTGCGGG AAAATTCCAT 
CAATTGATCG AGTTCGGCCG GGCGCTGCCT CGAATACGCC GCACCGTGCT GCGCCATCTC 
GATACCGGTG CAGAGGATGT CAATGGCGTG CTTGCGGCTT TGACGACGCT GCTCGACGAG 
GCGCACCTCC GCGTCGGCAA TCAGGCCTAT GTCAGGGAGA ACGGCACCTA TGGCGCAACG 
ACGCTGCTAA AACGCCACCT GAAGATCGTC GACGGGCAGA TCGAGCTGAA ATTCCGTGCG 
AAAGGTGGCA AGCGCGTCCA GCGCAGCCTC AAGCATCCGA GGCTGCAGAA GATCCTGGAG 
GAGATAGCCG ACCTGCCAGG CCGCCAACTC TTCGTCTGGA AGGACGAAAG CGGGACGCTG 
AAGCCAATCG ATTCCGGGCG ATTGAACGCC TATCTGGCCG AGATATCCGG CATTCCGATT 
TCGGCGAAGA CCTTTCGCAC CTGGGCCGGA TCGCTGGCGG CTTTCGGAGC GGCGCGCGAG 
ACGATCCTCG GTGGCGGCCG GCCGACCGTG AAGCAGATGT CGGAGGCCGC GGCCGAGGCG 
CTACACAACA CACCGGCGAT CTCGCGCTCG AGCTATATCC ATCCCGCGAT CATCTCGCTC 
GCCGGCAACG ATCATCCGCT GATCGAGACT GGCAACGAGC CGCTGCGGGG CTTGCGGGCC 
GAGGAAAACA GGCTACTTGA TTTCCTCACA AGCGAGATCG AAGAATGA

Protein sequence

MNAEAITDLG LVYVSDTEPG IRRRRKGKGF SYVMPDGTTL ADELQRARIG ALGLPPAYEN 
VWICLYDNGH LQATGFDARG RKQYRYHKEW QSFRSAGKFH QLIEFGRALP RIRRTVLRHL 
DTGAEDVNGV LAALTTLLDE AHLRVGNQAY VRENGTYGAT TLLKRHLKIV DGQIELKFRA 
KGGKRVQRSL KHPRLQKILE EIADLPGRQL FVWKDESGTL KPIDSGRLNA YLAEISGIPI 
SAKTFRTWAG SLAAFGAARE TILGGGRPTV KQMSEAAAEA LHNTPAISRS SYIHPAIISL 
AGNDHPLIET GNEPLRGLRA EENRLLDFLT SEIEE