Gene Rleg_4905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4905
Symbol
ID	8007386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	283792
End bp	285447
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	63%
IMG OID	644821825
Product	transposase IS66
Protein accession	YP_002973085
Protein GI	241113250
COG category	[L] Replication, recombination and repair
COG ID	[COG3436] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG CGACTGATGA GCTTCCGGAC GACCTTGCCA GTGCGCTTGC ACTGCTGGCC 
GAGGAGCGTG CCCGGCGTAT CACTGCCGAG GCAGAAGCTG CGATCGCCAA GGCGCAAGCC 
GCCAGCGCAA AGGCGCTCGT GTCGCATTCC GAAGCGCTGA TCGCGCGGTT GAAGCTGGAG 
ATCGAGAAGG TTCGCCGCGA ACTTTACGGC AGCCGGTCAG AACGCAAGGC GCGACTCCTC 
GAACAGATGG AACTGCAGCT CGAGGAGCTG GAAGCTGACG CTGGCGAAGA CGAACTGGCG 
GCAGAGGTTG CGGCCAAAGC CTCGACGGTC AGGGCTTTCG AGCGCAAGCG TCCATCACGG 
AAACCATTCC CTGAACATCT GCCGCGCGAG CGTGTCGTTA TCGCGGCCCC GGCGAGCTGC 
CCTTGTTGCG GTTCGGGCAA GCTGTCGAAG CTGGGCGAAG ACATCACCGA GACCCTGGAG 
GTCATCCCGC GTCAGTGGAA GGTGATCCAA ACGGTGCGGG AGAAGTTCAC CTGCCGCGAA 
TGCGAGAAGA TCACCCAGCC ACCAGCTCCT TTCCATGTGA CGCCGCGGGG CTTTGCCGGG 
CCCAGCCTTC TGGCGATGAT ACTGTTTGAG AAGTTCGCGC AGCATCAACC GCTGAACCGC 
CAGAGCGAGC GCTATGGCCG TGAGGGTATC GACCTCAGCC TGTCGACGCT GGCAGATCAG 
GTCGGCGCTT GCGCCGCGGC GCTGAAGCCA CTCCATGCGT TGATCGAAGC GCATGTCCTG 
GCTGCCGAGC GGCTGCATGG TGACGACACC ACAGTGCCGA TCCTGGCGAA GGGAAAGACC 
GATACGGGTC GCATCTGGAC CTATGTCCGA GATGACCGGC CGTTCGGCGG GCAATCGCCG 
CCGGCGGCTC TCTACTATGC TTCGCGAGAT CGACGACAAG AGCATCCCGA GCGCCACTTG 
AAGACCTTCA CCGGCATTCT GCAGGCTGAT GCCTATGGCG GCTACAATCC GCTGTTCAAG 
GTAGACCGCG ATCCGGGGCC GCTGACGCAG GCGCTCTGCT GGTCGCACGC GAGGCGCAAG 
TTCTTCGTGC TGGCCGACAT CGCCACGAAT GCCAAACGCG GCAGCCGCGC CGCGCCGATC 
TCGCCTATGG CGCTGGAAGC CGTCAAACGG ATCGATGCGC TGTTCGACAT CGAGCGTGAG 
ATCAACGGAC TTGCCGCCGA TCAACGCCTG GAGCACCGTC GCAAGGGCAG CCTGCCGCTT 
GTCGGCGAAC TGCACCGCTG GCTTCAAACC GAGCGGGCAA AACTGTCGCG CAGTTCTCCC 
GTCGCCGAGC CGATCGACTA CATGCTGAAG CGCTGGAACG GCTTCGAGTC TTTCCTCGAC 
GACGGCCGGA TTTGTCTCAC GAACAATGCC GCCGAGCGAG CGCTCAGGGG TTTTGCACTT 
GGAAGGAAGT CGTGGCTCTT CGCCGGATCG GATCGCGGCG CTGATCGTGC CGCCTTCATG 
GTCACGCTGA TCATGAGTGC CAAGCTAAAC GACATCGATC CGCAGGCCTG GCTTGCTGAC 
GTCCTGGCCC GCATCGCCGA CACGCCAATC AGTAAGCTGG AGCAATTGCT TCCGTGGAAT 
TGGCAGCCGC ACGGACTGAA CGCTCAAGCA GCCTAA

Protein sequence

MSDATDELPD DLASALALLA EERARRITAE AEAAIAKAQA ASAKALVSHS EALIARLKLE 
IEKVRRELYG SRSERKARLL EQMELQLEEL EADAGEDELA AEVAAKASTV RAFERKRPSR 
KPFPEHLPRE RVVIAAPASC PCCGSGKLSK LGEDITETLE VIPRQWKVIQ TVREKFTCRE 
CEKITQPPAP FHVTPRGFAG PSLLAMILFE KFAQHQPLNR QSERYGREGI DLSLSTLADQ 
VGACAAALKP LHALIEAHVL AAERLHGDDT TVPILAKGKT DTGRIWTYVR DDRPFGGQSP 
PAALYYASRD RRQEHPERHL KTFTGILQAD AYGGYNPLFK VDRDPGPLTQ ALCWSHARRK 
FFVLADIATN AKRGSRAAPI SPMALEAVKR IDALFDIERE INGLAADQRL EHRRKGSLPL 
VGELHRWLQT ERAKLSRSSP VAEPIDYMLK RWNGFESFLD DGRICLTNNA AERALRGFAL 
GRKSWLFAGS DRGADRAAFM VTLIMSAKLN DIDPQAWLAD VLARIADTPI SKLEQLLPWN 
WQPHGLNAQA A