Gene Rleg_0119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0119
Symbol
ID	8011357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	111968
End bp	113086
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	64%
IMG OID	644822710
Product	transposase IS4 family protein
Protein accession	YP_002973969
Protein GI	241202873
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.373163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATTC GTCCTGAGGT TTTGGATCAT TGGCCGGAAG TGCGCGAGCG GCTTCCGGCG 
GGTTTTGACT TGGAAGCAAC GGCGCGGTTG CGCGGTGCTT TTACGCGGGT GCGGGAAATC 
AAGAATGCCG AGACGCTGTT GCGGCTGGCA CTTGCCTATG GCGGCCTTGG CATGTCGCTA 
CGCGAGACCT GTGCATGGGC CGAAGCGGGC GGGATCGCCC GTTTGTCAGA CCCATCGCTG 
CTCGAGCGGC TGTGCAAAGC GGCGCCTTGG CTTGGCGACA TCGTGGCCGC GCTGATTGCC 
GAACAGGCCA AAGTGCCGAC GGGGCGCTTT GCGGGATATC GCTTGCGTGT GCTCGATGGA 
ACGTCGATCT GCCATCCGGG CGCTGACCGC ACGACATGGC GGTTGCATGT CGGCTACGAT 
CTGGCAACGG CTCAGGTCGA TCAGCTTGAG TTGACCGACA TCCATGGTGC CGAGAACCTT 
CAGCGCCTTA CCTACGCACC CGGCGATATC GTGCTGGCCG ATCGCTACTA TGCAAGACCG 
CGCGACCTGC GGCCGGTGAT CGACGCCGGT GCAGACTTCA TCGTGCGGAC CGGCTGGAAC 
TCGTTGCGCC TGTTGCAGAC GAATGGCGAG CCCTTTGATC TGTTTGCCGC ACTCGCCGCT 
CAGCAAGAGC AGGAAGGCGA GGTGCAGGTT CGTGTCCACG AAGGCATGAC GGGGACGCCG 
CCACCACCGC CGCTGGCCCT GCGCCTCATT GTCCGACGCA AGGATCCGCA ACAGGCCCAA 
GCCGAGCAGG AGCGTCTGCT CAAAGCCGCC CGCAAGCACG GCAAAAAACC CGATCCGCGC 
AGTCTCGAGG CGGCGAAGTA CATTCTGCTG CTGACCTCGC TGCCGGCCAC CACCTTCCCG 
CCGGCCGATA TCCTCACCCT CTATCGCTTC CGCTGGCAAA TCGAGCTGGC GTTCAAACGG 
TTCAAGAGCC TGGCCGGCCT CGACAGCTTG CCGGCCAAGA AGCCGGAACT GGCCCGGGCA 
TGGCTCTACG CCAGACTGAT CGTCGCCATC ATCGCCGAAC AGATTGCCGG GCAAGTCCCG 
GACTCTCCCC CCTCTGGATG TGGCAACCCC ACTGGCTAG

Protein sequence

MKIRPEVLDH WPEVRERLPA GFDLEATARL RGAFTRVREI KNAETLLRLA LAYGGLGMSL 
RETCAWAEAG GIARLSDPSL LERLCKAAPW LGDIVAALIA EQAKVPTGRF AGYRLRVLDG 
TSICHPGADR TTWRLHVGYD LATAQVDQLE LTDIHGAENL QRLTYAPGDI VLADRYYARP 
RDLRPVIDAG ADFIVRTGWN SLRLLQTNGE PFDLFAALAA QQEQEGEVQV RVHEGMTGTP 
PPPPLALRLI VRRKDPQQAQ AEQERLLKAA RKHGKKPDPR SLEAAKYILL LTSLPATTFP 
PADILTLYRF RWQIELAFKR FKSLAGLDSL PAKKPELARA WLYARLIVAI IAEQIAGQVP 
DSPPSGCGNP TG