Gene Smed_3691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3691
Symbol
ID	5318809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	132330
End bp	133301
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	60%
IMG OID	640775504
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001312437
Protein GI	150375841
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.687432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACATC CTGATGTCAT CGGATGCGAT ATTGCAAAAG CGCATCTAGA TTTTTTCGAC 
AGCGGCCTTG AGCGCCATTT CCGTATCGAC AACACTCCGG CCGCAATTTC CGCGTGGCTC 
GACGGCCTTG ATGGCAGAGG CGTTCATATC GTCTTTGAGG CGACCGGGCG TTACGATCGG 
CAGTTGCGCA TAGCCCTGGA GACCCGGGAG TTGCCCTATT CCCGCGTCAA TCCTGCCCGC 
GCCCGCGACT TTGCCAAGGC GATCGGCCTT CTTGCCAAGA CGGATGCGAT CGATGCACGT 
CTGCTTGCCC GGATGGGTCA AAGCCTGCCA CTCTCAACTC AGGCGCCTGA CGATCCCGCC 
CGCCACGTGC TCGCCCGCCT TCACACGCGG CGTGACCAGC TCGTGGCCAT GCGCCAGCAA 
GAGCGGACAC GCCTTCATGA GACCGAGGGG ATCGAGCGTG ACAGTGCTGA AAGCCATATG 
GCTTGGCTCG ACGCGGAGGT TGCGCGCATC GAAATGGCAT GCCGTGATGT TCTGAAGGCC 
GAGAAGACCT TGCAAGAACA AGAGGCAAGG CTGCGTTCCA TTCCCGGCAT CGGCCCCGTG 
GCCGCATTGA CCCTGATCGC GCATATGCCA GAACTCGGCA ATCGTTCGGC CAAGGCGATT 
GCAGCCCTTG CCGGTCTTGC GCCCTTCAAT GTCGACAGCG GCACGTCACG GGGAAAGCGG 
CATATACGCG GCGGTCGCAA GCGGATACGT GACGCGCTCT ACATGGCGGC GCTCACAGCC 
AGCCGTATGC CCCGTGCTTT TAAGTCCCAT GCTGACCAAA TGAAGGAGGC AGGCAAGCCC 
TTCAAGGTCC GTCATCATTG CGCTTGCCCG CAAATTGCTC GCCATCGCAA ACGCCATCAT 
CAGGGACAAA ACAACCTTCC GACGAACCAC CTGACAAACA CAGTTGCCAG CCAGACCAAG 
TCCTTGGGCT GA

Protein sequence

MIHPDVIGCD IAKAHLDFFD SGLERHFRID NTPAAISAWL DGLDGRGVHI VFEATGRYDR 
QLRIALETRE LPYSRVNPAR ARDFAKAIGL LAKTDAIDAR LLARMGQSLP LSTQAPDDPA 
RHVLARLHTR RDQLVAMRQQ ERTRLHETEG IERDSAESHM AWLDAEVARI EMACRDVLKA 
EKTLQEQEAR LRSIPGIGPV AALTLIAHMP ELGNRSAKAI AALAGLAPFN VDSGTSRGKR 
HIRGGRKRIR DALYMAALTA SRMPRAFKSH ADQMKEAGKP FKVRHHCACP QIARHRKRHH 
QGQNNLPTNH LTNTVASQTK SLG