Gene Smed_6239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_6239
Symbol
ID	5320541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	1160267
End bp	1161385
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	61%
IMG OID	640777841
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001314773
Protein GI	150378178
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.900844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAAG ATAGCGTCAT TTTCATCGGC CTGGATACTT CGAAGCTGAA GATTTCTGTG 
GCGATAGCCA ATGGAAGCCG CAACGGCGAG GTACGGTTTT TCGGCGACAT TTCCTCGGAG 
CCGGCATCAG TAGCATCGAT GGTCAGCAAG CTTTCCAAGC GCGGAGCTAA GCTTCACTTT 
TGCTATGAAG CTGGTCCCAC GGGTTACGGT CTTTACCGGC AGATTGTCGA ACTGGGGCAT 
GATTGCGTGG TCGTGGCGCC GTCACTGGTA CCCAAGCGTG CGGGCGATCG GGTGAAGACA 
AACCGCCGGG ATGCCATGAG TCTGGCGCGC CTGCACCGGG CGGGCGAACT GACCGCGGTC 
TGGGTCCCAG ATGAAGGCCA TGAGGCGATC CGCGATCTGG TGCGGGCGCG TGAGGCGGCC 
AGCGACGCGC TGAAGCAGGC CCGTCAGCAA CTTCAGTCCT TCTTGTTGCG TCATGGCAGG 
ATCTATGCCG GCCGCGAACC ATGGACGCGT GCCCATCGAA GATGGCTAAC GTGCCAGGCC 
TTCGATCATC CCGCCCACCA AATCCTGCTG GCGGAATATT GCCAGGCTGT CGCGGATGCC 
AGCGTGCGCC TGGATAGGCT GACCAAGCTG GTCGTCGAGA CCGCGGCATC CTGGTCAATG 
GCGCCGGTTG TGGCCGCCTA CCAGGCGATG CGCGGCGTCG CGTTCATGAC GGCGGTCACC 
TTTGTCGTCG AAATCGGCGA TGTCAGGCGC TTTGATAATC CTCGCCAGCT GATGGCGTAT 
CTCGGTCTCG TGCCGTCGGA AAGCTCAACC GGCGAACGGG TCAAGCGTGG CGGGATCACG 
AAGGCGGGCA ACACAAGAGC TCGAAGGGTA CTCATTGAGG GCGCTTGGAC ATATCGCTTT 
CCGGCCCGCG TGAGCCCAAA GATCCAGGCG CGGCTGGACG ACCTGCCAAG AACGGTTCGC 
GAGATTGCTT GGAAAGCCCA GGTAAGGCTT TGCGCACGCT ATCGAAAACT ACTCGCGGCA 
GGCAAGCCGA AGGTCGTCGC GGTTACCGCC ATTGCGCGAG AAATGGCAGC GTTCCTATGG 
GCGATCGGGC AGGAGATCGC TCCCACAGCA AAAGCCTAA

Protein sequence

MKEDSVIFIG LDTSKLKISV AIANGSRNGE VRFFGDISSE PASVASMVSK LSKRGAKLHF 
CYEAGPTGYG LYRQIVELGH DCVVVAPSLV PKRAGDRVKT NRRDAMSLAR LHRAGELTAV 
WVPDEGHEAI RDLVRAREAA SDALKQARQQ LQSFLLRHGR IYAGREPWTR AHRRWLTCQA 
FDHPAHQILL AEYCQAVADA SVRLDRLTKL VVETAASWSM APVVAAYQAM RGVAFMTAVT 
FVVEIGDVRR FDNPRQLMAY LGLVPSESST GERVKRGGIT KAGNTRARRV LIEGAWTYRF 
PARVSPKIQA RLDDLPRTVR EIAWKAQVRL CARYRKLLAA GKPKVVAVTA IAREMAAFLW 
AIGQEIAPTA KA