Gene Smed_6199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_6199
Symbol
ID	5320501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	1122133
End bp	1123782
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	60%
IMG OID	640777815
Product	transposase IS66
Protein accession	YP_001314747
Protein GI	150378152
COG category	[L] Replication, recombination and repair
COG ID	[COG3436] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.07824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGAGG CTGAGATCGC GCGGTTGGAG GCGGTTGAGA AGAGCGCCAA CGAGCGGATT 
GCCAACCTGA CCTTGATCAT GAAGGTTTTG CAGCGCACGC AAAATGGCAA GCGCTCTGAG 
CGGCTCCGCC TCGAGGTCAA TGACGAGCAG GTGTCCTTTG CCTTCGAAGA GGTCGAAACC 
GGCCTATCGG CAATCCGCAG CGAACTCGAT CGCGCAGCCA AGGACAAGCC GAAGCGAGCG 
CCGCGTCCGC GCAAGGGTTT TGCCGCCCAT CTCGAGCGCA TCGAAGAGGT CATCGAGCCG 
GAAATCCCGG CCGGGTGCGA GGGGCTGGCA AAGGTTCTGA TCGGAGAGGA CCGCTCCGAG 
CGGCTGGACG TCGTGCCGCC GAAGTTCAGG GTTATCGTGA CGCGTCGCCC CAAATACGCT 
TTCCGGGGCA GCGACGGCGT GGTCCAGGCC CTGGCGCCGG CACACATCAT CGAAGGCGGC 
CTGCCGACGG AACGGCTGCT CGCCTATATC GCCGTTTCCA AATACGCCGA TGGCCTTCCT 
CTCTATCGGC AGGAAGCGAT CTATTTGCGT GATGGCGTCG AGATCAGCCG ATCGCTGATG 
GCCCAATGGA TGGGGCATCT GCGCTTCGAA CTGCAGATGC TGGCCGATTA TATTCTGGAG 
AGGGTCAAGG AGGGCGAAAG GATCTTTGCC GACGAGACGA CCCTACCCAC TCTTGCGCCC 
GGTTCGGGCA AAACCACCAA GGCCTGGCTT TGGGCTTACG CACGCGACGA CCGCCCCTAT 
GGCGGAACCA GTCCGCCGAT GGTGGCCTAT CGATTTGAAA ACAGCAGAGG TGCGGATTGC 
GTGACGCGTC ATCTCTCCGG ATTCACCGGC ATCCTGCAAG TGGATGGCTA CTCGGCCTAT 
ACTAATCTCG CCAAGACGCG GGCCAAAACC GGCAGCAACG AAACGGTCCA GCTTGCAGGA 
TGTTGGGCAC ATCTACGGCG CAAGTTTTAT GACCTGCACA TCAGTGGAGT CTCGCAGGCC 
GCCACAGACA CTGTCCTGGC AATGACCGAG CTCTGGCGCA TCGAGGATGA AGTTCGCGGT 
AAGGATGCCG ACAGCCGCGC GGCCCGGCGC CAGGAGAAAT CCTCGACCAC CGTCGCCAGC 
CTCTTCGAGC TCTGGGAAAA GGAACTGGGC AAAGTCTCGG GAAAATCCAA AACCGCCGAG 
GCGATCCGCT ACGCGCTCAC CCGGCGCGAG GCGCTGGAGC GCTTTCTGAC GGACGGTCGC 
ATCGAAATCG ACTCCAACAT CGTCGAACGG GCGATCAGGC CCCAAACGAT TACGAGAAAG 
AATAGCCTAT TCGCCGGCAG CGAGGGCGGT GGACGAACTT GGGCGACGGT GGCCACCTTG 
TTGCAGACGG CATTATGCCG CGCGCGGCAT AAGGCGGTTT ATGCCGACCG GCGAACTATG 
CCGAGCACCT GCTCCAACAT ACCATTTGAA ACGCGCTTTT CTCGCCGTTT CCGCTGGAGA 
TTTGTTGTAG GCACTCGGCA TAGTTCTCAT GCTCAGAGGG CATTCAGGAA TTCCAGAAGC 
CGGTCGCTTG GTCGAAATCG CTCGGCCTTG GCGCGTTCGT ACGGCTTCAG CTTTGCGAGC 
GCGGATTCCT TCAGTTCAAG ATGTGCATGA

Protein sequence

MAEAEIARLE AVEKSANERI ANLTLIMKVL QRTQNGKRSE RLRLEVNDEQ VSFAFEEVET 
GLSAIRSELD RAAKDKPKRA PRPRKGFAAH LERIEEVIEP EIPAGCEGLA KVLIGEDRSE 
RLDVVPPKFR VIVTRRPKYA FRGSDGVVQA LAPAHIIEGG LPTERLLAYI AVSKYADGLP 
LYRQEAIYLR DGVEISRSLM AQWMGHLRFE LQMLADYILE RVKEGERIFA DETTLPTLAP 
GSGKTTKAWL WAYARDDRPY GGTSPPMVAY RFENSRGADC VTRHLSGFTG ILQVDGYSAY 
TNLAKTRAKT GSNETVQLAG CWAHLRRKFY DLHISGVSQA ATDTVLAMTE LWRIEDEVRG 
KDADSRAARR QEKSSTTVAS LFELWEKELG KVSGKSKTAE AIRYALTRRE ALERFLTDGR 
IEIDSNIVER AIRPQTITRK NSLFAGSEGG GRTWATVATL LQTALCRARH KAVYADRRTM 
PSTCSNIPFE TRFSRRFRWR FVVGTRHSSH AQRAFRNSRS RSLGRNRSAL ARSYGFSFAS 
ADSFSSRCA