Gene Smed_5077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5077
Symbol
ID	5319379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	23806
End bp	25455
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	63%
IMG OID	640776857
Product	ABC transporter related
Protein accession	YP_001313789
Protein GI	150377194
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.704503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGT CGGACAAGCC AATACTGCGT ATCGACGGCC TGACGGTGGA CTTCCTGTCC 
GAAGGTGATC CGGTGCGCGC CGTGGACAAT GTCTCGTTCG ATGTCTGCCC GGGCGAGACG 
CTCGTCATCC TCGGCGAGAG CGGATCGGGC AAGAGCGTCA GCACCGGTAC GGTGATGGGG 
CTGATCGATT GCCCCCCGGG CGACATCGTT TCGGGCACCC TGGTATTCGA CGGGACCGAT 
CTTTCCCGCC TCGACAACGA AGGCAGGCGT GAACTGAACG GTCGCCGTAT CGCCATGATC 
TTCCAGGACC CGCTCGCCTA TCTCAATCCG GTCTATACTG TCGGCCGGCA GATCGCCGAG 
GTTTTCGAAA GCCATGGCGC AGGCGAGGGC GGGGCGATGC GCGGAAGAGT CGTGCGCCTG 
CTGGAACGGG TTGGGATCCC GGAAGCGGAA ACGCGGGTCG ATTACTATCC GCACCAGTTC 
TCCGGCGGAC AGAGGCAACG CGTGATGATC GCGATGGCGA TTGCGCTCGA ACCGGACATT 
CTGATCGCCG ACGAGCCGAC CACCGCGCTC GACGTCAGTG TCCAGGCGCA GATCCTCGAC 
CTTCTGCGGG ACCTGCAGCG CGAAACCGGA ATGGCGCTGA TCATGATCAC CCACGATCTG 
GAGGTCGCCG CGGCCATGGC GGACCGGATC ATCGTGATGA ATGCCGGCAA GGTGGTGGAG 
AGCGGCAGGG CCGAGGATGT CTTCACCAAT CCGCGCCACA GCTATACCCG CCGGCTGATG 
TCGGCGGTGC CTCATGGCGA CCCAAAGAAG CGAAGCCGGC CTGTCGAACA GGAGGTCCTG 
CTGCAGGTCG CCCATCTGAG CAAGCACTAT AAGCTCGGCT CCGGCCCGTT TGCGCCCAAA 
CGCGAGTTCA AGGCAGTGGA CGATGTGAGC TTTACGCTTC GTCGCGGCGA AACGGTCGGC 
ATCGTCGGAG AGTCCGGTTC GGGTAAATCC AGCATTGCGC GCATGCTGCT GAGGCTCAAC 
GAGCCGACAT CGGGCTCGGC GCTCTTTGCC GGCGAGGACA TCTTCAAGCT CGAGGGCAGG 
GCGCTCAACG GATTTCGCCG GAAAGTGCAG ATGGTGTTTC AGGATCCGTT CGGCTCGATG 
AACCCGCGCA TGAACGTCCG TTCGATCATT TCAGAACCCT GGGCGATCCA CCGGGATATC 
CTGCCGCGCC AACGCTGGAA CGAACGGGTC GTTGAACTGC TGGAGCTTGT CGGCCTGAAG 
CCGGAGCATG CGGAGCGCTA TCCGCATCAA TTTTCGGGCG GGCAGCGGCA ACGCATCGCC 
ATTGCCCGGG CGCTCGCCAG CGAACCCGAG CTCATCGTCT GCGACGAAGC GGTCTCGGCG 
CTCGACGTGT CGATCCAGAT GCAGGTCATC GAACTCCTGG CCGATCTCCG CCAGCGCCTC 
GGCCTCTCCT ACATCTTCAT CACCCATGAT CTGCCCATCG TGCGTCAATT CGCAGACCGG 
ATCCTGGTGA TGCAACGAGG CAAGATCGTC GAGGAGGGTG AGACGGAAGC TCTTTTCGTC 
TCGCCTCGGC ACGAATACAC GCGAGCCCTG CTGAACGCCG TCCCCCAACC GAAATGGCTG 
CAGCGCGATC CGACCCCGCT CGCGGGGTAG

Protein sequence

MTASDKPILR IDGLTVDFLS EGDPVRAVDN VSFDVCPGET LVILGESGSG KSVSTGTVMG 
LIDCPPGDIV SGTLVFDGTD LSRLDNEGRR ELNGRRIAMI FQDPLAYLNP VYTVGRQIAE 
VFESHGAGEG GAMRGRVVRL LERVGIPEAE TRVDYYPHQF SGGQRQRVMI AMAIALEPDI 
LIADEPTTAL DVSVQAQILD LLRDLQRETG MALIMITHDL EVAAAMADRI IVMNAGKVVE 
SGRAEDVFTN PRHSYTRRLM SAVPHGDPKK RSRPVEQEVL LQVAHLSKHY KLGSGPFAPK 
REFKAVDDVS FTLRRGETVG IVGESGSGKS SIARMLLRLN EPTSGSALFA GEDIFKLEGR 
ALNGFRRKVQ MVFQDPFGSM NPRMNVRSII SEPWAIHRDI LPRQRWNERV VELLELVGLK 
PEHAERYPHQ FSGGQRQRIA IARALASEPE LIVCDEAVSA LDVSIQMQVI ELLADLRQRL 
GLSYIFITHD LPIVRQFADR ILVMQRGKIV EEGETEALFV SPRHEYTRAL LNAVPQPKWL 
QRDPTPLAG