Gene Smed_5788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5788
Symbol
ID	5320090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	759140
End bp	760126
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	64%
IMG OID	640777493
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001314425
Protein GI	150377830
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.00267087
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGAAAC CGCTGCAAAA GACGCCGGCA TTGACCGTTG ACCACCTGGT CAAGACATTC 
GATGTGTCCG CTCCCTGGCT CAACCGTGTG GTGGAGCGCA AGCCCCGGCA GTATCTGCAA 
GCCGTGAACG ATATCAGCTT CACCGTGCCC GCCGGGGGCT GCCTCAGCAT CGTCGGCGAG 
AGCGGCTGCG GAAAATCCAC CGTTGCCCGC CTTGTCACCG GCCTGCACCG TCCGACCAGC 
GGCGCAATGC GCTTCGCGCC CGGAAAGAGC GGCGCGGCCC TTTCGGCGCA GATGATCTTT 
CAGGACCCCT ACGCCTCGCT CAACCCGCGA TGGCGGGTGA AGAATATCGT TGCCGAACCG 
CTGCGCGAAA TGAAGCTGCG CAAGACCGCC GCCGAAGTCA CCGAGCGTGT GGAAGAGCTT 
CTGCACACGG TCGGGCTATC GCCATCCGAC GGTGAGAAGT TCCCGCACGA ATTTTCCGGT 
GGTCAGCGCC AGCGCATCTC GATCGCGCGC GCGCTGGCAA GCGAGCCGGA ATTCCTGGTC 
TGCGACGAGC CGACCTCGGC GCTCGACGTG TCGGTGCAGG CACAGGTGCT TAACCTGATG 
CGCCGTTTGC AGGACGAACT GGGGCTGACC TATCTCTTCA TCAGCCATGA TATGAGCGTC 
GTTCGCCAGA TGTCGGACCG CATCGCGGTG ATGTATCTGG GCCGCATCGT GGAGGAGGGC 
GACACGGAGC AGCTGTTTGC CGAGCCGCGT CATCCCTACA CGCAGCTCCT GCTGCAGACG 
ATTCCGAACA TCGCGGCGCC GAACCGCAAC CGGGAGCCCG CCAGCGGCGA AGTGCCGAGC 
CCGCTGAAGC CGCCGTCCGG CTGTGCCTTC CACCCGCGTT GCCCGGTGGC CATCGGGCGC 
TGCTCCAAGG AAGTGCCTGA GGTGCGGGTC TTGCCCAACG GTACCCGTGT GACCTGTCAT 
CTGGTTGAGG ACGGGTTAGC GAAATGA

Protein sequence

MTKPLQKTPA LTVDHLVKTF DVSAPWLNRV VERKPRQYLQ AVNDISFTVP AGGCLSIVGE 
SGCGKSTVAR LVTGLHRPTS GAMRFAPGKS GAALSAQMIF QDPYASLNPR WRVKNIVAEP 
LREMKLRKTA AEVTERVEEL LHTVGLSPSD GEKFPHEFSG GQRQRISIAR ALASEPEFLV 
CDEPTSALDV SVQAQVLNLM RRLQDELGLT YLFISHDMSV VRQMSDRIAV MYLGRIVEEG 
DTEQLFAEPR HPYTQLLLQT IPNIAAPNRN REPASGEVPS PLKPPSGCAF HPRCPVAIGR 
CSKEVPEVRV LPNGTRVTCH LVEDGLAK