Gene Smed_5789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5789
Symbol
ID	5320091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	760123
End bp	761106
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	64%
IMG OID	640777494
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001314426
Protein GI	150377831
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.844773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00122785
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGTGACA TGCAGGAACC AGTCGTCGAA GTCCGCAATC TGCGTGTGGA TTTTCCCGGC 
CGCCACGGCA CCGTAACGGC GCTGTCGGGT ATCAGCCTGT CGATTCGGCC GGGCGAAATA 
CTCGGTGTCG TGGGCGAATC CGGCGCAGGG AAATCCATGA CGGGGCTTGC CATTCAGGGT 
CTGCTCGAAG CGCCGGGCCA TATTGCCGGC GGCGAGGTCT GGCTCGGTGA GAGCCGCATC 
GATACGCTCG ACGACCGCGC CATGGAAAAG ATCCGCGGCC GCGAGATCGG CGCGATCTTT 
CAGGACCCCC TCACCTCGCT CAATCCGCTG TTCACGGTCG GCGCTCAGCT CGTCGAAACC 
ATTCGCCGGC ATCTCGGTCT TGGTAAGGCC GAAGCCCGTG CCCGCGCCGT GCAACTGCTG 
CGCGATGTCG GCATTCCTTC GCCTGAGGAC CGGGTCAACC AGTATCCGCA TCAGTTCTCG 
GGCGGCATGC GCCAGCGTGT CGTGATCGCA CTTGCGCTTG CGGCGTCGCC GAAACTCGTC 
ATCGCCGACG AACCTACCAC GGCGCTCGAC GTGTCGATCC AGGCGCAGAT CATTTCGCTC 
CTTCGCAAAT TGTGCAAGGA GAAGCAGACC GCCGTCATGC TCGTCACGCA CGATATGGGC 
GTGATCGCGG AAGCTGCCGA CCGCATTGCG GTCCTGTATG CCGGACGGCT AGTCGAGATC 
GGGCCCGTCG AGCAGGTGCT GCACCAGCCG CGCCATCCCT ATACGCAAGG TCTTATGGCT 
TCGATTCCGT CGCTGGGTGC GCGGGTCGAG AGGCTCAACC AGATCGACGG CTCCATGCCG 
CGCCTGGACG CCATACCCGA CGGCTGCGCC TTCAATCCGC GCTGCAGCAT GGCAGGTCCG 
CGCTGCCGGC GCGAGCAGCC GGAGCTTGTT TTTGCAGGCC ATAGTGCAAG CGCATGCTGG 
CTGAACGCAG GAGGCACCGC ATGA

Protein sequence

MGDMQEPVVE VRNLRVDFPG RHGTVTALSG ISLSIRPGEI LGVVGESGAG KSMTGLAIQG 
LLEAPGHIAG GEVWLGESRI DTLDDRAMEK IRGREIGAIF QDPLTSLNPL FTVGAQLVET 
IRRHLGLGKA EARARAVQLL RDVGIPSPED RVNQYPHQFS GGMRQRVVIA LALAASPKLV 
IADEPTTALD VSIQAQIISL LRKLCKEKQT AVMLVTHDMG VIAEAADRIA VLYAGRLVEI 
GPVEQVLHQP RHPYTQGLMA SIPSLGARVE RLNQIDGSMP RLDAIPDGCA FNPRCSMAGP 
RCRREQPELV FAGHSASACW LNAGGTA