Gene Smed_5134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5134
Symbol
ID	5319436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	87054
End bp	88058
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	58%
IMG OID	640776912
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001313844
Protein GI	150377249
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.67454
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGTT TTCGACGGAA GTTGACGACT TCCGCAGTCG CGGCGACCTG GAGCTTGATC 
GCATCGACGG CGGGCGCCCA GACCGTGCTC AAGGCATCGC ACCAGTTTCC CGGCGGGAAG 
GGTGACATTC GCGACGAGAT GGTGCAGTTG ATCGCCCGCG AGGTCGCCGC CGCCAATGTC 
GGCCTCGAGA TCCAGGTTTT CCCAGGTTCA TCGCTGTACA AGCCGAATGA TCAGTGGAAT 
GCGGTCACAC GTGGCCTGCT TGATATGACT TCGTTTCCGC TGGACTACGC TTCGGGCCGC 
CATCCGGAAT TCTCCGCAAC GCTCATGCCC GGCCTTGTTG GCAATTTCGA TCGCGCGATG 
CGGCTGAACG ATTCGGAGTT CATGGGAGAC ATAAAGAAGG TCATCGAAGA TGCCGGCGCT 
TTGGTGATCG CCGATGCGTG GCTCTCCGGT GCATTCGCTT CGAAGAAGAG TTGCATCACA 
TCTCCCGACA CCATCAAGGG ACAGGTGATC CGCGCCGCCG GGCCGGCCTT CGAGGAGATG 
CTTGTGGAAG CCGGCGCCTC GATTTCATCC ATGCCTTCGT CGGAAATCTA CACCGGCATG 
CAAACGGGCG TTTTGGATGC CGCGAATACA TCGTCGGCGA GTTTCGTGTC CTATCGACTG 
TTCGAACAGG CAAAGTGCCT GACGGCTCCG GGAGAAAATG CCCTCTGGTT CATGTACGAA 
CCGGTGCTGG TCTCCAAGCG CGTCTTCGAC GGCCTGACGG AAGAGCAGCA AAAGGCGATG 
CTCGCTGCAG GCGAGAAAGC AGAGGCCTAC TTCAACGAAG AGGTCCGCAA GGGCGATCAG 
GTCATGATCG ATACCTACAA GAAGGCAGGC GTCGAAGTCG TCGAGATGTC GAAGGAGGAT 
TACGATGCCT GGCTCGCGCT TGCCAAGAAG TCTTCCTACA AGAACTTTGC CGCCAACGTC 
ACCGACGGCG ACAAGCTGAT CGAAAAGGCG TTGGCCGTGA AGTAA

Protein sequence

MSSFRRKLTT SAVAATWSLI ASTAGAQTVL KASHQFPGGK GDIRDEMVQL IAREVAAANV 
GLEIQVFPGS SLYKPNDQWN AVTRGLLDMT SFPLDYASGR HPEFSATLMP GLVGNFDRAM 
RLNDSEFMGD IKKVIEDAGA LVIADAWLSG AFASKKSCIT SPDTIKGQVI RAAGPAFEEM 
LVEAGASISS MPSSEIYTGM QTGVLDAANT SSASFVSYRL FEQAKCLTAP GENALWFMYE 
PVLVSKRVFD GLTEEQQKAM LAAGEKAEAY FNEEVRKGDQ VMIDTYKKAG VEVVEMSKED 
YDAWLALAKK SSYKNFAANV TDGDKLIEKA LAVK