Gene Smed_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1941
Symbol
ID	5322800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1992834
End bp	1993973
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	60%
IMG OID	640790879
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001327610
Protein GI	150397143
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.49323
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.352115
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACACA AAGCCGAGAT CGGGGAATCG TCGCGTCGGA AATTCCTGCG CGGCGCAGCA 
GTGGCCGGAG CGGCCATGGT TGCAGCGCCG AGTATCGTCA GGGCACAAGG GCCGATCAGC 
ATGCGCTGGC AGAGCACCTG GCCATCCAAA GACATCTTTC ACGAGTTCGC GCTCGACTTC 
GCCAAGAAAG TCAACGACAT GACGGGGGGC GACCTTAGAA TAGAGGTGCT TCCGGCCGGT 
GCCGTCGTGC CGGCATTCGG ACTGCTCGAC GCGGTGTCCG AAGGAACGCT CGACGGCGGC 
CATGGCGTGA TGGTCTATCA CTACGGCAAG CAGACGGCGC TGGCACTATG GGGATCGGGA 
CCAGGCTTCG CCATGGATGC CAACATGATG CTGGCGTGGC ACAAATATGG CGGCGGCAGG 
GACCTGCTCG CAAAACTCTA CGAGTCCATA GGCGCAAATG TCGTATCGTT CCCCTACGGG 
CCCATGCCGA CACAGCCGCT GGGCTGGTTC AAGGAGCCGA TCGCCAAGGC CGAGGATCTG 
AAAGGATTGA AGTTCCGCAC CGTCGGTATC TCGATCGACG TGTTCACCGG GCTCGGCGCG 
GCGGTAAACG CCCTGCCGGG CGGTGAGATC GTGGCGGCAC TCGATCGCGG ACTGCTCGAC 
GCTGCGGAAT TCAACAATGC TTCGTCCGAT CGACTGCTGG GCTTTCCCGA CGTTTCGAAG 
ATCTGCATGC TGCAAGGCTA TCATCAAAAC GCCGAGACGT TCGAGATCCT TTTCAACAAG 
GGAAAATTCG AGGGCCTGCC AGACCAGTTG AAGGCAATCA TAACCAACGC GGTGGACGCG 
GCTTCGGCAG ACATGGCCTG GAAGGCGATC GACCGGTATT CGACCGACTA TCGCGAGTTG 
CAGTCGGCCG ACAAGGTCAA ATTCTACAAG ACTCCCGAGG CCATCCTGAA GCGGCAGCTC 
GAGGTCTATG ACGAGGTCGT GAAGAGGAAA TCCTCGGAAA ATCCAGTGTT CAAGGAGGTC 
CTGCAATCCC AGATCACTTT TGCCGAACGC GCAACCCGCT GGGAGCAGGA TACGGTCGTC 
AACCGAAGGA TGGCCTTCGA TCATTATTTC GGGCCGGAGG GGGTCGCCAA GTCGCTCTGA

Protein sequence

MKHKAEIGES SRRKFLRGAA VAGAAMVAAP SIVRAQGPIS MRWQSTWPSK DIFHEFALDF 
AKKVNDMTGG DLRIEVLPAG AVVPAFGLLD AVSEGTLDGG HGVMVYHYGK QTALALWGSG 
PGFAMDANMM LAWHKYGGGR DLLAKLYESI GANVVSFPYG PMPTQPLGWF KEPIAKAEDL 
KGLKFRTVGI SIDVFTGLGA AVNALPGGEI VAALDRGLLD AAEFNNASSD RLLGFPDVSK 
ICMLQGYHQN AETFEILFNK GKFEGLPDQL KAIITNAVDA ASADMAWKAI DRYSTDYREL 
QSADKVKFYK TPEAILKRQL EVYDEVVKRK SSENPVFKEV LQSQITFAER ATRWEQDTVV 
NRRMAFDHYF GPEGVAKSL