Gene Smed_4968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4968
Symbol
ID	5318031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1481710
End bp	1482687
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	59%
IMG OID	640776750
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001313682
Protein GI	150377086
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.565249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0876264
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACCC TGATCGCTGC GGCCGCAATG GCTGCCCTGT CGTTCTGCGG CATTGCCAGT 
GCGCAGGAAT ACAGCCTGCG GTTCTCGACC TCGCAGGTGA ATCCGAACGA GCCGATCATC 
AAAGCGATGA AGACTTACGC CGAGCGTGTT GGTGAACGCT CCGGCGGGCG AATCGCGATC 
ACCGTGATGA CGGGTGATCA GCTTGGTGCG CAAAAGAAGG TCAACGAGAT GGTCATGAGC 
GGCGCGAGTC TGCTCAGTGC CACCGACTAT GGTCAGCTTG GCCAGTTCGT TCCGGATCTG 
TCTATCCTTG CCGGTCCCTA TGTCTATCCG GATCTGGCCG CGACGGAGCG CCTCTTCGCA 
TCGGATCTCT ACAAGGAACT TTCCGGCAAG CTGGAAGCGC GTGGTATCAA GATCATCATG 
CCGAACGGCC TCTTCGGCTA CCGTCACATC ATTTCCAACA AGCCGGTTCG CTCGCCGGCT 
GATCTCGCCG GCGTGACCAT TCGCGTACCC TCGTCGCCGA TCATGATGGC GACCTTCGGC 
AACTACGGCG CAAGGCCGAC GGAATTGCCG TGGGGGGACG TCTACAATGC GCTTCAGACC 
GGCGTCGTCG ACGCAGCCGA AGGGCCTTTC GGCTCAATAG CCGGGGCGAA ATTGAACGAG 
ACCCGCAAAG TCATTTCGAA GACCGGCCAT CAGATCATGT TCACCGCCTG GGTAGCCTCC 
AGCCAGTTCT TCAACGGCCT TCCCGAAGAC CTTCAAAAGA TCCTCCTCGA GGAAGGGCGG 
GCGATCGCCA GTGAATTGAC GCAGATGACA CTGGAAACGG ATGACGCCTA TGCAAAGCAG 
CTCTCTGCCT CCGGCGTCGA GATCGTGACC GATGTCGACA TTCCGGCTTT CATCGAGGCC 
TCCCGGGCCG CCTACGACAA GGTTCCGAAT ATAACGCCCG GCATCTACGA GCAGGTACAG 
AAGGCGATGA AGCAATAA

Protein sequence

MKTLIAAAAM AALSFCGIAS AQEYSLRFST SQVNPNEPII KAMKTYAERV GERSGGRIAI 
TVMTGDQLGA QKKVNEMVMS GASLLSATDY GQLGQFVPDL SILAGPYVYP DLAATERLFA 
SDLYKELSGK LEARGIKIIM PNGLFGYRHI ISNKPVRSPA DLAGVTIRVP SSPIMMATFG 
NYGARPTELP WGDVYNALQT GVVDAAEGPF GSIAGAKLNE TRKVISKTGH QIMFTAWVAS 
SQFFNGLPED LQKILLEEGR AIASELTQMT LETDDAYAKQ LSASGVEIVT DVDIPAFIEA 
SRAAYDKVPN ITPGIYEQVQ KAMKQ