Gene Smed_3836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3836
Symbol
ID	5318544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	291530
End bp	292501
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	60%
IMG OID	640775648
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_001312581
Protein GI	150375985
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0128517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG GATTGATTTC GCTCGCGCTT GCGGGGCTGC TCATGGCTTC GCAAGCCATG 
GCTCAAGAGG CGCGCACGCT GCGCCTGGGG ATGCAAGGCA CGGCCGGGGA CCCGCAATTC 
GAGGGTGTCA CCGAGGCCGC GCGCATCATC AAGGAAAAGT CCGGCGGTCG GCTGACGCTG 
GAAATCTTCC CCAATTCGCA ACTCGGCACC TTTACCGAGA TGATGGAGCA GGTGACACTC 
GGCGAACTCG ACTTCACGCT CAATCCATTC GGGGGCATGG ATGCCTGGGT TCCCCGGGCC 
GTGTTGGCGA GTACTGCCTA TGTCGTCGGC GACTTCGAGC ATCTTCAAAA GATCATCGCC 
TCGGACTGGG GCAAGGGGAT CGTCGACGAA TTGCGAACCG AGCACAAGTG GCGCATGGTC 
GACTCCTGGT ATTTCGGAAC GCGGCACACG ACGGCAAAGA AGCCCATCGA AAAGCCTGCG 
GATTTCAACG GCATGAAGCT GCGCGTACCG AATTCCGCGC CGCTTCTGAC CTGGGCGAAG 
GCAATGGGCG CGAGCCCGAC CCCGGTCGCG TTCGCCGAAG TCTATCTGGC GCTCCAGACC 
AATCAGGTGG ATGGTCAGGA AAACCCGCTG CCGATCATCG ACTCGATGAA ATTCACCGAG 
GTGCAGACCC ATGTTTCGTT GACCGGGCAT CTGGTGCAGG ACCAGGTCGT CCTCATGTCG 
GAGGATACGT GGAATGCGCT TGATCCCTCC GATCAGAAAC TCGTCATGGA GGCATTCGAG 
GCTGGCGGGG CCCTCAACGA CAAGCTGGTT GCCAATAAGG AAACGAGTCT CGTCAGCGAT 
TTTCGTGAGC GCGGAATCAC CGTGGTCGAA CCCGACAAGG CAGCTTTCCA GGAGGCGATG 
AAGCCCGTCT ATGCCGATCT CGATGCGAGG TTCGGCGCGG GCACGGTACA GACGCTGCTC 
GATCTCCGAT AA

Protein sequence

MKKGLISLAL AGLLMASQAM AQEARTLRLG MQGTAGDPQF EGVTEAARII KEKSGGRLTL 
EIFPNSQLGT FTEMMEQVTL GELDFTLNPF GGMDAWVPRA VLASTAYVVG DFEHLQKIIA 
SDWGKGIVDE LRTEHKWRMV DSWYFGTRHT TAKKPIEKPA DFNGMKLRVP NSAPLLTWAK 
AMGASPTPVA FAEVYLALQT NQVDGQENPL PIIDSMKFTE VQTHVSLTGH LVQDQVVLMS 
EDTWNALDPS DQKLVMEAFE AGGALNDKLV ANKETSLVSD FRERGITVVE PDKAAFQEAM 
KPVYADLDAR FGAGTVQTLL DLR