Gene Smed_4748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4748
Symbol
ID	5319147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1269479
End bp	1270456
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	58%
IMG OID	640776546
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_001313478
Protein GI	150376882
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00048921
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00325994
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAATCC TGGTAAAACT GGCGGCGGGT CTAGTAGTCG CCGCTGCATT CATGGGCAAT 
GCAGCCAACG CCCAGACGGT GCTGCGCTCA TCCGACACGC ATCCGGACGG CTATCCGACG 
GTCGAGGCGG TCGAGTACTT CGGTGAGCTG GTCAAGGAGC GTACGGCCGG CCGCTACTCC 
GTCGAGGTCT ATCACTCCGC GCAACTCGGG GAGGAAAAGG ACACGATCGA GCAGGTGCGT 
TCCGGCGTCA TCGAGCTGAA CCGCGTCTCG ATGGCCCCCT TCAACGGTAC GGTGAAGGAA 
TCGATCGTTC CGGCGCTTCC CTACCTCTTC CGTTCGGAAG AGCACATGCA CAAGGTGATG 
GACGGGGCGA TCGGCGACCA GATCAAGACG GCCTTCGAAA GCGCCGGAGT GGTGGTGCTC 
GCCTTCTATG ACGCTGGCGC GCGTTCCTTC TACAACAAAC AGAAGCCGAT CAGTTCGGTT 
GCCGACATGA AAGGCTTGAA GTTCCGCGTG ATCCAGTCCG ACATCTTCGT GGACATGGTG 
GCCGCGCTCG GGGCGAACGC TACGCCCATG CCTTACGGTG AAGTCTATTC CGGAATCGAA 
ACGGGCGTCA TCGACGGCGC GGAGAACAAT TTTCCAAGCT ACGACACCGC CAAGCATTTC 
GAAGTTGCCA AGAACTATTC GCTCGACGAA CACACCATCC TTCCGGAGGT ATTCGTCATG 
AACAAGGCCG TCTTCGATAA ACTCACGCCG GAAGATCAGG AGATATTCAA GCAGGCCGCA 
AAGGACAGTG TCGCCAAACA GCGCGAGCTC TGGGCTGCCA AGGTCAAGGA GTCGCGTGGG 
AAGGTCGAAG CGGCCGGCGC GCAGATCACC ACACCCGAAA AGCAGGGTTT CATCGATGCA 
ATGAAGCCGG TCTACGAAAA GCACGTTACC GATGCCGTCC TGAAGAAAAT GGTTGAGGAC 
GTGCGCGCGG TACAGTGA

Protein sequence

MKILVKLAAG LVVAAAFMGN AANAQTVLRS SDTHPDGYPT VEAVEYFGEL VKERTAGRYS 
VEVYHSAQLG EEKDTIEQVR SGVIELNRVS MAPFNGTVKE SIVPALPYLF RSEEHMHKVM 
DGAIGDQIKT AFESAGVVVL AFYDAGARSF YNKQKPISSV ADMKGLKFRV IQSDIFVDMV 
AALGANATPM PYGEVYSGIE TGVIDGAENN FPSYDTAKHF EVAKNYSLDE HTILPEVFVM 
NKAVFDKLTP EDQEIFKQAA KDSVAKQREL WAAKVKESRG KVEAAGAQIT TPEKQGFIDA 
MKPVYEKHVT DAVLKKMVED VRAVQ