Gene Smed_3743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3743
Symbol
ID	5318733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	186893
End bp	187885
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	63%
IMG OID	640775556
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_001312489
Protein GI	150375893
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.397744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAACT TTCTGAAACA TGGCCGGATA ACCGGCGCCA TGCTGGGGGC CGCTTTATTG 
ACAGGCGCCG CCTCGGCAAC CGAATTGCGC TATGCGCATG TGGGCGCCGA GGGAGACATC 
CAGACGGTTT ACGCCGCACA GGCGGCGGAG GGAATTGCGG CGGCGACCGG CGGCGAAGTC 
ACCGTCACCG TCTATCCCGC CAGCCAGCTC GGCGGGGTCG CGGAAATGGT GGATGGCGTG 
CGCATGGGCT CGATCTCCAT GGGCCATCAT GATTTTGCTT CCCTCGCCCG ACTGGTCCCG 
GAGGTCGCCG TCTTCAACGC GCCTTTCATC TATCGCGACG GCGCACATGC GCTCGCTGCA 
ACGGACCCGC AGACATCGCC GGCACTCCAG GCGATCAACG AGAAGCTGGT CGCACAGGGC 
GTGCGGATCA TCGGGCGCAT CTATCGCGGC GATCGCCACA TTTCCTCAAA TTTTCCGGTG 
AAGACTCCCG CGGACCTTGC CGGAAAGCCC TTCCGTGCCG TCCCGCTCGA ATTGTGGGTT 
TCCATGGTCA AGGGCTTCGG CGCAATTCCT ACCCCGGTCG AGGTTGCCGA ACTCCCGACC 
GCGCTGATGA CGGGCGTGGT GGTCGGTCAG GAAAACCCGC TGACCATGAT CGCCTCCAAC 
AATCTCAACG AGGTGCAATC GCATCTGTCA ATGACCGGCC ACATGCGCGC CGTGCTCGCC 
GTCTTCATCA ATGAGGACGT CTGGCAGGGA TTGAGTGAAG AGCAGCGCTC GGCCCTCACC 
AAGGTCCTCG ACGAGGAGGC CCGGAAATCG CTGAAGATGG CAACGGAATC AGAGGCCGAT 
CTGGTGAAGG AACTCAAGGG CCGCGGCATG ACCGTCATAA CGGAGGCCGA AGGGCTCGAC 
GTGGCGGCGT TCCGTGAGAA GGTCAGCGCC CAGATCAGAC AGGACTTCCC CGATTTCGCG 
CCGCTCATCG AGCAGATCGA GGCGGTGAAG TAA

Protein sequence

MLNFLKHGRI TGAMLGAALL TGAASATELR YAHVGAEGDI QTVYAAQAAE GIAAATGGEV 
TVTVYPASQL GGVAEMVDGV RMGSISMGHH DFASLARLVP EVAVFNAPFI YRDGAHALAA 
TDPQTSPALQ AINEKLVAQG VRIIGRIYRG DRHISSNFPV KTPADLAGKP FRAVPLELWV 
SMVKGFGAIP TPVEVAELPT ALMTGVVVGQ ENPLTMIASN NLNEVQSHLS MTGHMRAVLA 
VFINEDVWQG LSEEQRSALT KVLDEEARKS LKMATESEAD LVKELKGRGM TVITEAEGLD 
VAAFREKVSA QIRQDFPDFA PLIEQIEAVK