Gene SeSA_A4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4036
Symbol	torT
ID	6517202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3907122
End bp	3908162
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	55%
IMG OID	642749006
Product	TMAO reductase system periplasmic protein TorT
Protein accession	YP_002116768
Protein GI	194736586
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR02955] TMAO reductase system periplasmic protein TorT

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCGC TTATTTCGTT CTTTTTTTTG ATAATCATCG TCTCGAATGT AGAAACGGCG 
TCAGCCGAAA CCGGACTGCT ACACTGGACG CGCGCCGATC GGGCGATTCC CTGGCGGCAA 
ACGTCAGTCA ATGCGAGTAA ACCCTGGAAA CTGTGCGCAT TATACCCCAG CCTGAAAGAT 
TCTTACTGGT TGTCCGTCAA CTACGGGATG CAAAAAGCGG CCAAATTGTA TGGCGTTGAT 
TTAAAAGTGC TGGAAGCGAA TGGCTATCGG CAACTGGCGA CGCAACAACA GCAAATGATG 
CAGTGCCGGG AGTGGGGTGC CGACGCTATT CTGCTTGGCA GCAGTACCGA TCGTTTCCCG 
GAGCTGGAAC GGTATGCCGG TAATGTGCCG GTTATTGAAC TGGTGAACAT GATTCACGAT 
GCCAGCGTCG CAACCCGCGT TGGTCTGCCG TGGTTTCAGA TGGGGTATCT GCCGGGACGT 
TTCCTGGTGC AGTGGAGCAA AGGAAAAGCG CTTAACGTTT TACTCTTCCC GGGGCCGGAA 
GAAGCCGGCG GCAGTCAGGA GATGGTGGCG GGTTTTCGTC AGGCAATTAA AGGCAGCGCG 
ATCAACATTG TGGATATCGC CTGGGGCGAT AACGACATTG AAGTGCAGCG AAACTTACTC 
CAGGAAATGC TGGAGCGCCA TCCGGACGCC AATGTGGTCG CCGGGTCGGC GATAGCAGCG 
GAGGCGGCGA TGGGCGAAGG GCGAAATTTG ACGACTCCGC TCACGATCGT CTCATTTTAT 
CTGACGCATC AGGTTTATCG CGGTTTAAAA CGCGGCCATA TCCTGATGGC GCTCAGCGAT 
CAGATGGCCT GGCAGGGAGA ATTAGCGATA ACGCAGTCGA TTAAGGTCTT ACAGGGGCAA 
CCGGTGCCTG AAAATATCAG CCCGCCGGTG CTTATTTTGA CGCATAACAA CGCCGACAGC 
GCGCGCGTTC GCCGTTCGCT ATCGCCTCCG GGATTTCGGC CCGTCTATCT GTATCAATAC 
ACCTCCGAGG CTAAAAAGTA G

Protein sequence

MRALISFFFL IIIVSNVETA SAETGLLHWT RADRAIPWRQ TSVNASKPWK LCALYPSLKD 
SYWLSVNYGM QKAAKLYGVD LKVLEANGYR QLATQQQQMM QCREWGADAI LLGSSTDRFP 
ELERYAGNVP VIELVNMIHD ASVATRVGLP WFQMGYLPGR FLVQWSKGKA LNVLLFPGPE 
EAGGSQEMVA GFRQAIKGSA INIVDIAWGD NDIEVQRNLL QEMLERHPDA NVVAGSAIAA 
EAAMGEGRNL TTPLTIVSFY LTHQVYRGLK RGHILMALSD QMAWQGELAI TQSIKVLQGQ 
PVPENISPPV LILTHNNADS ARVRRSLSPP GFRPVYLYQY TSEAKK