Gene SeSA_A1306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1306
Symbol	pepT
ID	6518444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1278062
End bp	1279291
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	52%
IMG OID	642746427
Product	peptidase T
Protein accession	YP_002114235
Protein GI	194736371
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.841149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG TTTTTTACAC TACGTATCGC TGGATACCCA ATCAAAGTCG 
GGTGTTCGGC AGGTTCCCAG CACTGAGGGG CAGTGGAAGT TACTACGTTT GCTCAAACAG 
CAGCTCGAAG AGATGGGGCT GGTTAACATT ACATTAAGTG AAAAAGGGAC GTTGATGGCG 
ACGCTCCCGG CCAATGTTGA GGGGGATATT CCCGCCATTG GTTTTATCTC CCATGTGGAT 
ACCTCTCCGG ATTTCAGCGG TAAAAACGTT AACCCGCAGA TTGTCGAGAA TTATCGCGGC 
GGCGATATAG CATTAGGGAT TGGCGATGAG GTGTTGTCAC CCGTGATGTT CCCGGTACTG 
CATCAATTAC TGGGACAGAC GCTGATTACT ACCGATGGTA AGACATTGCT GGGCGCGGAC 
GATAAAGCCG GCGTTGCGGA GATCATGACC GCGCTGGCGG TGCTGAAAGG TAATCCTATT 
CCCCACGGCG ACATTAAAGT GGCGTTTACG CCTGACGAAG AGGTAGGGAA AGGCGCGAAG 
CACTTCGATG TTGAGGAGTT TGGCGCGCAG TGGGCCTATA CGGTCGACGG CGGCGGCGTG 
GGCGAACTGG AGTTTGAAAA CTTCAATGCC GCCTCGGTGA ATATCAAAAT CGTCGGCAAT 
AACGTGCATC CCGGTACGGC GAAAGGCGTG ATGGTCAATG CGCTGTCATT GGCGGCGAGG 
ATTCACGCGG AAGTGCCGGC GGATGAAGCG CCTGAAACCA CTGAAGGTTA CGAAGGGTTT 
TATCATCTGG CCAGCATGAA AGGCACCGTT GACCGGGCCG AAATGCACTA CATCATTCGC 
GATTTCGACC GTAAGCAGTT TGAAGCGCGT AAACGCAAAA TGATGGAGAT TGCCAAAAAA 
GTCGGTAAGG GGCTGCATCC GGACTGCTAT ATCGAACTTG TGATTGAAGA CAGTTATTAC 
AATATGCGCG AAAAAGTAGT TGAACATCCG CATATTCTCG ATATCGCCCA GCAGGCCATG 
CGCGACTGTC ATATTACGCC GGAGATGAAA CCGATTCGCG GCGGTACAGA CGGGGCGCAA 
CTGTCGTTTA TGGGCCTGCC GTGTCCTAAT CTCTTTACCG GCGGATATAA CTATCATGGT 
AAACATGAGT TTGTGACGCT GGAGGGGATG GAAAAAGCGG TACAGGTGAT TGTACGTATC 
GCGGAGTTGA CGGCGAAGCG CGGCCAGTAG

Protein sequence

MDKLLERFLH YVSLDTQSKS GVRQVPSTEG QWKLLRLLKQ QLEEMGLVNI TLSEKGTLMA 
TLPANVEGDI PAIGFISHVD TSPDFSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGVAEIMT ALAVLKGNPI PHGDIKVAFT PDEEVGKGAK 
HFDVEEFGAQ WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADEA PETTEGYEGF YHLASMKGTV DRAEMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCHITPEMK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAKRGQ