Gene SNSL254_A1328 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1328
Symbol	pepT
ID	6486414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1315198
End bp	1316427
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	52%
IMG OID	642736726
Product	peptidase T
Protein accession	YP_002040483
Protein GI	194445705
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.245439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG TTTTTTACAC TACGTATCGC TGGATACCCA ATCAAAGTCG 
GGTGTTCGGC AGGTTCCCAG CACTGAGGGG CAGTGGAAGT TACTACGTTT GCTCAAACAG 
CAGCTCGAAG AGATGGGGCT GGTTAACATT ACATTAAGTG AAAAAGGGAC GTTGATGGCG 
ACGCTCCCGG CCAATGTTGA GGGGGATATT CCCGCCATTG GTTTTATCTC CCATGTGGAT 
ACCTCTCCGG ATTTCAGCGG TAAAAACGTT AACCCGCAGA TTGTCGAGAA TTATCGCGGC 
GGCGATATAG CATTAGGGAT TGGCGATGAG GTGTTGTCAC CCGTGATGTT CCCGGTACTG 
CATCAATTAC TGGGACAGAC GCTGATTACT ACCGATGGTA AGACATTGCT GGGCGCGGAC 
GATAAAGCCG GCGTTGCGGA GATCATGACC GCGCTGGCGG TGCTGAAAGG TAATCCTATT 
CCCCACGGCG ACATTAAAGT GGCGTTTACG CCTGACGAAG AGGTAGGGAA AGGCGCGAAG 
CACTTCGATG TTGAGGCCTT TGGCGCGCAG TGGGCCTATA CGGTCGACGG CGGCGGCGTG 
GGAGAACTGG AGTTTGAAAA CTTCAATGCC GCCTCGGTGA ATATCAAAAT CGTCGGCAAT 
AACGTGCATC CTGGTACGGC GAAAGGCGTC ATGGTCAATG CGCTGTCGTT GGCGGCGAGG 
ATTCACGCGG AAGTGCCGGC GGATGAAGCG CCTGAAACCA CCGAAGGTTA CGAAGGGTTT 
TATCATCTGG CCAGCATGAA AGGCACCGTT GACCGGGCCG AAATGCACTA CATCATTCGC 
GATTTCGACC GTAAGCAGTT TGAAGCGCGT AAACGCAAAA TGATGGAGAT TGCCAAAAAA 
GTCGGTAAGG GGCTGCATCC GGACTGCTAT ATCGAACTGG TGATTGAAGA CAGTTATTAC 
AATATGCGCG AAAAAGTGGT TGAGCATCCG CATATTCTCG ATATCGCCCA GCAGGCCATG 
CGTGACTGTC ATATTACGCC GGAGATGAAA CCAATTCGCG GCGGTACAGA CGGGGCGCAA 
CTGTCGTTTA TGGGCCTGCC GTGTCCTAAT CTCTTTACCG GCGGATATAA CTATCATGGT 
AAACATGAGT TTGTGACGCT GGAGGGGATG GAAAAAGCGG TACAGGTGAT TGTACGTATC 
GCGGAGCTGA CGGCGAAGCG CGGCCAGTAG

Protein sequence

MDKLLERFLH YVSLDTQSKS GVRQVPSTEG QWKLLRLLKQ QLEEMGLVNI TLSEKGTLMA 
TLPANVEGDI PAIGFISHVD TSPDFSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGVAEIMT ALAVLKGNPI PHGDIKVAFT PDEEVGKGAK 
HFDVEAFGAQ WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADEA PETTEGYEGF YHLASMKGTV DRAEMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCHITPEMK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAKRGQ