Gene SAG1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1389
Symbol	pepT
ID	1014198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1396195
End bp	1397415
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	35%
IMG OID	637316565
Product	peptidase T
Protein accession	NP_688387
Protein GI	22537536
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0424518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTACG AAAAGCTTTT AGAACGATTT TTAACATACG TCAAAATAAA TACAAGAAGT 
AATCCTAATA GTACACAAAC GCCAACAACT CAAAGTCAAG TTGACTTTGC TTTAACAGTT 
TTAAAACCAG AAATGGAAGC AATTGGTTTA AAAGATGTTC ATTATTTACC TTCTAATGGG 
TATTTGGTTG GAACCTTACC TGCTACAAGC GACCGCTTAC GCCATAAAAT AGGTTTTATA 
TCCCATATGG ATACAGCTGA TTTCAATGCT GAAAATATTA CTCCACAAAT TGTTGACTAT 
AAAGGTGGAG ATATTGAACT TGGAGACTCA GGTTACATTT TAAGTCCAAA AGATTTTCCA 
AATTTAAATA ATTACCATGG GCAAACACTG ATTACAACAG ATGGTAAAAC CTTACTGGGA 
GCAGACGATA AGTCTGGTAT AGCAGAAATC ATGACAGCTA TGGAATATTT GGCTTCGCAT 
CCAGAAATTG AGCATTGTGA AATTAGAGTT GGCTTTGGAC CAGACGAAGA AATTGGTATA 
GGTGCAGATA AATTTGATGT TAAAGATTTT GATGTTGATT TTGCCTATAC AGTGGATGGT 
GGACCACTAG GAGAATTACA GTATGAAACC TTTAGTGCAG CTGGTTTGGA GCTTACATTT 
GAAGGACGAA ACGTTCACCC TGGAACTGCA AAAAATCAAA TGATTAATGC TTTACAGCTT 
GCTATGGATT TTCATAGTCA ATTACCAGAA AATGAACGTC CTGAACAAAC AGATGGCTAT 
CAAGGATTTT ATCACTTATA TGATTTAAGT GGAACAGTTG ATCAAGCTAA AAGTTCATAT 
ATCATTCGAG ATTTTGAGGA AGTTGATTTC TTAAAGCGTA AGCACTTGGC TCAAGATATC 
GCTGATAATA TGAATGAAGC ATTACAATCT GAACGTGTAA AGGTTAAACT ATACGATCAA 
TATTACAACA TGAAGAAAGT TATTGAAAAA GACATGACAC CTATCAACAT TGCTAAAGAA 
GTAATGGAAG AGTTAGACAT CAAGCCAATC ATAGAACCGA TTCGTGGTGG TACAGATGGC 
TCTAAAATTT CCTTTATGGG AATCCCTACT CCTAATCTTT TTGCAGGTGG TGAAAACATG 
CATGGACGCT TTGAATTCGT TAGTCTACAA ACAATGGAAA AAGCAGTTGA TGTTATTTTA 
GGCATCGTTG CTAAGGATTA G

Protein sequence

MSYEKLLERF LTYVKINTRS NPNSTQTPTT QSQVDFALTV LKPEMEAIGL KDVHYLPSNG 
YLVGTLPATS DRLRHKIGFI SHMDTADFNA ENITPQIVDY KGGDIELGDS GYILSPKDFP 
NLNNYHGQTL ITTDGKTLLG ADDKSGIAEI MTAMEYLASH PEIEHCEIRV GFGPDEEIGI 
GADKFDVKDF DVDFAYTVDG GPLGELQYET FSAAGLELTF EGRNVHPGTA KNQMINALQL 
AMDFHSQLPE NERPEQTDGY QGFYHLYDLS GTVDQAKSSY IIRDFEEVDF LKRKHLAQDI 
ADNMNEALQS ERVKVKLYDQ YYNMKKVIEK DMTPINIAKE VMEELDIKPI IEPIRGGTDG 
SKISFMGIPT PNLFAGGENM HGRFEFVSLQ TMEKAVDVIL GIVAKD