Gene SAG1472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1472
Symbol	pepS
ID	1014281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	1491811
End bp	1493052
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	39%
IMG OID	637316644
Product	aminopeptidase PepS
Protein accession	NP_688466
Protein GI	22537615
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTTTAC AAGATTTCGA CAACCTTTTA AAAAAATATG CCCAATTAAT TATTTCTAAA 
GGTTTAAATG TCCAAAAAGG GCACACTCTC GCTTTAACAA TCGATGTGGA ACAAGTCCAC 
TTAGCAAGGC TTTTAACTGA AGCCGCTTAT GAAAAGGGAG CAAGTGAAGT TATTGTTGAT 
TATACAGATG ATTTTATCAC GCGCCAGCGA CTACTTCATG CTTCAGACGA AGTTCTCACG 
AATGTTCCAC AGTATACCGT TGATAAATCT TTAGCACTAT TAAATAAGAA GGCTAGTCGA 
TTAGTTGTGA AATCTTCTAA CCCTAACGCT TTCGCTACTG TTGATCCTAA ACGTTTATCT 
GAAACAACTA GAGCAACCGC TATTGCCTTA GAGGAACAAA GTAGAGCAAT ACAAGCTAAT 
AAAGTATCTT GGAACGTGGC TGCAGCTGCT GGTAGAGAAT GGGCTGCACT TGTCTTCCCA 
GAATTAAAAA CAAGCGACCA ACAAGTTGAT GCTCTTTGGG ATACCATTTT CAAATTAAAT 
CGTATTTATG AAGATGATCC TATTGCTGCT TGGGACGCAC ATGAAGCTAA ATTATTAGAA 
AAAGCTACTA GACTAAATCA AGAACAATTT GATGCTCTTC ATTATACCGC ACCAGGTACA 
GATTTAACGC TTGGTATGCC TAAAAATCAT ATTTGGGAGG CAGCCGGTAG TCTCAACGCT 
CAGGGAGAGA CTTTTATCGC TAATATGCCT ACTGAAGAAA TCTTTTCAGC ACCTGATTAC 
CGTCGTGCAG ATGGGTATGT GACAAGTACA AAACCTCTCA GTTATGCTGG CGTTATTATC 
GAAAATATGA CATTTACCTT TAAAGACGGT AAAATTATCA ATGTCACTGC AGAAAAAGGG 
CAAGAAACAG TCCAACGCTT AATCGAGGAA AATGATGGGG CAAGATCGCT TGGGGAAGTT 
GCACTTGTCC CACATAAAAC ACCAATTTCA CTATCTGGAC TGATTTTCTT TAATACTTTA 
TTCGATGAAA ATGCCTCTAA TCACCTCGCT ATTGGAACTG CATATGCCTT CAATGTAGAA 
GGAGGAACAG AAATGACAAG TCAAGAATTG GATGAAGCTG GTTTAAATCG TTCTTCAACA 
CATGTTGATT TTATGATTGG TTCAGAACAA ATGGATATTG ATGGTATTCG TGCAGATGGA 
ACTGCTGTCC CAATCTTTAG AAATGGCGAA TGGGCTATTT AA

Protein sequence

MVLQDFDNLL KKYAQLIISK GLNVQKGHTL ALTIDVEQVH LARLLTEAAY EKGASEVIVD 
YTDDFITRQR LLHASDEVLT NVPQYTVDKS LALLNKKASR LVVKSSNPNA FATVDPKRLS 
ETTRATAIAL EEQSRAIQAN KVSWNVAAAA GREWAALVFP ELKTSDQQVD ALWDTIFKLN 
RIYEDDPIAA WDAHEAKLLE KATRLNQEQF DALHYTAPGT DLTLGMPKNH IWEAAGSLNA 
QGETFIANMP TEEIFSAPDY RRADGYVTST KPLSYAGVII ENMTFTFKDG KIINVTAEKG 
QETVQRLIEE NDGARSLGEV ALVPHKTPIS LSGLIFFNTL FDENASNHLA IGTAYAFNVE 
GGTEMTSQEL DEAGLNRSST HVDFMIGSEQ MDIDGIRADG TAVPIFRNGE WAI