Gene SAG0174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0174
Symbol	pepA
ID	1012948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	194950
End bp	196017
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	40%
IMG OID	637315352
Product	glutamyl-aminopeptidase
Protein accession	NP_687209
Protein GI	22536358
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID	[TIGR03107] glutamyl aminopeptidase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGATT TATTTAACAA AATTAAAACC GTAACTGAGC TTGATGGGAT TGCTGGCTAT 
GAACACAATA TCCGCAACTT CCTTCGTCAA GAAATAACTC CTTTAGTTGA TCAAGTTGAG 
ACAGACGGAC TTGGTGGAAT TTTTGGAGTT AAAAATACTC ATGAGACTAA TGCTCCTAAA 
GTCATGGTTG CTGCCCATAT GGATGAAGTC GGCTTTATGG TTAGTCATAT TCAGCCAGAT 
GGAACATTTC GTGTACTTGA GGTTGGAGGA TGGAATCCCC TAGTAGTCAG CTCACAACGC 
TTTACCCTCT ACACACGTTC TGGTGATGCT ATTCCTGTTA TATCAGGCTC AGTTCCTCCT 
CACTTTCTTC GTGGACAAAG CGGTGGAACA ACATTACCCA AAATTAGTGA CATTGTTTTT 
GATGGAGGAT TCACAGATAA AAATGAAGCT GAAAGCTTTG GCATTGCTCC TGGCGATATC 
ATTGTTCCTA AATCTGAAAC CATTTTAACT GCAAATCAAA AACATATTAT GTCAAAAGCT 
TGGGATAATC GCTATGGTGT GCTTATGGTG ACCGAATTGC TAAAAAGCTT AAAAGATCAA 
AGTCTTAGCA ACACACTTAT TGCTGGGGCA AATGTTCAAG AAGAAGTCGG ACTTCGTGGC 
GCACATGTTT CAACAACTAA ATTCAACCCA GATATCTTCT TAGCTGTCGA TTGTTCCCCA 
GCTGGAGATA TTTATGGGGA ACAAGGCAAA ATAGGAGAGG GAACCTTAAT CCGTTTTTAT 
GATCCCGGAC ATATCATGCT TAAAGATATG AGAGATTTCT TACTTACAAC AGCTGAAGAA 
GCAGGTATAA AATACCAATA TTATGCTGCA AATGGTGGTA CCGATGCTGG GGCTGCTCAC 
CTAAAAAATA GTGGTATTCC TTCTACAACT ATCGGTGTCT GTGCACGCTA CATTCATTCT 
CATCAAACAC TCTACGCTAT GGATGATTTT CTACAAGCAC AAGCTTACCT TCAGGCCATC 
GTTAACAAAT TAGACCGCTC GACGGTGGAT ATTATTAAAG GTTATTAA

Protein sequence

MSDLFNKIKT VTELDGIAGY EHNIRNFLRQ EITPLVDQVE TDGLGGIFGV KNTHETNAPK 
VMVAAHMDEV GFMVSHIQPD GTFRVLEVGG WNPLVVSSQR FTLYTRSGDA IPVISGSVPP 
HFLRGQSGGT TLPKISDIVF DGGFTDKNEA ESFGIAPGDI IVPKSETILT ANQKHIMSKA 
WDNRYGVLMV TELLKSLKDQ SLSNTLIAGA NVQEEVGLRG AHVSTTKFNP DIFLAVDCSP 
AGDIYGEQGK IGEGTLIRFY DPGHIMLKDM RDFLLTTAEE AGIKYQYYAA NGGTDAGAAH 
LKNSGIPSTT IGVCARYIHS HQTLYAMDDF LQAQAYLQAI VNKLDRSTVD IIKGY