Gene SAG0706 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0706
Symbol	pepQ
ID	1013510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	698556
End bp	699641
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	37%
IMG OID	637315894
Product	proline dipeptidase
Protein accession	NP_687721
Protein GI	22536870
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.050337
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAC TTAATCGTAT ACGCCATCAC TTACATTCAG TCCAAGCTGA ACTTGCTGTC 
TTTTCTGATC CTGTGACAGT CAACTATTTA ACAGGTTTCT TTTGCGATCC CCATGAAAGA 
CAAATGTTTT TATTTGTCTA TGAAGATCGC GATCCTATTT TATTTGTACC AGCACTAGAA 
GTATCGCGTG CAAAACAAAG TGTACCATTT CCCGTCTTTG GTTACATAGA TTCAGAAAAT 
CCTTGGCAAA AAATAGCTAG CAACTTACCA TCCTTTTCTG TTTCTAAAGT TCTAGCCGAA 
TTTGATAATC TTAATGTTAC TAAATTCCAA GGTCTCCAAA CCGTTTTTGA TGGTCATTTT 
GAAAACCTAA CACCTTATAT TCAAAACATG CGCCTAATTA AATCACGAGA TGAAATTGAG 
AAAATGTTAG TCGCTGGAGA ATTTGCTGAT AAAGCTGTTC AAGTTGGATT TGACAATATC 
TCGCTAAACA ACACTGAAAC CGATATTATC GCTCAAATCG AATTTGAAAT GAAAAAACAA 
GGTATCAATA AAATGAGTTT CGACACTATG GTTTTGACTG GCAATAATGC AGCAAATCCA 
CATGGTATCC CAGGAACTAA TAAAATCGAA AATAATGCTT TGTTATTATT TGATTTAGGT 
GTAGAAACAC TAGGTTATAC GTCAGATATG ACCCGTACAG TAGCAGTGGG GAAACCTGAT 
CAATTCAAAA AAGATATTTA CCATTTATGT CTTGAAGCAC ATCAAGCGGC TATTGATTTT 
ATTAAGCCAG GAGTCCTTGC TTCTGAAGTT GACGCAGCAG CAAGAAATGT TATTGAAAAG 
GCTGGTTATG GACAATACTT TAACCACCGC CTTGGTCATG GATTAGGTAT GGATGTCCAT 
GAATTTCCAT CTATTATGGC TGGTAACGAT ATGGAGATTC AAGAAGGCAT GTGCTTCTCT 
GTTGAACCAG GTATTTATAT ACCAGATAAA GTTGGTGTGC GAATTGAAGA CTGCGGTTAT 
GTGACTAAAA CCGGCTTTGA AGTATTTACC AAAACACCCA AGGAACTACT CTATTTTGAA 
GGATAA

Protein sequence

MSKLNRIRHH LHSVQAELAV FSDPVTVNYL TGFFCDPHER QMFLFVYEDR DPILFVPALE 
VSRAKQSVPF PVFGYIDSEN PWQKIASNLP SFSVSKVLAE FDNLNVTKFQ GLQTVFDGHF 
ENLTPYIQNM RLIKSRDEIE KMLVAGEFAD KAVQVGFDNI SLNNTETDII AQIEFEMKKQ 
GINKMSFDTM VLTGNNAANP HGIPGTNKIE NNALLLFDLG VETLGYTSDM TRTVAVGKPD 
QFKKDIYHLC LEAHQAAIDF IKPGVLASEV DAAARNVIEK AGYGQYFNHR LGHGLGMDVH 
EFPSIMAGND MEIQEGMCFS VEPGIYIPDK VGVRIEDCGY VTKTGFEVFT KTPKELLYFE 
G