Gene SAG0742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0742
Symbol
ID	1013546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	734877
End bp	736163
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	39%
IMG OID	637315930
Product	U32 family peptidase
Protein accession	NP_687757
Protein GI	22536906
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.810338
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAATG TAAAAAAACG CCCTGAGGTT TTATCACCTG CAGGAACACT AGAAAAATTA 
AAAGTTGCTA TTGATTATGG AGCAGATGCT GTATTTGTTG GAGGTCAAGC GTATGGTCTT 
CGAAGTAGAG CTGGTAACTT TTCTATGGAA GAGTTACAAG AGGGAATAAA CTATGCTCAT 
GCAAGAGATG CTAAAGTTTA TGTAGCGGCT AATATGGTTA CTCATGAAGG TAATGAGCTT 
GGGGCAGGTC CGTGGTTTCG TGAATTACGT GATATGGGAC TAGATGCAGT CATTGTTTCA 
GATCCTGCTC TTATTGTTAT TTGTGCTACA GAAGCACCAG GCTTAGAAAT TCATTTGTCA 
ACTCAAGCCT CTTCCACGAA CTATGAAACT TTTGAATTTT GGAAAGAGAT GGGGCTTACT 
CGTGTCGTAT TAGCACGTGA GGTTACTATG GCAGAGTTGG CTGAAATCAG GAAGAGGACA 
GATGTTGAGA TAGAAGCATT TGTTCATGGC GCGATGTGTA TTTCATACTC AGGACGATGT 
GTTCTATCAA ACCATATGAG CCATCGTGAT GCTAATCGTG GCGGTTGCTC TCAGTCATGT 
CGTTGGAAAT ATGACCTCTA CGATATGCCA TTTGGACAAG AACGTCAATC GTTAAAAGGC 
GAGATTCCAG AACCTTTCTC AATGTCAGCT GTGGATATGT GTATGATTGA GCATATTCCA 
GATATGATTG AAAATGGTGT AGATAGTTTA AAAATAGAAG GACGTATGAA ATCCATTCAT 
TATGTTTCTA CAGTAACTAA TTGCTATAAA GCTGCTGTAG ATGCCTATAT GGAAAGTCCA 
GAAGCTTTTG AAGCTATTAA AGAAGACTTG ATTGATGAAC TTTGGAAGGT TGCACAACGC 
GAATTAGCAA CAGGTTTCTA CTACCATACA CCAACTGAAA ATGAACAACT CTTTGGAGCT 
CGTCGTAAAA TTCCTCAATA CAAATTTGTT GGGGAAGTGG TTTCATTTGA CAATGCTAAA 
ATGGAGGCTA CAATTCGTCA GCGTAATGTT ATTATGGAAG GAGATCGCGT AGAATTCTAT 
GGTCCTGGCT TCCGTCACTT TGAATGTTTT ATTGATGGTC TGCGTGATGC TGAAGGAAAT 
AAAATAGACC GTGCTCCAAA TCCGATGGAA TTATTAACCA TAACATTACC AAATCCAGTA 
AAAAAAGGGG ATATGATTCG TGCTTGTAAA GAAGGATTAG TGAACCTTTA TCAAAATGAT 
GGTACTAGCA AGACTGTAAG AGCTTAG

Protein sequence

MSNVKKRPEV LSPAGTLEKL KVAIDYGADA VFVGGQAYGL RSRAGNFSME ELQEGINYAH 
ARDAKVYVAA NMVTHEGNEL GAGPWFRELR DMGLDAVIVS DPALIVICAT EAPGLEIHLS 
TQASSTNYET FEFWKEMGLT RVVLAREVTM AELAEIRKRT DVEIEAFVHG AMCISYSGRC 
VLSNHMSHRD ANRGGCSQSC RWKYDLYDMP FGQERQSLKG EIPEPFSMSA VDMCMIEHIP 
DMIENGVDSL KIEGRMKSIH YVSTVTNCYK AAVDAYMESP EAFEAIKEDL IDELWKVAQR 
ELATGFYYHT PTENEQLFGA RRKIPQYKFV GEVVSFDNAK MEATIRQRNV IMEGDRVEFY 
GPGFRHFECF IDGLRDAEGN KIDRAPNPME LLTITLPNPV KKGDMIRACK EGLVNLYQND 
GTSKTVRA