Gene SAG1444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1444
Symbol
ID	1014253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	1457503
End bp	1458975
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	37%
IMG OID	637316619
Product	proton/peptide symporter family protein
Protein accession	NP_688441
Protein GI	22537590
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID	[TIGR00924] amino acid/peptide transporter (Peptide:H+ symporter), bacterial

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000293034
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAA CAAAATCATT CTTTGGACAT CCTCGTGGTT TGTCCACTCT TTTCTTTACT 
GAAATGTGGG AAAGATTCTC ATACTATGGT ATGCGTGCTA TTTTGCTGTA CTATATGTAC 
TATAGTGTTT CTCAAGGTGG CCTTGGTATG GACAAGACTG TCGCTGCATC AATCATGGCT 
GTCTATGGTT CACTGGTTTA TCTCTCATCA GTAATTGGTG GTTTTGTCAG CGACCGTATT 
CTAGGTAGTC GTAAAACTGT TCTGTATGGT GGTATTCTAA TCATGCTAGG TCATATTGCT 
CTAGCTACAC CATTTGGTCA AACAGCTCTA TTCATTTCGA TTGCTCTAAT TATCCTTGGT 
ACTGGACTAT TAAAACCAAA TGTATCAGAG ATGGTTGGTA ATTTATATGG AGAAAATGAT 
TCTCGTCGTG ATGCTGGTTT TAGTATCTTT GTTTTTGGTA TTAACCTTGG TGCTTTTATT 
TCACCCATTG TAGTGGGGTA CCTCGGACAA GAAGTAAATT TCCATCTTGG TTTCTCACTT 
GCTGCTATTG GTATGTTCTT TGGTCTCCTC CAATATACCT TAGATGGAAA AAAATATTTG 
ACTGAAGAGA GTCTCAGACC AAACGATCCT TTAAGTCCTG AAGAAAAGTC CTCTCTATAT 
AAAAAAGTTG GGCTTATCCT TATTGGTATT GTTATTGTAC TTATTCTACT TCACTTGATG 
CATATGCTAA CAATTGAAGT AATTATCGAT ATTTTTAGTA TTATTGCAAT CGCCATCCCA 
ATTATTTATT TTATCAAGAT TTTAAGTAGT AAAAAGATTT CTTCTGTTGA GCGTTCTCGA 
GTGTGGGCAT ATATCCCTCT CTTTATCGCC TCAATTCTAT TTTGGTCAAT TGAAGAACAA 
GGTTCAGTTG TCTTAGCCTT ATTTGCAGAT GAACAAACAA AACTTTACCT TAACTTCTTT 
GGGCATCATA TTAATTTCCC ATCAAGTTAT TTCCAAAGTA TGAACCCTCT CTTCATTATG 
CTTTATGTAC CATTCTTTGC TTGGTTATGG GCTAAATGGG GAAGTAAGCA ACCTTCATCA 
CCTAAAAAAT TTGCGTATGG ACTTTTCTTT GCTGGAGCTT CATTCTTATG GATGATGCTA 
CCAGGTTTAC TCTTTGGAGT TAACGCTAAA GTAAGCCCTC TTTGGTTAAC AATGAGTTGG 
GCTATTGTCA TCGTTGGGGA AATGCTAATC TCACCAGTTG GATTATCAGC AACTAGTAAG 
CTCGCACCTA AAGCATTCCA AGCTCAAATG ATGAGCATCT GGTTCTTAAG TAATGCTGCA 
GCACAAGCTA TTAACGCTCA AATCGTTAAA TTGTACACAC CTGATACTCA AACTCTTTAT 
TATGGTGTTG TTGGTGGTAT AACAGTTGTA TTTGGATTTA TCCTCTTATT TTATGTTCCA 
CGCATTGAAA AACTAATGTC TGGAGTTAAA TAA

Protein sequence

MEKTKSFFGH PRGLSTLFFT EMWERFSYYG MRAILLYYMY YSVSQGGLGM DKTVAASIMA 
VYGSLVYLSS VIGGFVSDRI LGSRKTVLYG GILIMLGHIA LATPFGQTAL FISIALIILG 
TGLLKPNVSE MVGNLYGEND SRRDAGFSIF VFGINLGAFI SPIVVGYLGQ EVNFHLGFSL 
AAIGMFFGLL QYTLDGKKYL TEESLRPNDP LSPEEKSSLY KKVGLILIGI VIVLILLHLM 
HMLTIEVIID IFSIIAIAIP IIYFIKILSS KKISSVERSR VWAYIPLFIA SILFWSIEEQ 
GSVVLALFAD EQTKLYLNFF GHHINFPSSY FQSMNPLFIM LYVPFFAWLW AKWGSKQPSS 
PKKFAYGLFF AGASFLWMML PGLLFGVNAK VSPLWLTMSW AIVIVGEMLI SPVGLSATSK 
LAPKAFQAQM MSIWFLSNAA AQAINAQIVK LYTPDTQTLY YGVVGGITVV FGFILLFYVP 
RIEKLMSGVK