Gene SAG1194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1194
Symbol
ID	1014001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1199064
End bp	1200254
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	34%
IMG OID	637316379
Product	hypothetical protein
Protein accession	NP_688203
Protein GI	22537352
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGAC CATCAGAAAA AGAATTTAAA AATAGTTTGT TTTTTAAATG GATCTTAAAT 
AATCAAGCAG TTATTGCTCT CATGATTACC TTTTTGGTAT TTTTAACGAT TTTTATTTTT 
ACCAAAATCT CTTTTATGTT TAAACCTGTG TTTGATTTTC TTGCTGTGCT GATATTGCCG 
CTTGTAATTT CTGGCTTGCT TTATTACCTA TTAAAACCTA TGGTTACATT TTTAGAGAAG 
CGGGGAATTA AGCGTGTAAC AGCGATATTA TCAGTTTTTA CTATTATAAT CCTTCTGTTA 
ATTTGGGCAA TGTCTAGTTT TATTCCCATG ATGAGTAATC AATTACGCCA TTTTATGGAA 
GATCTCCCTT CATATGTGAA TAAAGTGCAA ATGGAAACAA GTTCGTTTAT AGATCACAAC 
CCTTGGTTAA AATCTTATAA AGGGGAAATA TCGAGCATGT TATCTAATAT CAGTAGCCAA 
GCGGTCTCTT ATGCTGAAAA ATTTTCAAAG AATATTTTAG ATTGGGCAGG AAATTTAGCT 
AGTACAGTTG CACGTGTGAC AGTAGCAACA ATCATGGCTC CCTTTATTTT GTTTTATCTT 
TTAAGAGATA GTCGCAACAT GAAGAATGGT TTCTTAATGG TTTTACCAAC CAAACTACGC 
CAACCAACTG ATCGTATTTT GCGAGAAATG AATAGTCAAA TGTCAGGGTA TGTGCAAGGA 
CAAATCATTG TTGCTATTAC TGTTGGTGTT ATTTTTTCAA TAATGTATAG TATTATAGGC 
CTTAGATATG GCGTGACATT AGGGATTATT GCCGGTGTGT TAAATATGGT TCCCTATTTG 
GGAAGTTTTG TCGCCCAAAT TCCAGTGTTT ATCTTAGCGC TTGTCGCAGG ACCTGTTATG 
GTTGTTAAAG TTGCGATTGT TTTTGTTATT GAGCAAACTC TAGAAGGACG CTTTGTCTCA 
CCCTTGGTTT TAGGTAATAA ACTTAGCATT CATCCAATTA CAATTATGTT TATTTTATTA 
ACCTCTGGAG CGATGTTTGG TGTTTGGGGA GTATTCCTCA GTATTCCGAT TTATGCATCT 
ATCAAAGTTG TTGTTAAAGA ATTGTTTGAT TGGTACAAAG CTGTCAGTGG GCTATATACA 
GTAGATGTTG TTACTGAAGA AAGAAGTGAA GAAGTTAAAA ATGTTGAATA G

Protein sequence

MNRPSEKEFK NSLFFKWILN NQAVIALMIT FLVFLTIFIF TKISFMFKPV FDFLAVLILP 
LVISGLLYYL LKPMVTFLEK RGIKRVTAIL SVFTIIILLL IWAMSSFIPM MSNQLRHFME 
DLPSYVNKVQ METSSFIDHN PWLKSYKGEI SSMLSNISSQ AVSYAEKFSK NILDWAGNLA 
STVARVTVAT IMAPFILFYL LRDSRNMKNG FLMVLPTKLR QPTDRILREM NSQMSGYVQG 
QIIVAITVGV IFSIMYSIIG LRYGVTLGII AGVLNMVPYL GSFVAQIPVF ILALVAGPVM 
VVKVAIVFVI EQTLEGRFVS PLVLGNKLSI HPITIMFILL TSGAMFGVWG VFLSIPIYAS 
IKVVVKELFD WYKAVSGLYT VDVVTEERSE EVKNVE