Gene SAG1122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1122
Symbol
ID	1013926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1129236
End bp	1130783
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	37%
IMG OID	637316304
Product	transporter, BCCT family protein
Protein accession	NP_688131
Protein GI	22537280
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGTAAAA AACATATTAC GCCTGTATTT ACAGGTTCAC TAATTGTATC GCTTATTTTA 
GTCTTATTAG GAATTATTGT TCCTCGTGGT TTTCAATCTT GGACACAAAT CTTGCGTGAA 
CAGGTATCTA CCAATTTCGG TTGGTTGTAC TTGTTGTTAG TTACTTCAAT TCTTGCTTTG 
TGTGTCTTTT TTATTATGAG TCCTCTTGGA CAAATACGTT TAGGGCAACC TCATTCACGT 
CCTGAATATT CAACTGTATC ATGGATAGCA ATGATGTTTT CAGCAGGTAT GGGGATTGGT 
TTGGTCTTCT ACGGAGCAGC TGAACCCTTA TCGCATTTTG CTATTTCGAC ACCTGGTGCA 
CCTAAGGAAT CGCAAACAGC ATTAGCTGAT GCATTTCGTT TTACATTTTT TCACTGGGGG 
ATACATGCTT GGGCAGTATA TGCATTGGTT GCTTTAGCTC TAGCTTATTT TGGATTTCGA 
AAGCAAGAGA AATACCTCTT GTCTGTCACT TTAAAGCCTC TTTTCGGTGA TAAGACAGAT 
GGTTGGCTAG GAAAAATTGT TGATATCACC ACAGTTGTTG CTACAGTTAT TGGAGTTGCT 
ACGACACTTG GATTTGGAGC TGCTCAAATC AACGGAGGGT TAAGTTTTTT ATTGGGTGTT 
CCCAATAATG CATTTGTTCA AATTGTTATT ATCCTGATTA CAACAGCTTT ATTTGTTATG 
TCAGCTTTAT CAGGTTTAGG AAAAGGTGTT AAAATTTTAT CGAACTTAAA TTTGATTTTA 
GCGGTAGCCC TCTTAGCTTT AGTTATTGTA TTGGGACCAA CGGTTCGTAT TTTTGATACC 
CTAACAGAGT CTTTAGGCTC TTATTTACAA AATTTCTTTG GAATGAGCTT TCGTGCAGCT 
GCTTTTGACA ATACTAAACG TTCTTGGATT GATAATTGGA CGATTTTTTA TTGGGCGTGG 
TGGATTTCCT GGTCTCCTTT TGTTGGAGTT TTCATCGCTC GTATTTCTAA AGGGCGTAGC 
ATTCGGGAGT TTTTAACGGT AGTTCTTTTA ATACCGACAT TATTGAGTTT TGTATGGTTT 
GCAGCATTTG GCACATTATC AACTCAGGTA CAACAACTGG GTACTAATTT GACAAAGTTT 
GCAACAGAGG AAGTATTGTT TGCTACTTTT AATCACTACA CTTTAGGTTG GCTTTTATCC 
ATTATTGCTA TCATTTTAAT TTTTTCATTT TTTATTACAT CAGCAGATTC TGCAACGTAC 
GTTTTGGCTA TGTTGACAGA AGATGGTAAT TTAAACCCAA AAAATCGAAC TAAAGTAATT 
TGGGGGCTGG TGTTGGCAGT GATTGCTATT GTCTTACTCT TGTCTGGTGG TCTGTTAGCG 
CTGCAGAACG TTTTAATTAT TGTCGCTCTG CCATTTTCAT TCGTAATGAT TTTGATGATG 
CTAGCGTTAT TAGTGGAGCT TTTCCATGAG AAAAAAGAAA TGGGCTTATC GATTTCTCCA 
GATCGTTATC CACGTAAAAA TGAACCATTT AAATCTTATG AAGAATAA

Protein sequence

MSKKHITPVF TGSLIVSLIL VLLGIIVPRG FQSWTQILRE QVSTNFGWLY LLLVTSILAL 
CVFFIMSPLG QIRLGQPHSR PEYSTVSWIA MMFSAGMGIG LVFYGAAEPL SHFAISTPGA 
PKESQTALAD AFRFTFFHWG IHAWAVYALV ALALAYFGFR KQEKYLLSVT LKPLFGDKTD 
GWLGKIVDIT TVVATVIGVA TTLGFGAAQI NGGLSFLLGV PNNAFVQIVI ILITTALFVM 
SALSGLGKGV KILSNLNLIL AVALLALVIV LGPTVRIFDT LTESLGSYLQ NFFGMSFRAA 
AFDNTKRSWI DNWTIFYWAW WISWSPFVGV FIARISKGRS IREFLTVVLL IPTLLSFVWF 
AAFGTLSTQV QQLGTNLTKF ATEEVLFATF NHYTLGWLLS IIAIILIFSF FITSADSATY 
VLAMLTEDGN LNPKNRTKVI WGLVLAVIAI VLLLSGGLLA LQNVLIIVAL PFSFVMILMM 
LALLVELFHE KKEMGLSISP DRYPRKNEPF KSYEE