Gene SAG2071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG2071
Symbol
ID	1014882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	2052834
End bp	2054036
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	36%
IMG OID	637317237
Product	Na+ dependent nucleoside transporter
Protein accession	NP_689057
Protein GI	22538206
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter [TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.626229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTTA TTTATAGTAT TATTGGTATT TTATTGGTAT TAGGAATTGT GTATGCAATT 
TCTTTCAATC GTAAGAGTGT TTCTCTAAGT TTAATTGGAA AAGCTCTTAT CGTTCAATTC 
ATTATTGCGC TAATCTTAGT ACGTATCCCA CTAGGTCAAC AAGTTGTTAG TGTTGTTTCA 
ACTGGAGTTA CTAAAGTAAT CAACTGTGGT CAAGCTGGAT TAAATTTTGT GTTTGGTTCA 
TTAGCAGATA GTGGAGCAAA AACTGGTTTT ATTTTCGCCA TTCAAACGCT TGGCAATATT 
GTTTTCTTAT CTGCCCTAGT TAGTCTACTT TATTATGTAG GAATCCTTGG ATTTGTAGTA 
AAATGGATAG GTAAGGGCGT TGGTAAAATT ATGAAATCCT CAGAGGTTGA GAGTTTTGTT 
GCCGTAGCTA ATATGTTTCT TGGTCAAACA GACAGTCCAA TTTTGGTTAG CAAATACCTA 
GGTCGTATGA CTGATAGTGA GATAATGGTT GTGTTGGTAT CAGGTATGGG AAGTATGTCA 
GTTTCTATTC TTGGTGGCTA CATTGCATTA GGCATTCCAA TGGAATATCT CTTGATTGCT 
TCAACAATGG TTCCTATTGG CAGTATTCTC ATTGCTAAAA TCTTATTGCC TCAAACAGAA 
CCTGTTCAAA AAATTGATGA CATTAAGATG GATAATAAAG GTAATAACGC CAATGTGATT 
GATGCAATCG CTGAGGGTGC AAGCACAGGT GCACAAATGG CTTTCTCAAT TGGTGCTAGT 
TTGATTGCCT TTGTTGGTTT AGTTTCTTTG ATTAATATGA TGTTAAGTGG ATTGGGAATC 
CGCTTAGAAC AAATCTTCTC ATATGTTTTT GCTCCATTTG GTTTTCTTAT GGGATTTGAC 
CACAAAAACA TTCTTCTAGA AGGAAACCTT CTTGGAAGTA AGTTGATTTT AAATGAGTTT 
GTTTCGTTCC AACAATTGGG TGACCTAATC AAATCTTTAG ATTATCGTAC AGCATTGGTA 
GCAACTATTT CACTTTGTGG TTTTGCTAAT TTATCAAGTT TAGGTATTTG TGTTTCAGGT 
ATTGCTGTTC TTTGTCCAGA GAAACGTGGC ACCCTAGCTC GACTTGTTTT CCGTGCAATG 
ATTGGTGGTA TTGCTGTAAG TATGCTTAGC GCCTTTATCG TCGGTATTGT AACTCTATTC 
TAA

Protein sequence

MQFIYSIIGI LLVLGIVYAI SFNRKSVSLS LIGKALIVQF IIALILVRIP LGQQVVSVVS 
TGVTKVINCG QAGLNFVFGS LADSGAKTGF IFAIQTLGNI VFLSALVSLL YYVGILGFVV 
KWIGKGVGKI MKSSEVESFV AVANMFLGQT DSPILVSKYL GRMTDSEIMV VLVSGMGSMS 
VSILGGYIAL GIPMEYLLIA STMVPIGSIL IAKILLPQTE PVQKIDDIKM DNKGNNANVI 
DAIAEGASTG AQMAFSIGAS LIAFVGLVSL INMMLSGLGI RLEQIFSYVF APFGFLMGFD 
HKNILLEGNL LGSKLILNEF VSFQQLGDLI KSLDYRTALV ATISLCGFAN LSSLGICVSG 
IAVLCPEKRG TLARLVFRAM IGGIAVSMLS AFIVGIVTLF