Gene SAG1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1920
Symbol
ID	1014730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1903230
End bp	1904567
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	36%
IMG OID	637317088
Product	CCS family citrate carrier protein
Protein accession	NP_688909
Protein GI	22538058
COG category	[C] Energy production and conversion
COG ID	[COG3493] Na+/citrate symporter
TIGRFAM ID	[TIGR00783] citrate carrier protein, CCS family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.296247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGACG TGAAGGTAGT GAATAATGAG GATTCTAGAG GTCAAAAGCA AGACTTAAAG 
GCTAAACTAT TTCATATTAA GATAGGGTCA GTTCCCCTAC CAGTATATGT TTGTTTAGCA 
TTATTGATTC TTCTAGCAGG CTTTTTACAA AAATTGCCAG TCAATATGCT AGGAGGATTT 
GCAGTTATCT TAACAATGGG GTGGTTCTTA GGGACTATCG GAGCTAGCAT TCCTGGTTTT 
AAAAACTTCG GTGGCCCAGC TATTTTATCT TTATTAGTAC CATCTATTTT GGTGTTTTTC 
AACCTCATTA ATAAAAATGT TTTAGAATCA ACAAATATGT TGATGAAGCA AGCTAACTTT 
CTTTATTTTT ATATTGCTTG TTTAGTGTCC GGTAGTATTT TAGGGATGAA TCGGAAAATG 
TTGATTCAGG GATTGCTAAG AATGATTTTC CCCATGTTAT TAGGAATGGT TTGTGCGATG 
ATGGTAGGGA CATTTGTCGG TGTTATTTTA GGCTTAGAGT GGCGACACAC TTTGTTTTAT 
ATCGTAACAC CCGTTTTAGC TGGTGGTATT GGTGAAGGTA TTTTACCATT ATCGTTAGGC 
TATAGTTCAA TTACCGGTGT AGCTAGTGAA CAACTAGTTG CTCAACTCAT CCCAGCCACT 
ATTATTGGTA ATTTCTTTGC CATTTTATGT ACTGCACTAT TGAATCGTTT GGGAGAAAAG 
AAACCACACT TGTCTGGTCA AGGGCAATTA GTAAGGTTAA ATAAAGGAGA GGACATGTCA 
GATATTATTG CTGATCATTC TGGCCCAATT GACGTTAAGA AAATGGGTGG AGGTGTTTTA 
ACAGCATGTA GTCTCTTTAT TTTTGGACAT TTGTTGCAGC AATTAACTGG ATTTCCTGGT 
CCCGTATTAA TGATTGTTGC AGCAGCTATT TTGAAATATA TTAATGTTAT TCCTAGAGAA 
ACACAAAATG GAGCTAAGCA ACTTTATAAA TTTATTTCTG GTAATTTTAC ATTTCCTCTA 
ATGGCAGGTC TAGGATTGCT TTATATCCCG TTAAAAGATG TTGTGGCAAC GCTTAGCATA 
CAATATTTCA TAGTTGTTAT TAGTGTTGTA TTTACAGTTA TTTCTGTTGG ATTCTTTGTA 
TCGCGATTCC TTAATATGAA TCCTGTTGAA GCAGGTATTA TTTCAGCTTG TCAAAGTGGT 
ATGGGAGGAA CAGGAGATGT TGCCATTTTA AGTACAGCAG ACCGAATGAA CTTGATGCCA 
TTTGCTCAAG TTGCTACGCG TTTAGGAGGA GCTATTACTG TTATCACAAT GACAGCCATT 
TTACGCATGT TATTCTAA

Protein sequence

MADVKVVNNE DSRGQKQDLK AKLFHIKIGS VPLPVYVCLA LLILLAGFLQ KLPVNMLGGF 
AVILTMGWFL GTIGASIPGF KNFGGPAILS LLVPSILVFF NLINKNVLES TNMLMKQANF 
LYFYIACLVS GSILGMNRKM LIQGLLRMIF PMLLGMVCAM MVGTFVGVIL GLEWRHTLFY 
IVTPVLAGGI GEGILPLSLG YSSITGVASE QLVAQLIPAT IIGNFFAILC TALLNRLGEK 
KPHLSGQGQL VRLNKGEDMS DIIADHSGPI DVKKMGGGVL TACSLFIFGH LLQQLTGFPG 
PVLMIVAAAI LKYINVIPRE TQNGAKQLYK FISGNFTFPL MAGLGLLYIP LKDVVATLSI 
QYFIVVISVV FTVISVGFFV SRFLNMNPVE AGIISACQSG MGGTGDVAIL STADRMNLMP 
FAQVATRLGG AITVITMTAI LRMLF