Gene SAG1235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1235
Symbol
ID	1014042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1244650
End bp	1245927
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	44%
IMG OID	637316416
Product	GBSi1, group II intron, maturase
Protein accession	NP_688240
Protein GI	22537389
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00153428
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGAAT TGCTAGATAA GATATTATCT CGGAACAATA TGCTCGAAGC TTACAAGCAA 
GTGAAATCAA ACAAAGGTTC TGCTGGTATC AATGGGGTCA CTATCGAGCA GATGGATGAC 
TATCTTCACC AAAATTGGCG AGAAACCAAG CAACTCATCA AAGAGAGGAG CTATAAACCT 
CAACCGGTTC TCAGGGTTGA AATCCCAAAA CCAAACGGAG GAGTTCGTAA CCTAGGTATC 
CCGACGGCTA TGGATAGAAT GATTCAGCAG GCCATCGTTC AAGTTTTGAG TCCACTCTGC 
GAAAAACATT TTTCAGAGTA TAGCTATGGG TTCAGACCCA ATCGCTCCTG CGAAACAGCC 
ATTGTTCAGC TACTTGAGTA TTTAAACGAT GGCTACGAGT GGATTGTGGA CATTGACTTG 
GAAAAGTTCT TCGATACTGT TCCGCAAGAC AGATTGATGT CCCTGGTTCA TAATATCATT 
CAAGATGGCG ATACGGAGTC ACTGATTCGT AAGTACCTCC ATTCGGGAGT TGTTATTAAC 
GGACAGCGAC ATAAGACTTT AGTCGGGACA CCTCAAGGCG GGAATCTATC ACCCCTCCTA 
TCTAATATTA TGCTTAATGA GTTAGACAAA GGGTTGGAAA AGCGAGGTCT TCGCTTTGTC 
CGTTACGCCG ATGACTGTGT CATCACTGTC GGAAGCGAAG CAGCTGCTAA GCGGGTCATG 
CATTCGGTCA GTAGCTATAT TGAGAAGCGA TTAGGGTTGA AAGTCAACAT GACTAAGACC 
AAGATTGTCA GACCGAACAA ACTCAAATAC CTCGGATTTG GTTTCTGGAA ATCTCCAAAA 
GGTTGGAAGT GTCGTCCTCA CCAAGACAGC GTTCAGAGCT TTAAGCGAAA ACTGAAGCAA 
CTGACGATGA GGAAATGGAG CATTGACCTG ATAACTCGCA TTGAACGATT GAACTGGGTC 
ATTCGAGGAT GGATAAACTA TTTCTCGCTT GGCAATATGA AGAGTATCAT GACACAAATA 
GATGAGCGTC TGCGAACCCG TATTCGAGTG ATTATCTGGA AGCAATGGAA GAAGAAAGCA 
AAGCGCCTAT GGGGACTCTT AAAACTAGGA GTTGCTAGAT GGATAGCCGA TAAAGTTTCT 
GGATGGGGTG ACCACTATCA GTTGGTAGCT CAGAAGTCGG TACTCAAACG TGCTATATCA 
AAACCAGCCC TCGCAAAGCG AGGACTGGTC AGTTGCTTAG ATTACTATCT TGAACGACAT 
GCGTTAAAAG TTAGTTGA

Protein sequence

MSELLDKILS RNNMLEAYKQ VKSNKGSAGI NGVTIEQMDD YLHQNWRETK QLIKERSYKP 
QPVLRVEIPK PNGGVRNLGI PTAMDRMIQQ AIVQVLSPLC EKHFSEYSYG FRPNRSCETA 
IVQLLEYLND GYEWIVDIDL EKFFDTVPQD RLMSLVHNII QDGDTESLIR KYLHSGVVIN 
GQRHKTLVGT PQGGNLSPLL SNIMLNELDK GLEKRGLRFV RYADDCVITV GSEAAAKRVM 
HSVSSYIEKR LGLKVNMTKT KIVRPNKLKY LGFGFWKSPK GWKCRPHQDS VQSFKRKLKQ 
LTMRKWSIDL ITRIERLNWV IRGWINYFSL GNMKSIMTQI DERLRTRIRV IIWKQWKKKA 
KRLWGLLKLG VARWIADKVS GWGDHYQLVA QKSVLKRAIS KPALAKRGLV SCLDYYLERH 
ALKVS