Gene EcSMS35_3700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3700
Symbol	rtcA
ID	6147489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3763365
End bp	3764381
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	60%
IMG OID	641618527
Product	RNA 3'-terminal-phosphate cyclase
Protein accession	YP_001745667
Protein GI	170680706
COG category	[A] RNA processing and modification
COG ID	[COG0430] RNA 3'-terminal phosphate cyclase
TIGRFAM ID	[TIGR03399] RNA 3'-phosphate cyclase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.0886189
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGGA TGATTGCGCT GGATGGCGCA CAGGGCGAAG GCGGCGGGCA GATCCTGCGC 
TCGGCGCTGA GCCTGTCGAT GATAACCGGC CTGCCATTTA CCATCACCGG CATTCGTGCC 
GGGCGGGCAA AACCGGGACT GTTGCGCCAG CATCTGACCG CGGTAAAAGC GGCTGCGGAA 
ATTTGTAGGG CAACGGTGGA AGGTGCGGAG CTGGGATCGC AGCGTCTGCT CTTCCGGCCC 
GGCACCGTGC GCGGCGGCGA TTACCGCTTT GCTATCGGTA GCGCCGGAAG TTGTACGCTG 
GTGCTGCAAA CGGTGCTGCC CGCGCTGTGG TTTGCCGATG GACCTTCGCG TGTTGAAGTG 
AGCGGAGGCA CCGATAACCC GTCGGCCCCG CCTGCGGATT TTATCCGCCG GGTGCTGGAG 
CCGCTGCTGG CGAAAATGGG CATTCATCAG CAAACCACAC TAATACGCCA CGGTTTTTAT 
CCTGCCGGAG GCGGGGTGGT GGCAACGGAA GTCTCGCCCG TGGCATTGTT TAACACCTTG 
CAACTTGGCG AGCGCGGGAA CATTGTGCAG ATGCGTGGAG AGGTGCTATT AGCTGGCGTG 
CCGAGGCATG TTGCTGAGCG TGAAATCGCT ACGCTGGTGG GGAGTTTTTC CCTGCATGAG 
CAGAATATTC ATAACCTGCC GCGTGACCAG GGGCCGGGTA ATACCGTCTC GCTTGAAGTC 
GAAAGTGAAA ATATCACCGA ACGCTTTTTT GTCGTCGGTG AAAAGCGCGT CAGCGCTGAG 
GTGGTCGCGG CACAGTTGGT GAAAGAGGTG AAACGCTACC TGGCAAGCCC GGCGGCGGTG 
GGGGAATATC TCGCCGACCA ACTGGTGCTA CCGATGGCGC TGGCGGGCGC GGGAGAATTT 
ACGGTCGCCC ATCCCTCATG CCATCTGCTG ACCAATATTG CGGTGGTGGA GCGTTTCTTG 
CCAGTGCGGT TTGGTCTGGT GGAGGCTGAT GGCGTAACGC GGGTGAGCAT TGAATGA

Protein sequence

MKRMIALDGA QGEGGGQILR SALSLSMITG LPFTITGIRA GRAKPGLLRQ HLTAVKAAAE 
ICRATVEGAE LGSQRLLFRP GTVRGGDYRF AIGSAGSCTL VLQTVLPALW FADGPSRVEV 
SGGTDNPSAP PADFIRRVLE PLLAKMGIHQ QTTLIRHGFY PAGGGVVATE VSPVALFNTL 
QLGERGNIVQ MRGEVLLAGV PRHVAEREIA TLVGSFSLHE QNIHNLPRDQ GPGNTVSLEV 
ESENITERFF VVGEKRVSAE VVAAQLVKEV KRYLASPAAV GEYLADQLVL PMALAGAGEF 
TVAHPSCHLL TNIAVVERFL PVRFGLVEAD GVTRVSIE