Gene RoseRS_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3304
Symbol
ID	5210279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	4150357
End bp	4152027
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	66%
IMG OID	640596900
Product	phosphoenolpyruvate-protein phosphotransferase
Protein accession	YP_001277615
Protein GI	148657410
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01417] phosphoenolpyruvate-protein phosphotransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATTT ACCTGCGTGG CGCTGGCGGT TCGCCGGGAG TGGCGCTCGG ACGGGCGGTG 
CGTTACCTGC CTGACCATCA CGCCTGGCAC GTGATCGATG CCGACGTCGA TGCGGCGATC 
AGACGACTCG TTGCTGCTCA GGCAACGGCT GCCGGTCAAC TTCGGGCGCT GGCAGCGATC 
CTGCGCGAAG AGGGACGCCT GGAGGAAGCA CGCATCTTCG ATGCCCATGC GCTGCTCGTC 
GAAGATGAGA CCCTGACACA GGATGTGGCG CGGCGTATGC GCGAAGGGCA CGTCAGCCTG 
GAACAGGCGC TGACGGTTGC CATCAGCGCG CTGCGCGAAA CCATCGAAGC GATTGATGAC 
CCCTACCTGC GCGAACGCTC CAGCGACATC GACAGCGTGC GCCGCGCGAT CCTGACCGCA 
CTGCGTGGCG AGGCGCGCCA CATGCACGAT CTCCCGATTG GCGCGATCCT GGTCGCCAGC 
GACCTGACCC CCGCCGAGGC GGTCAGCCTG CGCGATGGGC GTGTCGCCGG GTTTGTCACT 
GCCGAAGGCG GACCGAACAG TCACACGACA ATCCTGGCGC GCGCCTTCGG CATCCCGGCA 
GTCGTCGGTT TGGGCGCCGC AACCCTGGCG ATCCCCGATC ATGCGCCGCT GGTGCTCGAC 
GGACACGCTG CCCTGGTGAT CGTCGATCCT GATACGTTTG AGTGGTCGGC GTATGAACGC 
CGGGCTTCGG GAACGGTCGC GGCGCGGGTG CAGCGCCATC CCCTGCACGA TCAGCCGGGA 
CGCATGGCGA GCGGCGAACT GGTGACGATC TGGGCGAATA TCAGCCATCC GCTGGAAGCG 
CGCATCGCGC TTGAACGGGG CGCGGAGGGG ATCGGATTGT TTCGCACCGA GTTTCTGTTC 
ATGGGACGAA ACACGCCGCC TGATGAGCAG GAGCAGTACG AAGCGTATCG GACAGTGGTG 
GAAACCATGA AAGGGCAGGC GGTCATTATT CGCACGCTGG ACATCGGCGG CGATAAGCGG 
GTGGAGTATC TCGAACTGCC GCGTGAACTC AACCCTTCGC TCGGCATTCG CGGGTTGCGC 
CTCTCCATGC TGCATCCCGA TCTGTTCCAG ACGCAGATCC GCGCCATGCT CCGGGCGGCG 
GTTCACGGCG ACCTGCGCAT CCTGCTCCCT ATGGTCACAA CCCCCGACGA AGTGACGTGG 
GCGCGGGCGC AGGTCCGCGC CGCCGCCGAG TCGCTGGCGC GCGATCAGAT CCCGCACCGC 
GCCGATGTGC CGGTCGGCGT TATGATCGAA ACGCCGGCTG CGGCGGTGAC CGCCGACCTG 
ATCGCGCGTG AGGCGGCATT CTTCAGCATT GGCAGCAACG ATCTGGCGCA GTATACGCTC 
GCTGCCGATC GTACCAGCGC CGATGTTTCG ACCCGCTATC CGCAGCACTC CGCTGCGGTG 
CTGCGACTGA TCGCGCAGAC TGTCGGCGCT GCGGCGCGCG CCCATCTGCC GGTATGCGTC 
TGCGGCGAGA TTGCCGGCGT CCCGGAACTG GCGTCGCTTC TGGTTGGACT TGGCGTGTTT 
CAGTTGAGCA TGAATCCGGC AAGCATCCCT GGGGTCAAGG AGCGTCTCAG CGAAACCGCT 
CTGGCGGAAG CGCGCGCCGC AGCACGCTCC GTATTGAATA TCTACGTATG A

Protein sequence

MAIYLRGAGG SPGVALGRAV RYLPDHHAWH VIDADVDAAI RRLVAAQATA AGQLRALAAI 
LREEGRLEEA RIFDAHALLV EDETLTQDVA RRMREGHVSL EQALTVAISA LRETIEAIDD 
PYLRERSSDI DSVRRAILTA LRGEARHMHD LPIGAILVAS DLTPAEAVSL RDGRVAGFVT 
AEGGPNSHTT ILARAFGIPA VVGLGAATLA IPDHAPLVLD GHAALVIVDP DTFEWSAYER 
RASGTVAARV QRHPLHDQPG RMASGELVTI WANISHPLEA RIALERGAEG IGLFRTEFLF 
MGRNTPPDEQ EQYEAYRTVV ETMKGQAVII RTLDIGGDKR VEYLELPREL NPSLGIRGLR 
LSMLHPDLFQ TQIRAMLRAA VHGDLRILLP MVTTPDEVTW ARAQVRAAAE SLARDQIPHR 
ADVPVGVMIE TPAAAVTADL IAREAAFFSI GSNDLAQYTL AADRTSADVS TRYPQHSAAV 
LRLIAQTVGA AARAHLPVCV CGEIAGVPEL ASLLVGLGVF QLSMNPASIP GVKERLSETA 
LAEARAAARS VLNIYV