Gene RoseRS_2653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2653
Symbol
ID	5209622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	3290552
End bp	3292051
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	61%
IMG OID	640596255
Product	O-antigen polymerase
Protein accession	YP_001276977
Protein GI	148656772
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGGTT TTCTGTTCGA TCTCTATCAG CGCACCGCGC GCGCAACGTT TGTGCTGGCG 
TCCCTTTTCA TGGCGCTATG TCTGGCTGTC TTCTCCACTG GCGGATTGCC GCTCGCGTTT 
CGCCTGACAG GTCTGCTCCT GTTCGTAGCG CTGGCGCTGG TGCACCCGGC AGGCGGTCTG 
GCATGCGTCA TACTGACGGC GCCTCTCTAC CTGATGCCTG CAACGGTCGA TAGTCCGACG 
CGAACGCTGT TGCTTCCGCT GCATGAAGTC GCGCTGCTGA TCACGACTGC TGCCGTATGC 
TGGCGCTGGA TCGGCGGACA CATTCGAGAT CGCCGTATGC CCGATGCAGG CGCTGCCCTG 
CAACGTGTGC GCGCAATGAG CGTTTCCCAC GCTCCGGAAG CGTTGCTGGC GCTGGCGGGG 
ATCATCGGCG TGATGCTGGC AGTTCCGGAG GGTCGAGGCG CTGCGCTGCG CGAGTTTCGC 
TGGTTGATCG TTGAGCCGTT ACTGTTCTAT GGACTCGTGC GCACAATCAG AATGTCGCGC 
GAAACCCTGA TCGGCGCCCT GGCGCTCAGT GGCGCATTCG TGGCAGTGAT CGGCGCATTC 
CAGTTCGTCG GACTGGACCT GACGCCATTG ATCGGCGAGA AACGCGCCTT CAGCGAAAAC 
ATTATTGTTG TGGATGGGGT GCGACGGGTA ACGTCGGTCT ATGGTCATCC CAACAATCTG 
GGTCTCTATC TGGAACGGGT CTGGCCCCTG GCGGCGGCGA TGGCGGCGTG GATATGGCAT 
GCGCGGCGTG GAGACGGGGC AGCCAGCGCT TCTCCTGCTG TGTCGGAAAG GCGATCAACC 
GGCGCTGCCT TCTTCTTTGC CGCCTGTGCG CTGCTGTCGC TGACGGGGGT TGTGGTTTCC 
TTTTCGCGCG GTGCGTGGCT GGCGAGCGTG ATTGCGGCGG TTGTGTTGGG AGCAGGCTGG 
CTGCTGCACC GGTCACAGCA TCGACAGGCG GTGCGCTGGT CGGCGCTGGC GTTCATCGGA 
GCGCTGATCG TGGGAATGAC CGGACTGGCG CTGACGCTGC GCGGCGGTCC TGGCGGCGGA 
AGCGTCGATG CGCGTCTGCT TCTCTGGCGT GAGGCGCTGG TCTATCTCCG GCAGAATCCG 
CTCGGATTGG GGATCGACCA GTTTTACTAT TACCACAATC CGGCATTCGG GCGGAGTGCA 
ATCGATCCAT CGCTGGTCGG CACGAGCGAG GAATTTGCTG CGCATCCTCA CAATCTGCTG 
CTTGATGCTT GGGTGAATGT CGGACCTCTG GGGGTTCTGG CTTTTGGTCT GCTGCTGGTG 
CGCTTCTATC GCAACGCCCT CATCGCTGTG AGGAAACGGC GTGAGGTGGT GATTGCGGGG 
GCGCTGGCAG CGATGACTGC CGCACTCTTC CATGGTCTGG TCGATCGGTT CTATTTTGTG 
CCGGATCTGG CAATTGCATT TTGGGTGCTG ATGACTGTTG GGGAGAGAAG TGAGAATTGA

Protein sequence

MPGFLFDLYQ RTARATFVLA SLFMALCLAV FSTGGLPLAF RLTGLLLFVA LALVHPAGGL 
ACVILTAPLY LMPATVDSPT RTLLLPLHEV ALLITTAAVC WRWIGGHIRD RRMPDAGAAL 
QRVRAMSVSH APEALLALAG IIGVMLAVPE GRGAALREFR WLIVEPLLFY GLVRTIRMSR 
ETLIGALALS GAFVAVIGAF QFVGLDLTPL IGEKRAFSEN IIVVDGVRRV TSVYGHPNNL 
GLYLERVWPL AAAMAAWIWH ARRGDGAASA SPAVSERRST GAAFFFAACA LLSLTGVVVS 
FSRGAWLASV IAAVVLGAGW LLHRSQHRQA VRWSALAFIG ALIVGMTGLA LTLRGGPGGG 
SVDARLLLWR EALVYLRQNP LGLGIDQFYY YHNPAFGRSA IDPSLVGTSE EFAAHPHNLL 
LDAWVNVGPL GVLAFGLLLV RFYRNALIAV RKRREVVIAG ALAAMTAALF HGLVDRFYFV 
PDLAIAFWVL MTVGERSEN