Gene RoseRS_4233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4233
Symbol
ID	5211218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5303703
End bp	5304920
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	57%
IMG OID	640597822
Product	glycosyl transferase, group 1
Protein accession	YP_001278526
Protein GI	148658321
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.968175
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000923088
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCATCC TTGCACTCAC ATCCTGGTGG CCCGAACCGG CAGACAACGG CTCGCGGCTG 
CGTATTGCCA GTTTACTGCG CGCAATGGCG CAGCGCCACG ATATTCACCT CATTTCGTTC 
TTTCAGGAGC CGGTTACCGA AGCGCAGATC CGAAGAATGC GCGAGATATG CACCGCAGTC 
GAGGCAATCC CTCAACCGGT ATGGCGACCG CGTCCGGGAG AACAAATCCT GAGCCTGTGG 
CACCCGGAAC CAAGTTCTTT TCGTGCCACC TGGAGCGCGG CATTCGATGC GTGTGTGCGA 
CGTGCTGCAA CCGATGCGCC TGATATGGTG ATCGCCTTTC AAACCGGCGT CGCGCGGTAT 
GCTCTAAGCG TACCGGGCGT TCCGCGGTTG CTCGAAGAAC TCGAAGTTGG AAATTTCTAC 
ACCCACGTGC ATCTTCAGAA AATGCCGCAC CATCGGTTGC GCGCATGGTT AACGTGGCGC 
AAACAGACGG CATACATCCG CCGTTTGCTT GGTCACTTCG ATGCCTGTAC TGTTGTTTCT 
GTGAATGAGC AACGATTGAC CCATGCAATC GCGCCGGGTG CGACGGTTTA CGTTCTGCCG 
AACGGAACCG ATGTGAGTGT CGGTGATCAG GATTGGGGCG CGCCCCAACC GGATACGCTG 
ATCTATCCCG GTGCACTAAC ATTCGACGCC AATTTTGATG CCGTTGATTA TTTTCTGCGT 
GATATTTTTC CACGCGTAAA GGCGCAGCGA CCGGAAGTGC GATTTGTGGT GACCGGCAAT 
GCCCCGCCGA CGCTCAGAAC GGCGCTGCCA CAGATAGAGG GCGTCGAGTT TACCGGCTAC 
GTTCCTGATG TTCGCCCGGT TATCGCGCGT TCCTGGTGTG AAGTCGTGCC CCTGCGATCA 
GGCGGCGGGA CGCGACTCAA GGTGCTCGAA GCGCTCGCAC TCGGCGTTCC GGTCGTTTCA 
ACGCCAAAAG GCATCGAGGG TCTGGCGCTT GATGATGATA TTCATGTCCT GGTTGCGCCA 
ACTACCGATG AATTTGTAGA CGCAACGCTG CGCATTCTTG ATCAACCGGA ATTGCGCGCG 
CGTCTGGCGG AAGCCGGGCG TCGTCGCGTG GCAGAGTTGT ACGACTGGCG AATCATCGGT 
CAACAGATGA ATGAGTTAAT CGAGGAAATC ATTCGCCAGC ATTCGGGTAG ACGATCTGTT 
TATAGCACGC ATGCCTGA

Protein sequence

MRILALTSWW PEPADNGSRL RIASLLRAMA QRHDIHLISF FQEPVTEAQI RRMREICTAV 
EAIPQPVWRP RPGEQILSLW HPEPSSFRAT WSAAFDACVR RAATDAPDMV IAFQTGVARY 
ALSVPGVPRL LEELEVGNFY THVHLQKMPH HRLRAWLTWR KQTAYIRRLL GHFDACTVVS 
VNEQRLTHAI APGATVYVLP NGTDVSVGDQ DWGAPQPDTL IYPGALTFDA NFDAVDYFLR 
DIFPRVKAQR PEVRFVVTGN APPTLRTALP QIEGVEFTGY VPDVRPVIAR SWCEVVPLRS 
GGGTRLKVLE ALALGVPVVS TPKGIEGLAL DDDIHVLVAP TTDEFVDATL RILDQPELRA 
RLAEAGRRRV AELYDWRIIG QQMNELIEEI IRQHSGRRSV YSTHA