Gene RoseRS_3471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3471
Symbol
ID	5210448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	4350926
End bp	4352098
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	63%
IMG OID	640597066
Product	glycosyl transferase, group 1
Protein accession	YP_001277779
Protein GI	148657574
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.152793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0339025
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATATTC TCTACGTCGC CAGCGGCATT CCAGTCCCCG GTACGCTCGG CGGCTCGGTC 
CATACCCTCG AAGTTGCGCG CGGGCTGGCA CAGCGCGGGC ACACGGTCGA TGTGGTTGCC 
TGCACTCGCC CTGACGTGTT CGATGTTGCC GCGCTGTTGC GCCCGATCTC GTCGCGCTAT 
GATCGGTTTC GTTTGCACCA CATCGATGTG CCCAAAACAC TGGCGTTGCT CTCCGCACCC 
GTGATCATGC GCCTGGCGCG CGCCCTGAAA CCGGACATCA TTATCGAACG GTACTACAAT 
TTCGCCGGCG CCGGTATTCT GGCAGCCCGT CGCCTCGGCG TACCGTCGAT CCTCGAAGTC 
AATGCGTTGA TTGTTGATCC GCCGGTTGTG TTGAAACGGC GTCTCGACGA TCTGCTTGGC 
GGACCGATGC GGCGCTGGGC GGTTGCACAG TGCCGTATGG CAGACCGGAT CGTCACACCG 
CTGCACACCA CTGTGCCGCC TGACATTCCG CGTTCCCGCA TCGTTGAATT GCCCTGGGGC 
GCCGATGTGG AACGCTTCTG CATTGATCGT TCGCAGGAAG GCACGACACC TGCCCTGCCA 
ACCGTCGTTT TCCTCGGTTC GTTCCGCGCC TGGCATGGCG TGCTCGATGC GGTGCGCGCA 
GGAGGTCTCC TGATCGAACA GGGGCGCGTC TGCCATTTCC TCCTGATTGG CGATGGTCCG 
CAGCACGCTG CCGCAGTGCG CCTGGCGGCG CGCTGGCAGG GACATTTCAC GTTCACCGGC 
GCCGTTCCCT ACGACGATGT GCCATCACTC CTGGCGCGGG CATCGATCGC GGTCGCACCG 
TTCGACACCG CAGCCCATCC GGCGCTGCGC GCTGCCGGAT TTTTCTGGTC GCCGTTGAAG 
GTCTTCGAGT ATATGGCGGC GGCGCTGCCG GTCGTGACCA TCGACATCCC GCCGCTCAAT 
CAGATCGTGC GTCACGGAAG CGAAGGGTTG CTCTACCCCG AAGGCGACGT TGATGCACTG 
GCAGGGGCAA TCGCATATCT GATCGACCAT CCCGACGAAG CGCGCGCTAT GGGAGAGCGC 
GGGCGGGCGC GCGTCACAGC GCATTTTTCA TGGTCGCGGC ACTGCGAGGC GCTGGAATGG 
GTGATGGAGG AGACGTTGAA GGTTGAAGGT TGA

Protein sequence

MNILYVASGI PVPGTLGGSV HTLEVARGLA QRGHTVDVVA CTRPDVFDVA ALLRPISSRY 
DRFRLHHIDV PKTLALLSAP VIMRLARALK PDIIIERYYN FAGAGILAAR RLGVPSILEV 
NALIVDPPVV LKRRLDDLLG GPMRRWAVAQ CRMADRIVTP LHTTVPPDIP RSRIVELPWG 
ADVERFCIDR SQEGTTPALP TVVFLGSFRA WHGVLDAVRA GGLLIEQGRV CHFLLIGDGP 
QHAAAVRLAA RWQGHFTFTG AVPYDDVPSL LARASIAVAP FDTAAHPALR AAGFFWSPLK 
VFEYMAAALP VVTIDIPPLN QIVRHGSEGL LYPEGDVDAL AGAIAYLIDH PDEARAMGER 
GRARVTAHFS WSRHCEALEW VMEETLKVEG