Gene RoseRS_4094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4094
Symbol
ID	5211077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	5133959
End bp	5135365
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	64%
IMG OID	640597682
Product	glycosyl transferase, group 1
Protein accession	YP_001278388
Protein GI	148658183
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.537371
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.779331
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCC TGTTGATGAC CCCGTTTCTC ACTATTGGCG GGGCTGACCG GTTGAATCTC 
GATGTGGTGC GGCAACTCAC CGGGCGCAGG TTCCGGTTCA GCGTTGTTGC GACCCTGCCG 
CATGCGCACG AGTGGCGTCC GCTGTTCGAG TCGATCACTC CCGATGTTGT GACGCTCCAT 
CCCATGATTG CGCCTGAGCA GCAACCTGCA TTTGTGCGTG ATCTGATCCG TTCGCGCGAC 
ATCCAGGCGC TGCTGATCAG CAACAGTCAG TTCGGCTATG TGCTGCTGCC CTACCTGCGC 
CGTCACTGTC CTGATGTTGT TGTCCTCGAT CTGCTGCATG CAGTGGAACC GCACTGGCTC 
GATGGCGGAT ATCCGCAACT CTCGCTCCAG CAACGCGCCT GGATCGACCT CAGTATCACG 
GTATCGGGCG ATCTGCACGA CTGGATGATT GCGCGTGGCG GCGATCCGGA GCGGATCGTT 
GTCAGCCCGG CAGCCATTGA TGTGAACGTG TGGAATCCGG CGCACTTTGA CCGGGCGACC 
ATTCGCCAGG CGTCTGGCAT GCCTCTCGAT CTGCCCCTGA TCCTCTCCGT CGGGCGTCTC 
GCACCAGAAA AGCGACCGCG CCTGGCGATG CGAATCCTGC GCGATGTTGC GCAGCGCGGT 
GTTCCGTTCA GTGCGCTGAT CATCGGCGAA GGTCCTGAAC GTCCGGTGCT GGAACGCATG 
CTGCACGATC CGGTGCTGCG CAACGTTCGA CTGACCGGGG CGCTTCCCCC GGAGCGGGTG 
CGCGAGGCGC TGGCAGCCGC CGATCTCCTG CTCCTGCCCT CCGCGCGTGA AGGAATCGCA 
ATAGTGCTCT ACGAAGCCAT GGCAATGGGA GTCGTCCCTG TTGCAGCCGA TGTTGGCGGG 
CAACGCGAAC TCGTCACCCC CGACTGCGGC ATCCTTGTCC CGCCGTCGGG CGATGAAACC 
ACCGCGTATG CCGCCGCGAT CATCGGTTTG CTGACCGATC CAACGCAGCG TGCCGCGATG 
GGGGCGCGTG CACGCCAACG GATCGTCGAT CATTTCCGGC TCGATCTGAT GGGGGACCGG 
ATGGAAGCCT TCATGCGGCA TGCAGTCGAG CATTCAGCGC GCGCGGGTCG CACCATCCCT 
ACGCCGGAAG AAGCTGAGCG GAGCGCGATC GAAGCGATCC AGCTTGCGCG CCAGGCGCGC 
AATGTTGCGC GTTTGTGGGA GACCGGCGGG TATGCCGGTG ACATTGATCT GTCACCAGCG 
CGTCGTGCTG CGCTGCGGAT TGTGCGCAGC GCGCGGAAGC ATCTGCGACC GTGGTACCGG 
CGACTCGCCG CGCACGACGA CAGTCGGTTG CGGCGCGGCG TCCTGACCGT GCGCGATTGG 
GTGGTGCGAT GGGTGTATCG CGCGTAG

Protein sequence

MRILLMTPFL TIGGADRLNL DVVRQLTGRR FRFSVVATLP HAHEWRPLFE SITPDVVTLH 
PMIAPEQQPA FVRDLIRSRD IQALLISNSQ FGYVLLPYLR RHCPDVVVLD LLHAVEPHWL 
DGGYPQLSLQ QRAWIDLSIT VSGDLHDWMI ARGGDPERIV VSPAAIDVNV WNPAHFDRAT 
IRQASGMPLD LPLILSVGRL APEKRPRLAM RILRDVAQRG VPFSALIIGE GPERPVLERM 
LHDPVLRNVR LTGALPPERV REALAAADLL LLPSAREGIA IVLYEAMAMG VVPVAADVGG 
QRELVTPDCG ILVPPSGDET TAYAAAIIGL LTDPTQRAAM GARARQRIVD HFRLDLMGDR 
MEAFMRHAVE HSARAGRTIP TPEEAERSAI EAIQLARQAR NVARLWETGG YAGDIDLSPA 
RRAALRIVRS ARKHLRPWYR RLAAHDDSRL RRGVLTVRDW VVRWVYRA