Gene RoseRS_3583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3583
Symbol
ID	5210561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	4480442
End bp	4481668
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	61%
IMG OID	640597177
Product	glycosyl transferase, group 1
Protein accession	YP_001277889
Protein GI	148657684
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGTCG GTATCGATTT TACGGCTGGC GTCTGGCAGG GGGCCGGCAT TGGGCGGTAC 
ACACGCGAAC TGATCGGCGC CGTTCTTGCT CAGAGTCCTG ATCTTCGCTT CACGCTGTTC 
TACGCCGCTG GCTTTCCAGG CGCTGATTCT CCGCCCTATC TGCCTGAGGT GCATCGCCTC 
TGCGCCTCAC ATCCGCATAC CCGCGCCGTC CCGATCCCGC TGCCGCCGCG TCGCCTGACG 
CAGATCTGGC ATCGGTTGCG CATTCCGCTG CCGATCGAAT GGCTGACCGG TCCGCTCGAT 
ATTCTGCACG CGCCTGATTT CGTGCCGCCG CCAACCCGCG CTCGCACCCT CGTCACCATC 
CACGATCTCT CGTACATGGT GCATCCCGAG TGCGCAGTTC CGGGAGTCGC CGCTTATCTG 
CGCGATGCCG TGCCGCGCGC CTTGAAGCAA GCCAGTATCA TTATTGCCGA TTCGGAGTCG 
ACCAGGCGCG ATCTGCATCG ACTGTTGAAC ATCGCCCTCG ACCGTGTGAC GGTGGTCTAT 
CCAGGGGTCG ATGCGCGTTT CCGCCCGTTG CCGCCGGACG TATGCGAACC GGTGCGGTGT 
CGGTTGAACC TGCCACGCCG TTTCATTCTG TTTGTAGGCA CCATCGAACC GCGGAAGAAC 
CTCGTGCGGT TGCTGGAAGC GTTTGCCCGC ATCGACCCGA CGACGGGCGG GGAGGACCTC 
TTCCTGGTAC TCGCCGGTCG CCGTGGATGG ATGTATCAAC CGGTGTTCGC GGCCATTGAC 
CGGTTGAATT TACATGATCG TGTCCAACTG CTCGATTTTG TGGCGGATTC TGACCTGCCG 
GTAGTGTATA ATCTTGCACA GGTATTCGTG TATCCCTCAC TGTACGAGGG GTTCGGCTTA 
CCACCGCTCG AAGCGCTGGC GTGCGGTACG CCGGTGGTGA CATCTGACAA TTCGAGTCTC 
CCGGAGGTGG TGGGCAATGC CGCTCTCCTG GCGCGCGCCG ATGATGTGGA GGCGCTTTCG 
GAGGGGATGA TCCGCCTGTT GAAAGACGTG GCGCTGCGGG ATCGGTTGCG TCAGGCGGGT 
CTGGAACAGG TGCGACGGTT TCGTTGGGAA GCGTCTGCCC GACAGATTAT CGAACACTAT 
CATACGTTGT CAACGGGAGC ATCGCATGAG GCAACAACCG GAGCTCTCCG GCGAAGCGCT 
CGACTCCGAC GAGATGGAGA GCCGTAG

Protein sequence

MHVGIDFTAG VWQGAGIGRY TRELIGAVLA QSPDLRFTLF YAAGFPGADS PPYLPEVHRL 
CASHPHTRAV PIPLPPRRLT QIWHRLRIPL PIEWLTGPLD ILHAPDFVPP PTRARTLVTI 
HDLSYMVHPE CAVPGVAAYL RDAVPRALKQ ASIIIADSES TRRDLHRLLN IALDRVTVVY 
PGVDARFRPL PPDVCEPVRC RLNLPRRFIL FVGTIEPRKN LVRLLEAFAR IDPTTGGEDL 
FLVLAGRRGW MYQPVFAAID RLNLHDRVQL LDFVADSDLP VVYNLAQVFV YPSLYEGFGL 
PPLEALACGT PVVTSDNSSL PEVVGNAALL ARADDVEALS EGMIRLLKDV ALRDRLRQAG 
LEQVRRFRWE ASARQIIEHY HTLSTGASHE ATTGALRRSA RLRRDGEP