Gene RSP_1872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1872
Symbol
ID	3719140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	469645
End bp	471459
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	72%
IMG OID	640070032
Product	glycosyl transferase family protein
Protein accession	YP_351923
Protein GI	77462419
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGTGA TGCTGCTGCG CGAAGGGCAT CTCGCGCCGC ACCGGATCAT GGCGGCCCTC 
AGTCACGGCG GGCGGCCGTC CGCACCCCTC GCCGATCTGC TGCTCGCCGA AGGCGCCCTG 
TCCGAGGACG AGATCCTCGC CATGATGGCG CGGCGGAGCG GGCTGCCGGT GCTCGACCCC 
GCGGCCGAGC GGCCCGATCC CCGGCTCATC GACCGGCTGG GGGTGCGGGA CTGTCTGCGC 
GAGGGCCTCC TGCCCCTCCG CGACACGGGC AGCGCCGTCC TGCTGGCGGC GGCGGCCCCC 
GAGAGCTTCC GCCGCCACCG GCCGCGGCTC GAGGAGCTGT TCGGCACCGT GATCCCCGCC 
CTCGCCAGCC GCTCGTCCAT CGAGGACGCG CTGCAGGAGC TGCGCGCGGA CGCCATCGGA 
GCCGCGGCCG AACTTCGGGT CGCACCGGAG GAAAGCTGCC GCGACTGGCG CACGGGGCGG 
ATGACTCGGC TCGCGGCGCT GGCGGGCCTC GCCCTCGCCG CGGGCCTCGC CTTGGCACCG 
GGCCTTGTGC TGCTCGCCCT GACCGCCTGG GCGCTTCTGG CGCTAGCCTG CGGCACAGCG 
CTGCGGCTGG CAACCGCGGT GGCGAGCCTG CGCCGCCCTC CGCCCGAGCC CGAAAGCCCG 
CCGCTCCTGC ATCTGCCGAT GGTCTCGATC ATCGTGGCGC TCTATCGCGA AGAGGATATC 
GCGGGCCGTC TCGTGGCGCG CCTCGGCCGC CTCGACTATC CCCACGACCG GCTCGAGATC 
CTGCTTGTGG TGGAAGAGGC CGACCGACGG ACACGGCGGG CGCTGCTCGA GGCGCGCCTG 
CCGCCCTGGA TGCGGATCGT GGTCTCGCCC AAAGGCGCGA TCCGCACCAA GCCGCGGGCG 
CTCAACGTGG CGCTCGACCA TTGCCGGGGC TCCATCGTGG GCGTCTACGA CGCCGAGGAC 
GCGCCCGAGC CCGACCAGAT CCGCCGCGTG GTCGAGGGCT TCAGCCGGCG CGGCTCGCAC 
GTCGCCTGCC TGCAGGGACG GCTCGACTAT TACAACCCGC GCACCAACTG GCTGTCGCGC 
TGCTTCACCA TCGAATATGC GGCCTGGTTC CGGCTGATGC TGCCGGGGCT CGACCGGCTG 
GGGCTCGTGG TCCCGCTCGG AGGCACCACC CTCTTCTTCC GCCGCGCGGC GCTCGAGGAG 
CTGGGCGCCT GGGACGCGCA TAACGTGACC GAGGATGCGG ATCTCGGCAT CCGCCTCGCG 
CGGCACGGCT ACCGCACCGA CCTCATCGAC ACGGTGACGG CCGAGGAAGC CAACTGCCGC 
GCCATCCCCT GGATCAAGCA GAGATCGCGC TGGATCAAGG GCTTCATGAT GACATGGGCC 
GTCCATATGC GCGCGCCGCG GCTGCTCTGG CGGCAACTCG GCCCCTGGCG CTTTGCAGGC 
TTCCAGGTGA TGTTCCTCGG CTCGATCTCG CAGACCCTGC TCGCGCCGGT GCTCTGGTCC 
TTCTGGCTGC TGGCGCTCGG CCTGCCGCAT CCGGTGGCGC CGCTCGTGCC CGAGCCGCTG 
CTCTGGTCGA TGATCGGGCT TCTCATCGGA TCGGAGGGCA CCGCCATTGC CATGGGCATC 
CTCGCCCTGC GGCAGACCCG GCACCGCCTG AACCCGCTCT GGGTGCCGAC CCTGCATCTC 
TACAACCCGC TCGCCACCTT CGCGGCCTAC AAGGCGCTGT GGGAGCTCCT GCGCGCGCCC 
TTCTACTGGG ACAAGACCTG CCACGGGGTC TTCGACGCCC AGGCCCGCGG CCGCCCTCTC 
CTGCAGCCCG CCTGA

Protein sequence

MGVMLLREGH LAPHRIMAAL SHGGRPSAPL ADLLLAEGAL SEDEILAMMA RRSGLPVLDP 
AAERPDPRLI DRLGVRDCLR EGLLPLRDTG SAVLLAAAAP ESFRRHRPRL EELFGTVIPA 
LASRSSIEDA LQELRADAIG AAAELRVAPE ESCRDWRTGR MTRLAALAGL ALAAGLALAP 
GLVLLALTAW ALLALACGTA LRLATAVASL RRPPPEPESP PLLHLPMVSI IVALYREEDI 
AGRLVARLGR LDYPHDRLEI LLVVEEADRR TRRALLEARL PPWMRIVVSP KGAIRTKPRA 
LNVALDHCRG SIVGVYDAED APEPDQIRRV VEGFSRRGSH VACLQGRLDY YNPRTNWLSR 
CFTIEYAAWF RLMLPGLDRL GLVVPLGGTT LFFRRAALEE LGAWDAHNVT EDADLGIRLA 
RHGYRTDLID TVTAEEANCR AIPWIKQRSR WIKGFMMTWA VHMRAPRLLW RQLGPWRFAG 
FQVMFLGSIS QTLLAPVLWS FWLLALGLPH PVAPLVPEPL LWSMIGLLIG SEGTAIAMGI 
LALRQTRHRL NPLWVPTLHL YNPLATFAAY KALWELLRAP FYWDKTCHGV FDAQARGRPL 
LQPA