Gene RSP_3853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3853
Symbol
ID	4796547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_009007
Strand	-
Start bp	18938
End bp	20710
Gene Length	1773 bp
Protein Length	590 aa
Translation table	11
GC content	75%
IMG OID	640102967
Product	O-linked acetylglucosamine transferase
Protein accession	YP_001033816
Protein GI	125654622
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3914] Predicted O-linked N-acetylglucosamine transferase, SPINDLY family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTGC AGCCCGCCCC GATCCTGCCC ATCGGCTCCG TCTCTCCCCC GCTCACGGCC 
GAGCAGCTGG TGGGTCTGGC CGAGGCCGCC CCCGCCGCGG CGATCGAGAT CTACCGCCGC 
TGGCTCGCGC TCCATCCCGA GCGGCCCGAC GCCTGGATCG CCTGGTTCAA TCTCGCGGTG 
CTGCTCGAGG CTGCGGGCGA GCCGCAGGGG GCGCTCGGCG CGGCCGCCAC CGCGCTCCGC 
CAGAAGCCGG ATCTGTGGCA GGCGGCCCTC GCGGCCGGTC AGGCGGCCGA GGCGCAGGGC 
GACCGGACGC AGGCGCTGGC CTTCCTGCGC CAGGTGCTGC CCCCGGCCGA GGGGCGGCGC 
CAGCTCCACC GCCAGCTCGG CCGGATGCTC GAGGCCGAGG GCCGGCTCGC GGAGGCCGCC 
GAGGAGCTGC GGGCCTCGCT TCTCCTCGAT CCCCGCCAGC CCGAGGTGGT GCAGCATCTC 
GTCCATGCCC GCCAGAAGAT GGCGGCCTGG CCCCCGGCCC GGCTCGCCGT CCCCGGCCTG 
ACCGAGGCCG AGGCCGAGCT GCAGTGCGGC CCGCTCGCCA CCCTCGCGCT GCATGACGAT 
CCCCTTCGGC AGGGCGAGGT GGCCGCGGCC TGGATCGCCC GGCATGTGCC CGATCCGGGC 
ATTCGGCTCG CCCCGGCCGG GGGCTACCGC CACGACCGGC TGCGGCTCGG CTATCTCTCG 
TCGGACTTCT GCCGCCACGC CATGAGCTTC CTCATCGCCG AACTGCTCGA GCGCCACGAC 
CGCAGCCGGT TCGAGGTGGT GGGCTACTGC GCCTCGCCCG AGGACGGCAG CCCCGAGCGC 
GCGCGGGTGC TCGCCGCCCT CGACCGGCAT GTGCCGATCG GCCCCCTCTC CGACGAGGCC 
GCGGCCCGGC GCATCCGCGC CGACGAGATC GACCTGCTGA TCGATCTCAA CGGGCTGACC 
CGCGGCGCCC GGCCGGGCAT CCTGCGCTGG AAGCCCGCCC CGGTGCAGGC GACCTATCTG 
GGCTATATCG GGCCGGTCCC GCTGCCCGAG CTCGACTGGC TGATCTGCGA CCGAGTGACC 
GTGCCCGAGG CCGAGGCCGC CCATTACCGC CCGGCCCCGC TCCGGCTCGA GGGCTGCTAT 
CAGGCCAACG ACGGGCAACG GCCCCTGCTG CCCGCCGTCG ACCGCCCGGG CGAGGGCCTG 
CCGGAGGCCG CCTTCGTCTT CGCCTGCGCC TCGCATTTCT ACAAAATCAC CGAGCCCCTC 
TTCGCCGCCT GGTGCCGGAT CGTCGCGGCC GTGCCGGGGT CGGTCCTGTG GCTCGTCGCG 
GATACGCCCG AGGGGCAGGC GGCGCTGGCC GGCCGCTGGC AGGCGGCGGG CCTAGACCCC 
CACCGGCTGA TCTTTGCCCC CCGCGTCGAT CCCGCCCGCT ACCGGGCGCG GCTGGCGCTG 
GCCGACCTCT TTCTCGACAC GATGCCCTAC AATGCCGGGA CCATCGCCTC GGACGCGCTC 
CGGATGGGGC TGCCCCTGCT CACGCTCGCG GGGCGGACCT TCTCGGGCCG GATGGCGGCG 
AGCCTCCTCA CGGCGGTGGG GCTGGAAGAT TGCATCGCCC CCGACCTCGA GGCCTATGTC 
GCCCGCGCTG TGGCGATCGC CACCGACCCG GCGGCGGCCC CCGCCCTGAC GGGGCCCGCC 
CTCGCCGAGC GCTGGAGCCT CACCTTGGGC GACTGCCGCG ATTTCACCCG CCGTTTCGAG 
GCGGCCCTGC TCTCGGTCGC CCGCCGCGCC TGA

Protein sequence

MTVQPAPILP IGSVSPPLTA EQLVGLAEAA PAAAIEIYRR WLALHPERPD AWIAWFNLAV 
LLEAAGEPQG ALGAAATALR QKPDLWQAAL AAGQAAEAQG DRTQALAFLR QVLPPAEGRR 
QLHRQLGRML EAEGRLAEAA EELRASLLLD PRQPEVVQHL VHARQKMAAW PPARLAVPGL 
TEAEAELQCG PLATLALHDD PLRQGEVAAA WIARHVPDPG IRLAPAGGYR HDRLRLGYLS 
SDFCRHAMSF LIAELLERHD RSRFEVVGYC ASPEDGSPER ARVLAALDRH VPIGPLSDEA 
AARRIRADEI DLLIDLNGLT RGARPGILRW KPAPVQATYL GYIGPVPLPE LDWLICDRVT 
VPEAEAAHYR PAPLRLEGCY QANDGQRPLL PAVDRPGEGL PEAAFVFACA SHFYKITEPL 
FAAWCRIVAA VPGSVLWLVA DTPEGQAALA GRWQAAGLDP HRLIFAPRVD PARYRARLAL 
ADLFLDTMPY NAGTIASDAL RMGLPLLTLA GRTFSGRMAA SLLTAVGLED CIAPDLEAYV 
ARAVAIATDP AAAPALTGPA LAERWSLTLG DCRDFTRRFE AALLSVARRA