Gene Rsph17029_3664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3664
Symbol
ID	4898640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	764439
End bp	765479
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	75%
IMG OID	640114272
Product	glycosyl transferase, group 1
Protein accession	YP_001045526
Protein GI	126464413
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.032207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.177473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCGG TCTTTGCCAT TCCCGGGGAT CCCGACCGCC GCTCGGGCGG CTTTCTCTAC 
GAACGCGCCC TGCTCCGCGC GCTGAACGAG AGCGGCCGCG AGGTGGCCTA CCTGCGCCTT 
CCCGCGGGCT TTCCCGATCC CGATCCGGCC GAGACCGTCG AGGCGGCCGG CCTGCTTGCG 
GCCGTCCCCG AGGGCGTGCC CGTGATCCTC GACGGGCTCG TGCACGGCGC GATCGAGACG 
GAGGCGCTGG CGCGGATGCG CGCGCCACTC GTGGCCATGA CCCACCATCC GCTGGCGCTC 
GAGACGGGTC TGCCGCCCGC CCGCGCCGCC CTCCTGCGGG CGCGGGAGCG GGCGAACCTT 
GCGCTTGCCG CTCATGTGCT GGTGCCGAGC CCGCATACGG CGCGGCTCCT CGTAGAGGAG 
TATGGCGTGC CCGCCGCGCG GATCACGGTG GCGCTGCCGG GCTTTCCGCC CGCCGATCCG 
GTGCGCGCGC CCGTGCAGCC GCCACTGATC CTGTCGGTGG GGATCCTCGT GCCGCGCAAG 
GGGCACGACG TGCTGCTCGA AGCGCTTGCG CGGATCCGGG ATCTGGACTG GCAGGCGCGC 
ATCGTCGGGG CGCCGTGGTT TGCCGAGACG GCCGCGGCGC TGCAGGCGCA GCGGACCGAT 
CTGGGGCTCG AGGCTCGGGT CGCCTTCACC GGCGAGCTTG GCGAGGCCGA CCTGCGCGCC 
CTCTTCCGGC AGGCCACGCT CTTCGCGCTG GCCACGCGGC ACGAGGGGTA CGGCATGGTC 
TTTCCCGAGG CGCTGCTGAA CGGATTGCCC ATCGTCGCCT GCGCCACGGG GGCGGTGCCC 
GATACGGTGC CTGCCGATGC GGGGCTTCTG GTGCCGCCCG ACGATCCGGC CGCCTTCGCA 
GCGGCGCTCC GTCGCCTGCT GGAGGAGGCC CCCACCCGCC AGCGTCTGGC CGAGGCAGCC 
ACCCGTGCAG GCGGCGCCCT GCCCCGGTGG GCGGACACGG CCGCCATCGC GGGCGCCGTC 
CTCGACCGGC TTGCGCGCTG A

Protein sequence

MRAVFAIPGD PDRRSGGFLY ERALLRALNE SGREVAYLRL PAGFPDPDPA ETVEAAGLLA 
AVPEGVPVIL DGLVHGAIET EALARMRAPL VAMTHHPLAL ETGLPPARAA LLRARERANL 
ALAAHVLVPS PHTARLLVEE YGVPAARITV ALPGFPPADP VRAPVQPPLI LSVGILVPRK 
GHDVLLEALA RIRDLDWQAR IVGAPWFAET AAALQAQRTD LGLEARVAFT GELGEADLRA 
LFRQATLFAL ATRHEGYGMV FPEALLNGLP IVACATGAVP DTVPADAGLL VPPDDPAAFA 
AALRRLLEEA PTRQRLAEAA TRAGGALPRW ADTAAIAGAV LDRLAR