Gene RPC_4206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4206
Symbol
ID	3972661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4677101
End bp	4678231
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	71%
IMG OID	637927308
Product	glycosyl transferase, group 1
Protein accession	YP_534049
Protein GI	90425679
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.488817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTGC TGCATGCCTA CAAGGCCTAC CGCCCGGACG TCGACGGCGG TGTCGCGGCG 
GTCATCGCGC TGCTCACCGC GGCGGGCGAG GAGGATCTTC GCAGCGAAAT TCTGGTGGCG 
CGCGGGATGC GCGGGCTCGG GCAGAGCACC GCGTTCGACG GCGTGCCGAG CCGCGCGGTG 
GCCTCGCTCG GCAACCTGTT CGGCATGCCG ATCGCGCCGC AATTTCCGCT GGCGCTGGCG 
TGGGCGATCC GCAAGGCCGA CGTCGTCGCC TTGCATGCGC CGTTTCCGCT CAACGACATC 
GGCGCGCTCG CCGTTCCCGA CCATGTCGGC GTGGTGGTGC ACTGGCACGC CGAGATCCTC 
GGCCGTCGGT TGCTGGCGGG GGCGCTGGCG CCCTTGACGC GGGCCACGCT CGCCCGTGCC 
GACCGCATCA TCGTGTCCGA CCAGATCATC GCGCAGAACT CGGCGTTGCT GCGGCCGCAT 
CTCGCCAAAT GCGAAGCGGT GCCGTTCGGC GTCGATGCCG CGGCATGGGC GACGCTCGGT 
GCCGATGGCT GCGCGCGCGC CGAGGCGCTG CGGCGTCGCC ATCCGCGGCT GATCGTGGCG 
CTCGGCCGGC TGGTGCCCTA CAAGGGCTTC GACGTTCTGC TCGCGGCTCT GCCCCGAATC 
GATGGCCATC TCAGCATCGT CGGCACCGGC GCGGAGCGCG AACGTCTCGC ACAGATCGCA 
GCCGATGCCG GCGTCTCCAA TCGCGTGACC TTCGCCGGCT ATCTGTCGGC GGAGGAGGTG 
CGGGTGCATT TGCGCGCGGC GCGGGTGTTC GCCTTCCCCT CGGTGACGGC CGCGGAAACC 
TTCGGCATTT CCCAGCTCGA GGCGATGGCG GCCGGCTTGC CGATCGTCAA CACGGCGTTG 
CCGACCGCGG TGCCGCTGGT GGCGCGCCAT GGCCTGGAGG CGCTGACGGT GCCGCCGCGC 
GACGCCGCCG CGCTCGCCAG CGCGATCAAC GCCGTCCTCG ATGATCCGGA GCTGGCCGAG 
CGCCTCGGCC GCGCGGCGCA GGCGCGGGCG CGCGAGCAAT TCGACCACGC AAGGTTCTGC 
GCGAGGGTCC GCGCCATCTA CCGCGAGGTG TATGACGCAA GACGAGGATG A

Protein sequence

MRVLHAYKAY RPDVDGGVAA VIALLTAAGE EDLRSEILVA RGMRGLGQST AFDGVPSRAV 
ASLGNLFGMP IAPQFPLALA WAIRKADVVA LHAPFPLNDI GALAVPDHVG VVVHWHAEIL 
GRRLLAGALA PLTRATLARA DRIIVSDQII AQNSALLRPH LAKCEAVPFG VDAAAWATLG 
ADGCARAEAL RRRHPRLIVA LGRLVPYKGF DVLLAALPRI DGHLSIVGTG AERERLAQIA 
ADAGVSNRVT FAGYLSAEEV RVHLRAARVF AFPSVTAAET FGISQLEAMA AGLPIVNTAL 
PTAVPLVARH GLEALTVPPR DAAALASAIN AVLDDPELAE RLGRAAQARA REQFDHARFC 
ARVRAIYREV YDARRG