Gene RPC_1446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1446
Symbol
ID	3973424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	1572552
End bp	1573601
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	637924561
Product	glycosyl transferase, group 1
Protein accession	YP_531327
Protein GI	90422957
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.131032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATTC TGGTCGCCAC CGACGCCTGG CATCCGCAGG TCAACGGCGT GGTGCGCACG 
CTGACGATGA TGGCCGAGGC CGCGAAGTCG CTCGGCGTCG ACGTCAGCTT CATCACCCCG 
CAATCGTTCC GAACCATCGG GCTGCCGAGC TATCCGGACC TGCGCGTCGC CCTGCCGGGC 
CCGGGCAAGA TCGCGCGGCT GATCGGCGAG GCGCACGCCG ATTTCATCCA CATCGCCACC 
GAAGGCCCGA TCGGCATCGC GGCGCGGCGC TATTGCCGCA AGCGCGGCCT GCGCTTCACC 
ACCAGCTTCC ACACCCGCTT TCCGGAATAC ATCTCGGCGC GGTTTCCGAT TCCGGAGTCC 
TGGATCTGGG CCTGGCTGCG CCGCTTCCAT GGGCTGAGCC AAGCGGTGAT GGCGGCGACG 
CCGGCGCTGG CCGACGAGTT GCGCGGCCGC GGCTTCCGCA ATGTGGTGCT GTGGCCGCGC 
GGCGTCGATA CCAAGCTGTT CCATCCGCGC ACGGTGTCCT GCGATCTGCC GCGGCCGTTG 
TTTCTCTGCG TCGGCCGGGT CGCGGTGGAG AAGAACCTCG AGGCGTTTCT CGACCTGCAA 
TTGCCGGGCA CCAAGGTGGT GGTCGGCGAC GGCCCGGCGC GCGCCGGGCT GCAGCGCAGC 
TATCCCGACG CAGTGTTTCT CGGGGCGCTG CAGGGCGAAG CCTTGGCGCA AGCCTATGCG 
ATGGCCGACG TGTTCGTGTT TCCCAGCAAG ACCGACACCT TCGGGCTGGT GATCCTCGAA 
GCGCTGGCCA GCGGCGTGCC GGTCGCGGCG TTTCCGGTGA CCGGGCCGCG CGACGTGATC 
GGAACCGCGC CGGTGGGGGC GTTGAACGAC GATCTGCGCA CCGCCTGCCT GTCGGCGCTG 
CAATTGTCGC GGCAGGCCTG TCAGGAATTC GCGCTGACGC AAACCTGGGA AGCCTCGGCC 
GCCGCCTTCA TCGACAACGT CGCCACCGCG CAACTGATGG AAAGCGGGCG GGCGGCAAGA 
GCGTGGCGGC GCCCGCAAGT CTCGGCGTGA

Protein sequence

MRILVATDAW HPQVNGVVRT LTMMAEAAKS LGVDVSFITP QSFRTIGLPS YPDLRVALPG 
PGKIARLIGE AHADFIHIAT EGPIGIAARR YCRKRGLRFT TSFHTRFPEY ISARFPIPES 
WIWAWLRRFH GLSQAVMAAT PALADELRGR GFRNVVLWPR GVDTKLFHPR TVSCDLPRPL 
FLCVGRVAVE KNLEAFLDLQ LPGTKVVVGD GPARAGLQRS YPDAVFLGAL QGEALAQAYA 
MADVFVFPSK TDTFGLVILE ALASGVPVAA FPVTGPRDVI GTAPVGALND DLRTACLSAL 
QLSRQACQEF ALTQTWEASA AAFIDNVATA QLMESGRAAR AWRRPQVSA