Gene RPD_1631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1631
Symbol
ID	4022111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1828624
End bp	1829682
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	69%
IMG OID	637961826
Product	glycosyl transferase, group 1
Protein accession	YP_568769
Protein GI	91976110
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.54694
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCC TGATCGCCAC TGACGCCTGG CATCCGCAGG TCAACGGCGT GGTGCGGACG 
CTGACCATGA TGGCCGAGGC GGCGAAGTCG CTCGGCGCCG AAGTCACGTT CCTGACGCCT 
GAAACCTTTT CGACCGTGCG ACTGCCGAGT TACCCGGATC TGCGGATCGC GATCCCGAAT 
CCGGCCAAGG TCGCGCGGAT GATCATCGCG GCGCAGCCCG ACTGTATCCA CATCGCGACC 
GAAGGGCCGA TTGGGCTGGC CGCGCGGCGC TACTGCCGCA AGCGCGGCCT GCGCTTCACC 
ACCAGTTTTC ACACTCGCTT CCCGGAATAC GTCTCCGCAC GCATGCCGAT CCCGGAATCC 
TGGGTGTGGG CCTTGCTTCG CCGGTTTCAC GGCGCCAGCC ACGCGGTGAT GGCGGCGACG 
CCGGCGCTGG CCGATGAGCT GCGCGGACGG GGCTTCCGCA ATGTGGTGCT GTGGCCGCGC 
GGGGTCGACG GCGAGCTGTT TCATCCCCGC GCGGGCGCCG ATCTCGGCCT GCCGCGGCCG 
GTGTTCCTGT CGGTCGGACG CGTCGCGGTC GAGAAGAACC TCGAAGCGTT CCTCGGGCTC 
GATCTGCCCG GCACCAAGGT CGTGGTCGGG GACGGGCCGG CGCGGGCGGC GCTGCAGCGC 
GACTTCCCGC AGGCGGTGTT CCTCGGCGCC AAGCAGGGCG AGGCGCTGGC GCAGGTCTAT 
GCTGCAGCGG ATGTGTTCGT GTTTCCGAGC CTGACCGACA CTTACGGGCT GGTGCTGCTC 
GAAGCGCTGG CGAGCGGCGT CCCGGTCGCC GCGTTCCCGG TGACCGGCCC GCGCGACGTG 
ATTGGCGATG CGCCGGTCGG CGTCCTCAGC GACGACCTGC GACAGGCCTG CCTCGGGGCG 
CTCGGGATCT CGCGCGACGC CTGCCTCGGC TTTGCCGCGG ACCACACCTG GACCGCGTCG 
GCGCGCGCTT TCATCGACAA TGTCACCCGG GTCTGGATGA TGGACCCCGG TCAAGTTCTC 
GCCGCGGATT CCGCAAAACC GCGGCGTCTG GTCGCCTGA

Protein sequence

MRILIATDAW HPQVNGVVRT LTMMAEAAKS LGAEVTFLTP ETFSTVRLPS YPDLRIAIPN 
PAKVARMIIA AQPDCIHIAT EGPIGLAARR YCRKRGLRFT TSFHTRFPEY VSARMPIPES 
WVWALLRRFH GASHAVMAAT PALADELRGR GFRNVVLWPR GVDGELFHPR AGADLGLPRP 
VFLSVGRVAV EKNLEAFLGL DLPGTKVVVG DGPARAALQR DFPQAVFLGA KQGEALAQVY 
AAADVFVFPS LTDTYGLVLL EALASGVPVA AFPVTGPRDV IGDAPVGVLS DDLRQACLGA 
LGISRDACLG FAADHTWTAS ARAFIDNVTR VWMMDPGQVL AADSAKPRRL VA