Gene RPD_1648 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1648
Symbol
ID	4022128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1856004
End bp	1857089
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	71%
IMG OID	637961843
Product	glycosyl transferase family protein
Protein accession	YP_568786
Protein GI	91976127
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.206697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGCGA TGCTCCGGGT GCACGATTTG AGCGAGGACG ACGTGCCGCC CGACAGGCCG 
CCACAAGTAT CTGTGATCCT GCCGGTTCGC GACGGCCAGC GCTGGCTGTG CGAAGCGATC 
GACAGCGTAC TGACGCAGAC ATTGTCCGAT CTCGAACTCG TGGTGATCGA CGACGGCTCG 
ACCGACGCGA CGCCGGCGCT CCTTGATGAA GTCCGCGCCC GCGACCCGCG TGTGATCGCG 
CTGCGGCAGG AGCGGGAGGG CCTGGTCGCC GCGCTCAATC GCGGGCTTGC GCAAGCGCGC 
GCGCCGCTGA TCGCCCGGCT GGATGCCGAC GACATCGCGC TGCCCGATCG GCTGGCGCGG 
CAATGCGATT ATCTGCACGC CCACCCGGAC GTCGTGCTAC TCGGCGGCTG GGCCGAGATC 
ATCGACGAAA ACGGCGCATC GCGCGGCAAG CAAATGCGGC CGAACCCGAG CGGCTTGCGC 
GAGACGCTGG CGAGGAAAAG CCCCTTCATT CACCCGACGG TGATGGTTCG CGCCGACGCC 
GCGCGGCGCG TCGGCGGCTA TCGCTCCGCC TTCGAGGCCG GCGAGGACTA TGACTTCTGG 
CTGCGCCTCG CCGATGCGGG CGAGATCGCG ATCCTGCCCG AGGTGCTGAT CCGCTATCGC 
GAGCACGGCG GCAGCGTCAC GCGCACGCGC GAGCTGCGTC AGATCTATTC GGCCCGCCTC 
GCCAAGCTCG CCAGCGCCGC CCGCCGTGGC GGCGGCCCCG ATCCGTCCGC CGCACTCGCT 
GCGCCGCCGG ACTGGCACGA CCCGGCCCCC GGCCCGTTCG AACGCGACAG CTCGCGGCTA 
TTCCGGGTGC TCGAACTCGC CGATCCCGAG CTGGCGCGCG CGACGCCGGC GTCGGCGATC 
GACCTCGCGG CCATCACCTC GCAGCTCGCG ACGCTGACCA CCGGCGAACG GAAATTCGCG 
CAGGTCGCCG TCCTGAACTT GCTGCGCGCT GATCGCAAGC GGCCCGGCGT CTCGCGCGCC 
TCGCTGCTGG CGCTGCTGGT GCGGCTCGGA CCGGCCAAGG CGATCAGGCT GCTCTTGAAG 
GGTTAG

Protein sequence

MHAMLRVHDL SEDDVPPDRP PQVSVILPVR DGQRWLCEAI DSVLTQTLSD LELVVIDDGS 
TDATPALLDE VRARDPRVIA LRQEREGLVA ALNRGLAQAR APLIARLDAD DIALPDRLAR 
QCDYLHAHPD VVLLGGWAEI IDENGASRGK QMRPNPSGLR ETLARKSPFI HPTVMVRADA 
ARRVGGYRSA FEAGEDYDFW LRLADAGEIA ILPEVLIRYR EHGGSVTRTR ELRQIYSARL 
AKLASAARRG GGPDPSAALA APPDWHDPAP GPFERDSSRL FRVLELADPE LARATPASAI 
DLAAITSQLA TLTTGERKFA QVAVLNLLRA DRKRPGVSRA SLLALLVRLG PAKAIRLLLK 
G