Gene RPD_0748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0748
Symbol
ID	4021221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	839030
End bp	840040
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	55%
IMG OID	637960937
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_567887
Protein GI	91975228
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAAA ACAAGACACT CCTCATCACC GGCGGAACAG GGTCTTTTGG CAACGCCGTC 
CTTCACCGCT TCCTAAAGTC GGACTTCCAG GAAATCCGGA TCTTCAGCCG TGACGAGAAG 
AAGCAGGAGG ACATGCGCAT CGCGCTGAAG GACGACCGCG TGAAATTCTA TATCGGGGAC 
GTCCGCGATT ACGAAGCTGT CGATGACGCG ATCAACGGTG TCGACTACGT CTTCCACGCC 
GCAGCCCTCA AGCAGGTTCC ATCCTGCGAG TTCTATCCGA TGGAAGCTAT CAGGACCAAT 
GTGCTGGGCG CTGAGAACGT CATGCGGGCC GCCGTTAACC GCGGCGTCAG CAGGTGTGTT 
GTGCTGAGCA CAGACAAGGC TGTCTATCCG ATCAACGCCA TGGGCATGTC AAAGGCGATG 
ATGGAGAAGG TGATGGTAGC CAAATCCCGT CTCTGCCAGC CCGGACAGAC GATCCTCTGC 
GCAACGCGTT ATGGCAATGT TATGGGGTCG CGCGGCTCGG TCATTCCTCT GTTCATTGAC 
CAGCTGCAGC AGCGTAAGCC GCTGACGATC ACCGATCCCA GCATGACTCG CTTTCTCATG 
TCACTGGAAG AGTCTGTCGA CCTGGTTCTT TACGCGTTCC AGAATGCTCG CGCCGGCGAC 
ATATTCGTGC AGAAGGCCCC GGCCTCCACG GTCGGCGACC TCGCTTTCGC GCTACGTGAA 
CTGCTCTCCC GAGACAATCC GATTAAGATC ATCGGCACCC GGCATGGCGA GAAGCTATAT 
GAATCGCTGA TCTCGCGGGA AGAAATGCTT CGCGCCGAAG ATCTGGGTGA CTACTATCGC 
ATTCCGGCCG ACAGTCGAGA CCTGAACTAC GACAAGTATT TCAGTGAAGG TGAGGTGCGC 
ATTGAGACAA TTGACGACTA CACATCTCAC AATACGCATA GACTAGATAT TGAGGGCATC 
AAGAAGACTC TGATGAAGCT CGACATCGTG AAGCGGGCTC TGAATGCTTA A

Protein sequence

MFENKTLLIT GGTGSFGNAV LHRFLKSDFQ EIRIFSRDEK KQEDMRIALK DDRVKFYIGD 
VRDYEAVDDA INGVDYVFHA AALKQVPSCE FYPMEAIRTN VLGAENVMRA AVNRGVSRCV 
VLSTDKAVYP INAMGMSKAM MEKVMVAKSR LCQPGQTILC ATRYGNVMGS RGSVIPLFID 
QLQQRKPLTI TDPSMTRFLM SLEESVDLVL YAFQNARAGD IFVQKAPAST VGDLAFALRE 
LLSRDNPIKI IGTRHGEKLY ESLISREEML RAEDLGDYYR IPADSRDLNY DKYFSEGEVR 
IETIDDYTSH NTHRLDIEGI KKTLMKLDIV KRALNA