Gene RPB_1602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1602
Symbol
ID	3910073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1805262
End bp	1806242
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	64%
IMG OID	637883498
Product	ADP-L-glycero-D-manno-heptose-6-epimerase
Protein accession	YP_485223
Protein GI	86748727
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGG TAACCGGAGG CGCCGGCTTT ATCGGATCGA ACATCGCTGC GGCGCTGAAC 
GATGCGGGGC GCAGTGATGT GGCGGTGTGC GACTTTCTCG GCCACGAGGG CAAATGGAAG 
AACCTCGCCA AGCGCCAGCT CGCCGATGTC GTGCCGCCCG CCGAACTCTC GGAATGGCTG 
AGGGGTCGCC GGCTCGACGC GGTGTTTCAC ATGGGCGCGA TCTCGGAAAC GACCGCGACC 
GATGGCGATC TGGTGATCGA CACCAACTTC CGGTTGTCGA TGCGGCTGCT CGACTGGTGC 
ACTGAAAACC GGGTGCCGTT CATCTATGCC TCCTCCGCCG CCACCTATGG CGACGGCGCG 
CAGGGCTTCA GCGATGATCC ATCGCTCGCC GCGCTGAAGC AATTGCGGCC GATGAATCTC 
TACGGCTGGA GCAAGCACCT GTTCGATCTC GTGGTGGCCG AGCGCGCCGC ACGCGGCGAG 
CGGCTGCCGC CGCAATGGGC CGGGTTGAAG TTCTTCAACG TGTTCGGCCC CAACGAGTAT 
CACAAGGGGA CGATGGCGAG CGTGCTGGCG CGGCGCTTCG ACGACATCAG GGCCGGGCGC 
GTGGTGCAGC TGTTCAAGTC GCATCGCGAC GGCATCGCCG ATGGCGACCA GCGCCGCGAT 
TTCATCTATG TCGACGACGT GGTCCGGGTG ATGATGTGGC TGTTCGCGAC GCCGTCGGTG 
AGCGGCCTGT TCAATGTCGG CACCAGCCAC GCCCGCAGTT TCCGGGATCT GATCCTCGCC 
GCCTATTCGG CGCTCGGAAC CCCGCCGCAA ATCGACTACA TCGACATGCC GGAACAGATT 
CGCGGCAGCT ATCAGTATTT CACCGAGAGC GAAGGCGACC GGTTGCGCGC CGCAGGCTAC 
AATGGCGGCT TCACGCCGCT CGAAGATGCG GTCGCTTGCT ATGTCAGGGG GTACCTTGAC 
GGCAGTGATC GCTTCCGCTG A

Protein sequence

MLLVTGGAGF IGSNIAAALN DAGRSDVAVC DFLGHEGKWK NLAKRQLADV VPPAELSEWL 
RGRRLDAVFH MGAISETTAT DGDLVIDTNF RLSMRLLDWC TENRVPFIYA SSAATYGDGA 
QGFSDDPSLA ALKQLRPMNL YGWSKHLFDL VVAERAARGE RLPPQWAGLK FFNVFGPNEY 
HKGTMASVLA RRFDDIRAGR VVQLFKSHRD GIADGDQRRD FIYVDDVVRV MMWLFATPSV 
SGLFNVGTSH ARSFRDLILA AYSALGTPPQ IDYIDMPEQI RGSYQYFTES EGDRLRAAGY 
NGGFTPLEDA VACYVRGYLD GSDRFR