Gene RPC_1431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1431
Symbol
ID	3973699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	1554978
End bp	1555958
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	637924546
Product	ADP-L-glycero-D-manno-heptose-6-epimerase
Protein accession	YP_531312
Protein GI	90422942
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.596658
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGG TGACCGGAGG GGCCGGTTTT ATCGGGTCGA ACGTCGTGGC CGCGCTGAAC 
GACGCCGGCC GCGCCGACGT CGCGGTGTGC GACGTGCTCG GCCACGACGG CAAATGGAAG 
AATCTGGCCA AGCGCCAGCT CGCGGATGTC GTGCCGCCGG GCGAGCTGAT GGGCTGGCTG 
CAGGGCCGCA GGCTCGACGC CATTATCCAC ATGGGCGCGA TCTCGGAGAC CACCGCGACC 
GACGGCGACC TGGTGATCGA GACCAATTTC CGGCTGTCGA TGCGGCTGTT GGACTGGTGC 
ACCGCCAACA AGGTGCCGCT GATCTATGCC TCGTCGGCCT CGACCTATGG CGATGGCGAG 
CAGGGCTTCA AGGACGATCA ATCCGTCGCC GCGTTGAAAC AGCTGCGGCC GATGAACCTG 
TATGGCTGGA GCAAGCATCT GTTCGATCTT GCGGTCGCCG AACGCGCCGC GCGCGGCGAC 
CAGTTGCCGC CGCAATGGGC CGGGCTGAAG TTTTTCAACG TGTTCGGCCC CAACGAATAT 
CACAAGGGCA GCATGATGAG CGTGCTGGCC AAGCGGTTCG ACGACGTCAA ATCCGGCCGC 
GTGGTGCAGT TGTTCAAGTC GCACCGCGCC GGCATCGAAG ACGGCGACCA GCGCCGCGAC 
TTCATCTATG TCGACGACGT GGTGCGGGTG ATGACCTGGC TGTTGGCGAC GCCGTCGGTC 
AGCGGCATCT TCAACGTCGG CACCGGGCAT GCCCGCAGCT TCCGCGACCT GATCCTGTCG 
GCCTATGCGG CGCTCGGCGC CAAGCCGAAC ATCGAATATA TCGACATGCC GGAAAGCATT 
CGCGGCAGCT ACCAATACTT CACCGAGAGC GAAGGCGAGC GGTTGCGCGC CGCCGGCTAC 
AATGGCGGCT TCACCGCGCT GGAAGACGCG GTCGCGCACT ACGTCAAAGG CTTCCTCGAC 
GCCGAGGACC GCTTCCGGTG A

Protein sequence

MLLVTGGAGF IGSNVVAALN DAGRADVAVC DVLGHDGKWK NLAKRQLADV VPPGELMGWL 
QGRRLDAIIH MGAISETTAT DGDLVIETNF RLSMRLLDWC TANKVPLIYA SSASTYGDGE 
QGFKDDQSVA ALKQLRPMNL YGWSKHLFDL AVAERAARGD QLPPQWAGLK FFNVFGPNEY 
HKGSMMSVLA KRFDDVKSGR VVQLFKSHRA GIEDGDQRRD FIYVDDVVRV MTWLLATPSV 
SGIFNVGTGH ARSFRDLILS AYAALGAKPN IEYIDMPESI RGSYQYFTES EGERLRAAGY 
NGGFTALEDA VAHYVKGFLD AEDRFR