Gene RPC_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3643
Symbol
ID	3972014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4051718
End bp	4052704
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	67%
IMG OID	637926752
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_533497
Protein GI	90425127
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.611335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.301343
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCACATCC TCATTCTCGG CGCCGCCGGC ATGGTCGGGC GCAAACTGAC CGAGCGGCTA 
TTGCGCGACG GTCATCTCGG CGACCGCGCC ATCACCAGGT TGACGCTGCA GGACGTGGTG 
GCGGCGCCGA AGCCGCTCGA TGCGACGATT CCGGTCACCA TCGTCACCTC GGATTTCGCC 
GATCCGCTGG GGGCCGCGCC GCTGGTAGCG TGCTGTCCGG AGGTGATCTT CCATCTCGCG 
GCGATCGTGT CCGGCGAGGC CGAGGTCGAA TTCGACAAGG GCTACCGCAT CAATCTCGAC 
GGCACCCGCT ATCTGCTTGA GGCAATCCGG GCGATCGGCG ACGGCTACCG GCCGCGGCTG 
GTGTTCACCT CGTCGATCGC GGTGTTCGGC GCGCCGTTCC TCGACAAGAT CGGCGACGAG 
TTCTTTCACA CCCCGCTGAC CAGCTACGGC ACCCAGAAAT CGATCTGCGA ATTGCTGCTG 
GCGGATTACA GCCGCAAGGG CTTTGTCGAC GGCATCGGCA TCCGGCTGCC GACGATCTGC 
GTCCGCCCGG GCAAGCCGAA CAAGGCGGCG TCGGGTTTCT TCTCCAATAT CATCCGCGAG 
CCGCTGGCGG GCCACGAGGC GGTGCTGCCG GTGTCGGATG ACGTGCGGCA CTGGCACGCC 
TCGCCGCGCT CCGCGGTGGG CTTCCTGCTG CACGCCGCGA CCATGGATCT GAAGGCGATG 
GGGCCGCGGC GCAATCTGTC GATGCCCGGG CTTTCGGTGA CGGTCGGGGA ACAGATTGCA 
GCCCTCGCGC GGGTGGCGGG GCAGGGCGTC GTCGCGCGGA TCAGGCGCGA GCCGGATCCG 
GCGATCATCG GCATCGTCGC CGGCTGGCCG CGCGACTTTT CCACCGACCG CGCGCAAAGC 
CTCGGCTTCA GCACCGCGGA AAACACCTTC GACGACATCA TCCGGATTCA CATCGAGGAT 
GAACTCGAAG GCGAGTTCGT GCGGTAG

Protein sequence

MHILILGAAG MVGRKLTERL LRDGHLGDRA ITRLTLQDVV AAPKPLDATI PVTIVTSDFA 
DPLGAAPLVA CCPEVIFHLA AIVSGEAEVE FDKGYRINLD GTRYLLEAIR AIGDGYRPRL 
VFTSSIAVFG APFLDKIGDE FFHTPLTSYG TQKSICELLL ADYSRKGFVD GIGIRLPTIC 
VRPGKPNKAA SGFFSNIIRE PLAGHEAVLP VSDDVRHWHA SPRSAVGFLL HAATMDLKAM 
GPRRNLSMPG LSVTVGEQIA ALARVAGQGV VARIRREPDP AIIGIVAGWP RDFSTDRAQS 
LGFSTAENTF DDIIRIHIED ELEGEFVR