Gene Rpal_4548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4548
Symbol
ID	6412232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4899887
End bp	4901197
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	67%
IMG OID	642714428
Product	nucleotide sugar dehydrogenase
Protein accession	YP_001993517
Protein GI	192292912
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATCA CGATGATTGG GACGGGTTAT GTGGGGCTGG TGTCCGGGGC ATGCTTCGCG 
GACTTCGGCC ACCAGGTAAC CTGCGTCGAC AAGGATGCCG GCAAAATCGC GGCCCTGCAT 
CGGGGCGAAA TTCCCATTTA CGAACCGGGC CTTGACGAGC TGGTCGCGGC CAACGTCAAG 
GCTGGGCGGC TCGACTTTAC CACCGACCTG ACCGCCCCGG TGGGCGAAGC GGACGCAGTG 
TTCATCGCCG TCGGGACCCC GTCACGGCGC GGCGACGGCC ACGCTGACCT ATCCTATGTG 
TATGCGGCCG CAAAGGAAAT CGCCGCCGCC CTGAAAGGCT TCACGGTCGT GGTGACCAAG 
TCGACGGTCC CGGTCGGCAC CGGCGACGAG GTCGAGCGGC TGATCCGCGA GACCAATCCC 
ACCGCCGACG CGGCGGTCGC CTCGAACCCT GAATTCCTGC GCGAGGGCGC CGCGATCCGC 
GACTTCAAGT TCCCCGACCG CATCGTGATC GGGACTGCCG ACGAGCGCGC CCGCAAAGTG 
ATGGGCGAGA TCTACCGCCC GCTGTCGCTG AACCAGGGCC CGCTGATGTA CACCGCGCGG 
CGCACCGCCG AGCTGATCAA ATACGCCGCT AACGCATTCC TGGCGACCAA GATTACCTTC 
ATCAACGAGA TGGCGGACCT CGCCGAAAAG GTCGGCGCCG ACGTCCAGGA CGTCGCCCGC 
GGCATCGGCA TGGACAACCG GATCGGCTCC AAATTCCTGC ATGCCGGCCC CGGCTTCGGC 
GGCTCGTGCT TCCCCAAGGA CACCCGCGCG CTGGTGCAGA CCGCCCATGA CCACGACGTA 
CCGGTGCGGA TCGTCGAGGC GGTCCTTGCC GTCAACGACA ACCGCAAGCG CGCAATGGCC 
CGCAAGGTCT CGCACGCGCT CGGCGGCAAC ATGCGCGGCA AGACCATCGC GGTGCTCGGC 
CTGACCTTCA AGCCGGACAC CGACGACATG CGCGAGGCGC CGTCGATCCC GCTCGTCACC 
GGCCTCACCG ACATGGGCGC CAAGGTGAAG GCGTTCGATC CCGCCGGCAT GGCGCAGGCC 
AAGGCGGAGT TGCCGGACAT CACCTACTGC GAGGACGCCT ACGACTGCGC CAAGGGCGCC 
GACGCGCTAG TGATCGTCAC CGAATGGGTG CAATTCCGCG CGCTCGACCT GCCGCGGCTG 
AAAGCCGCAA TGGCGCAGCC GATCGTCGTC GACCTGCGCA ACATCTACCG CCCCACCGAA 
ATGGCCGAGC ACGGCTTCAG TTATCACAGC GTCGGCCGCG GCGACGCGTA G

Protein sequence

MRITMIGTGY VGLVSGACFA DFGHQVTCVD KDAGKIAALH RGEIPIYEPG LDELVAANVK 
AGRLDFTTDL TAPVGEADAV FIAVGTPSRR GDGHADLSYV YAAAKEIAAA LKGFTVVVTK 
STVPVGTGDE VERLIRETNP TADAAVASNP EFLREGAAIR DFKFPDRIVI GTADERARKV 
MGEIYRPLSL NQGPLMYTAR RTAELIKYAA NAFLATKITF INEMADLAEK VGADVQDVAR 
GIGMDNRIGS KFLHAGPGFG GSCFPKDTRA LVQTAHDHDV PVRIVEAVLA VNDNRKRAMA 
RKVSHALGGN MRGKTIAVLG LTFKPDTDDM REAPSIPLVT GLTDMGAKVK AFDPAGMAQA 
KAELPDITYC EDAYDCAKGA DALVIVTEWV QFRALDLPRL KAAMAQPIVV DLRNIYRPTE 
MAEHGFSYHS VGRGDA