Gene Rpal_4442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4442
Symbol
ID	6412126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4770875
End bp	4771795
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	65%
IMG OID	642714324
Product	Nucleotidyl transferase
Protein accession	YP_001993413
Protein GI	192292808
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.876023
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGAG GCGCCAAGGC GCTGCTGGTC GCGGCCGGCC TCGGCACGCG GCTCGCCCCG 
CTCACAGATG TGCTGCCGAA ATGCCTGATG CCGATCGCCG GGCGCCCGCT GCTTGGATTG 
TGGCTGCAGA TGCTGAGCGA GGCAGGGTTC TCGGAGATCG TCGTCAATCT GCATCACCAT 
GCGGATCTCG TGAGCGAGTA CGTCCGCCGC AGCCCGTGGG CAGAACGGGT GATCCTTGCA 
CCCGAAACGA CGCTGCTCGG CACCGCCGGC ACGCTGCTGC GGCATCGCGC GCACTTCGCG 
GATGGGCCGA CGCTGTTCGC CCATGCCGAC AATCTCAGCC TGTTCGATCC GCGCGCCTTC 
CTCGCGGCCC ATGCGGGGCG GCCGCCCGAT ACGGCGATGA CGATGATGAG TTTCGTCACC 
GATCATCCCC AGAGCTGCGG CATCCTCACC CTCGATCCCG CCGGCCGCGT CCTGGAGATG 
GACGAGAAGC CGCAGCATCC CAAGGGCAAT CTTGCCAACG CGGCGGTGTA TATCGTCGAG 
CCCGAGGTGA TCGACTTCAT CGCCTCGCTC GGCAAACCGG TGGTCGATTT CTCGACCGAA 
GTGCTGCCGG TGTTCATGGG GCGGATCTTC TCGTTCCACA ACGGCAGCTA TCACCGCGAC 
ATCGGCAATC CGTCGAGCCT GGCGCTGGCG CAGCTCGACT ATCCGCTGGC CGTGCTCGCC 
TCTCCGCGTC CTTACGAGGA GGTGCAGCCT GCGAAGCAAT CCAGCCTGGT GCACGGGGCC 
CCTGAATTGC TTCGCCTTAG GCTCGCAATG ACGGAGACCA ATAACGACGA TCCCTGGTAT 
GGCCTGATGA CCGACAATAA CGGCGCTCTA GCGCGAGCCT TCGCCCAGGC TGCGGCAAAG 
ACCTATGGGG CCCAGCGATG A

Protein sequence

MSGGAKALLV AAGLGTRLAP LTDVLPKCLM PIAGRPLLGL WLQMLSEAGF SEIVVNLHHH 
ADLVSEYVRR SPWAERVILA PETTLLGTAG TLLRHRAHFA DGPTLFAHAD NLSLFDPRAF 
LAAHAGRPPD TAMTMMSFVT DHPQSCGILT LDPAGRVLEM DEKPQHPKGN LANAAVYIVE 
PEVIDFIASL GKPVVDFSTE VLPVFMGRIF SFHNGSYHRD IGNPSSLALA QLDYPLAVLA 
SPRPYEEVQP AKQSSLVHGA PELLRLRLAM TETNNDDPWY GLMTDNNGAL ARAFAQAAAK 
TYGAQR