Gene Rpal_4470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4470
Symbol
ID	6412154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4807017
End bp	4808342
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	65%
IMG OID	642714352
Product	glycosyl transferase group 1
Protein accession	YP_001993441
Protein GI	192292836
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGATCAGA CCGCCGACCG GCACGAACAG CCCTGGCTGT GGATGGACGT CTCGACCAGT 
GCGCGGGCGC GCTCCGGCCA GATGAATGGC ACCCTTCGGG TTGAACAAAG TTACATTCGC 
GCCTTGTCGG CCGAGATGGC TCCAGGGCTG CGGTTCTGTC GCTATGACCA ACTGCGGCGC 
GACTACGTCG CGGTCGCCAC ACCGCCCGAC CTGAGCGGCA AGCCGGTCGC CGGCAAGGCC 
AAGTCGAAGC AGGCGAGCGG GATCGCCGCT GTCCTAAAGC CGATTGGCAA ATCCGTCGAA 
CGCACCGTCA AGACCGCGGT CCGCGGCGCG ACCGCGTCGC TGCTGCGCAA GGCCAGCCAG 
GCCGAGCCGC TGCCGAAACT CGGTGGGGAC GGCCTCAGCG AGGTGCTGTT TCTCGCTGGT 
GAGAACTGGT CGCGGGTAGA CTTTGCCACC GTCGCCCGGA TGCGCCGCGA GCGCGGCACC 
AAAGTGGCGG CGCTGTGCCA GGACTTCATC CCGGCCGTGG CGCCACAGTT CTTCGCCGGC 
GGCGACTTCG TCACCAAGTT CGACGCCTAC GCGCAGTTCT TGATCAAGGA AACCGATCTG 
GTCGTCTCTA TCTCGGAGGC GACTAAGCGC GATATTCTCG GCTACGCCCA GCGCCACGGT 
GGGATGCACG GGGCTGTCGA AATCGTGCAT CTCGGTGCCG ATATTCCCGC ACCACAGGCG 
GCGCGGCGGC CGGAAGCGCT GACCGATGCT CAGGCTAAGC GCTTCGTGAT CAGCGTGTCG 
ACTATTCAGT CGCGCAAGAA TTTCGATCTC TTGTACCACC TCTGGCACCG GCTCACGGAG 
CAGAACACGC TCGCCCTGCC GACGTTGGTG ATTGTTGGCC AGCCGGGGTT CGGAAGTAGT 
GATCTCTTGT GGCAGATCGC CAATGATCCG GTGACGGCCA ACTCGATCCT GCATCTGCCG 
CGCGCCGGCG ATGATGAGCT GGCGTGGCTG TATCAGCACT GCTTGTTCAC GCTGTATCCG 
TCGTTCTATG AGGGGTGGGG GTTGCCGGTA TCCGAGAGCC TCGCCTTCGG CAAATACTGC 
CTCGCCTCCG ATGCCTCGTC GCTGCCGGAA GCCGGCGCAG GCCTCGCGCG CCACCTCGAT 
CCGCTCGATT TCCCCGCCTG GCGTGCTGCC GTCCTTGACC TGATCGCGGC GCCTGAGCAA 
CTTGCTCGCC ACGAAGCCGC GATCCGCGCC GGTTATCGCC CAGTCACCTG GGCTCAATCA 
GCAACGCGAC TCGCCGACGT GCTACGCGGC CTGGCCGCGA CGGGGGCCTC TGCACACCCC 
AGATAG

Protein sequence

MDQTADRHEQ PWLWMDVSTS ARARSGQMNG TLRVEQSYIR ALSAEMAPGL RFCRYDQLRR 
DYVAVATPPD LSGKPVAGKA KSKQASGIAA VLKPIGKSVE RTVKTAVRGA TASLLRKASQ 
AEPLPKLGGD GLSEVLFLAG ENWSRVDFAT VARMRRERGT KVAALCQDFI PAVAPQFFAG 
GDFVTKFDAY AQFLIKETDL VVSISEATKR DILGYAQRHG GMHGAVEIVH LGADIPAPQA 
ARRPEALTDA QAKRFVISVS TIQSRKNFDL LYHLWHRLTE QNTLALPTLV IVGQPGFGSS 
DLLWQIANDP VTANSILHLP RAGDDELAWL YQHCLFTLYP SFYEGWGLPV SESLAFGKYC 
LASDASSLPE AGAGLARHLD PLDFPAWRAA VLDLIAAPEQ LARHEAAIRA GYRPVTWAQS 
ATRLADVLRG LAATGASAHP R