Gene Rpal_4440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4440
Symbol
ID	6412124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4768246
End bp	4770048
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	66%
IMG OID	642714322
Product	thiamine pyrophosphate protein TPP binding domain protein
Protein accession	YP_001993411
Protein GI	192292806
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.406956
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGCTCT CCGACTACGT CATCGATTTT CTGGCGCGGC GCGGCGTCAC CCATGTGTTC 
GGCATTTCCG GCGGCGCCGC GGTGCACATG TTCGACTCCG CCCAGCGTCA CCCTGACGTC 
ACGCCGATCT TTCCCCAGCA CGAGCAGGCT GCCGCGATCG CTGCCGACGG CTACGCGCGC 
GCCACCGGCA GGCTCGGCGT CGCCATCACC ACCTCGGGTC CCGGCGCCAC CAATCTGCTG 
ACCGGGGTGT GCTGCGCCTA CTACGACTCC GTGCCGACGC TGATGATCAC CGGGCAGGTC 
GCGACCCATC GGCTGAAGGG CAAGAACCAG ATCCGTCAGC TCGGGTTTCA GGAGACCGAC 
GTCACCTCGA TCTTCGCCAC GGTGACTAAA TACGCGGTAC AGATCTCCGA CCCCACCACG 
ATCCGTTATC ATCTGGAGAA GGCGTACCAT CTCGCGTTCG AGGGGCGGCC CGGTTCGGTG 
CTGATCGATC TGCCGGACGA TCTGCAACGC GCCGAGATCG ATCCCGACAT GTTGCCGGGC 
TTCACGCCGG AGCCAGAGGC CGCATCGAAC GATCTCGACG CCGAGATCGC GGCGCTGCTG 
CCGCTGATTG CGCGGGCCGA GCGGCCGGTG CTGGTGCTCG GCGGCGGGCT GTCGACGCCG 
CGGATCGGGT CGATGCTGGA TCACCTCGTC GACCGCCTCG GCATGCCGGT GCTGACCACC 
TGGGCGGCGA CCGATCTGAT CGCAGCCGAC CATCCGCTGC GGGTCGGGCC GTTCGGCGTC 
TATGGGCCGC GGCTCGGTAA CTTCACGGTG CAGAACGCCG ACCTGATCCT GTGCCTCGGC 
AGCCGGCTGT CGCAGAACGT CACCGGCGGC ATCCTGCCGT CGTTCGCACG CGAGGCGACG 
ATCGTGATGG TCGACGCCAG CCGCGGCGAG ATGGACAAGT TCGACGACCG CGGCATCCGC 
ATCGCGACGC GGATTGCAGC GCGGCTCGAC GCCTTCGTGC CGAAGCTGCT CGCCGCGATC 
GAGGCGGCGC CGCCGCGCGA GGCTTGGCTG AACACCATCG GGCATTGGCG CAGCGCGTTG 
CCGGATGATC GGCCTGGCCC TGCGCCCGAC AATGCCGGCT TCGTCGACGC CTACGACTTC 
ATCGACAAGT TGAGCGACGC TGCGCCCGCC GACGAACTGC TCTATGTCGA CACCGGGGGC 
AACCTGACCT GGACCTGCAA CGGCTTCCGC ATCAAACGCG GGCAACGGTT GATCTCGGAC 
TGGAACAACA CCGCGATGGG CTACGCGCTG GCGGCGGCGA TCGGCGCTGC GGTGCAGGCG 
AGGGGCGGTG TCACCTGCAT CGTCGGCGAC GGCGGTTTGA TGCTGTCGCT GGGTGAGTTG 
GCGCTGCTCA AGCGGCACGA ACTGCCGATG CGGCTGATGC TGTTCAATAA TCACGGCCAT 
GGCATCCAGA AGCAGACGCT GGAGACCTGG CTCGATGGCC ACTATGTCGG CGTCGATGCG 
CCGAGCGGCC TGTCGTTCGT CGACTTCCGC AAAGTTGCCG AAGCGATGGA TCTGCCGGTG 
GTCACGATCA GCCGCAGTGC CGACATTGCT AGCCAGCTCC GCGACGTTTA TGCGCGCAGA 
GGCCCGGTGT TCTGCAACGT CGAAATCAAC CCGGCGCAGA AATTGTACCC GGTGCTGAAG 
TTCGGCGCGC CGCTGGAGAG TCAGCTGCCG TCGATCGACG ATGAGCTGAT CAAGCGCGAA 
ATGTTGATCG CGCGGTTTGT CCCCGGCTCC GCGCCAAAGC ACAGCGGCGG CGCGGGCGTA 
TAG

Protein sequence

MKLSDYVIDF LARRGVTHVF GISGGAAVHM FDSAQRHPDV TPIFPQHEQA AAIAADGYAR 
ATGRLGVAIT TSGPGATNLL TGVCCAYYDS VPTLMITGQV ATHRLKGKNQ IRQLGFQETD 
VTSIFATVTK YAVQISDPTT IRYHLEKAYH LAFEGRPGSV LIDLPDDLQR AEIDPDMLPG 
FTPEPEAASN DLDAEIAALL PLIARAERPV LVLGGGLSTP RIGSMLDHLV DRLGMPVLTT 
WAATDLIAAD HPLRVGPFGV YGPRLGNFTV QNADLILCLG SRLSQNVTGG ILPSFAREAT 
IVMVDASRGE MDKFDDRGIR IATRIAARLD AFVPKLLAAI EAAPPREAWL NTIGHWRSAL 
PDDRPGPAPD NAGFVDAYDF IDKLSDAAPA DELLYVDTGG NLTWTCNGFR IKRGQRLISD 
WNNTAMGYAL AAAIGAAVQA RGGVTCIVGD GGLMLSLGEL ALLKRHELPM RLMLFNNHGH 
GIQKQTLETW LDGHYVGVDA PSGLSFVDFR KVAEAMDLPV VTISRSADIA SQLRDVYARR 
GPVFCNVEIN PAQKLYPVLK FGAPLESQLP SIDDELIKRE MLIARFVPGS APKHSGGAGV