Gene Rpal_3235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3235
Symbol	trpD
ID	6410905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	3480750
End bp	3481766
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	69%
IMG OID	642713111
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001992212
Protein GI	192291607
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGATT TCAAATCGAT TATCGCAAAG GTCGCGACCG GCGCGACGCT GACGCGCGAC 
GAAGCCACCG ACGCTTTCGA CGCAATGATG TCCGGCGACG CGACGCCGTC GCAGATGGGC 
GCACTGCTGA TGGGCCTTCG GGTCCGCGGC GAAACCGTCG ACGAGATCAC CGGCGCGGTG 
ACGACGATGC GCGCCAAGAT GCTGCCCGTC ACCGCGCCAC CGGACGCGGT CGACATCGTC 
GGCACCGGCG GTGACGGCTC CGGCTCGGTC AACGTTTCGA CTTGCGCGTC GTTCGTGGTC 
GCCGGCTGCG GCGTCACCGT CGCCAAGCAC GGCAACCGCG CGCTGTCGTC GAAATCCGGC 
GCCGCCGACG TGCTCGCCGC GCTCGGCGTC AAGATCGACA TCACGCCCGA GCAGGTCGGC 
CGCTGCGTCA ACGAAGCCGG CATCGGCTTC ATGTTCGCGC CGACGCATCA TCCGGCGATG 
AAGAACGTCG GCCCCACCCG GGTCGAACTT GCGACCCGCA CCATCTTCAA TCTGCTCGGA 
CCGCTGTCCA ACCCGGCCGG CGTCAAGCGC CAGATGATCG GCGTGTTCTC GCGGCAATGG 
GTGCAGCCGC TCGCGCAGGT GCTGAAGAAC CTCGGCTCCG AAGCGGTCTG GGTGGTGCAC 
GGTTCCGACG GCCTCGACGA AATCACGCTG TCCGGCACCA CCGCGGTCGC CGAGCTGAAG 
AACGGCGAGA TCACCAGCTT CGAGATCAGC CCCGAGGACG CCGGCCTGCC CCGTGCGCCG 
GCCGACGCGC TGAAGGGCGG CGACGCCCAG GCCAATGCGG TGGCGCTGCG CGCGGTGCTG 
GAAGGCATGC CGGGGCCGTA TCGTGACGTC GCCCTGCTCA ACGCTGCCGC GACGCTGGTC 
GTCGCCGGCA AGGCCCGCGA CCTGAAGGAA GGCGTCGCGC TCGGCACCCA GTCGATCGAC 
AGCGGCGCCG CCGAAGCGCG GCTGAAGAAG CTGATCGCGG TGTCTGCGGC GGCCTAA

Protein sequence

MVDFKSIIAK VATGATLTRD EATDAFDAMM SGDATPSQMG ALLMGLRVRG ETVDEITGAV 
TTMRAKMLPV TAPPDAVDIV GTGGDGSGSV NVSTCASFVV AGCGVTVAKH GNRALSSKSG 
AADVLAALGV KIDITPEQVG RCVNEAGIGF MFAPTHHPAM KNVGPTRVEL ATRTIFNLLG 
PLSNPAGVKR QMIGVFSRQW VQPLAQVLKN LGSEAVWVVH GSDGLDEITL SGTTAVAELK 
NGEITSFEIS PEDAGLPRAP ADALKGGDAQ ANAVALRAVL EGMPGPYRDV ALLNAAATLV 
VAGKARDLKE GVALGTQSID SGAAEARLKK LIAVSAAA