Gene RSP_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2001
Symbol	trpD
ID	3719334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	599260
End bp	600276
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	72%
IMG OID	640070164
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_352052
Protein GI	77462548
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.481302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACC GGCTGAAGCC CCTGATCGGC ACCGCGGCCA CCCGCCCCCT CAGCCGCGAG 
GAGGCCGAGT TCGCCTTCGA GTGCCTGTTC GAGGGCGAGG CCACGCCCGC GCAGATGGGG 
GGCCTGCTGA TGGCGCTGCG GACCCGCGGC GAGACGGTGG ACGAATATGC CGCCGCCGCC 
TCGGTCATGC GGGCCAAGTG CCACAAGGTG CGCGCCCCGC ACGGCGCCAT CGACATCGTG 
GGCACCGGGG GCGACGGCAA GGGCACGCTG AACATCTCGA CCGCCACGGC CTTCGTGGTG 
GCGGGGGCGG GCGTGCCGGT CGCCAAGCAC GGCAACCGCA ACCTCTCGTC GAAGTCCGGC 
GCCGCCGATG CGCTTACCGA GATGGGCCTC AATGTCATGA TCGGCCCCGA ACAGGTCGAG 
GCCTGCCTGC TGGAGGCCGG GATCGGCTTC ATGATGGCAC CGATGCACCA TCCGGCCATG 
CGCCATGTCG GGCCGGTGCG GGCCGAGCTC GGGACGCGGA CGATCTTCAA CATCCTCGGG 
CCGCTGACCA ATCCGGCGGG GGTGAAGCGC CAGCTGACCG GCGCCTTCTC GCCCGACCTC 
ATCCGGCCGA TGGCCGAGGT GCTCTCCGCG CTCGGCTCCG AGAAGGCATG GCTCGTCCAT 
GGCGGCGACG GGACGGACGA GCTCGCGATC TCGGCCGCCT CGAAGGTCGC GGCGCTCGAG 
GGCGGGCAGA TCCGCGAATT CGAACTGCAT CCCGAGGAGG CGGGTCTGCC CGTCCATCCG 
TTCGAGGAGA TCGTGGGCGG CACACCCGCC GAGAATGCGC AGGCCTTCCG CGCGCTGCTC 
GACGGCGCGC CGGGCGCCTA CCGCGATGCG GTGCTGCTGA ATGCGGCGGC GGCGCTCGTG 
GTGGCCGACC GCGCGGCGCA TCTGCGCGAA GGGGTGGAGA TCGCCACCGA CAGCATCCTG 
TCCGGTGCCG CCAAGGCGAA GGTCGCCCTG CTGGCCCGGC TGACGAACGC CGCCTGA

Protein sequence

MSDRLKPLIG TAATRPLSRE EAEFAFECLF EGEATPAQMG GLLMALRTRG ETVDEYAAAA 
SVMRAKCHKV RAPHGAIDIV GTGGDGKGTL NISTATAFVV AGAGVPVAKH GNRNLSSKSG 
AADALTEMGL NVMIGPEQVE ACLLEAGIGF MMAPMHHPAM RHVGPVRAEL GTRTIFNILG 
PLTNPAGVKR QLTGAFSPDL IRPMAEVLSA LGSEKAWLVH GGDGTDELAI SAASKVAALE 
GGQIREFELH PEEAGLPVHP FEEIVGGTPA ENAQAFRALL DGAPGAYRDA VLLNAAAALV 
VADRAAHLRE GVEIATDSIL SGAAKAKVAL LARLTNAA