Gene RPB_2797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2797
Symbol	trpD
ID	3910590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3188470
End bp	3189495
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	637884697
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_486410
Protein GI	86749914
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.573917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGACCA TGATCGATTT CAAGGCAGTT ATCGCGAAGG TCGCGACGGG GGCGTCGCTG 
ACCAGGGACG AAGCGGCGAA CGCGTTCGAC GCGATGATGT CGGGCGACGC GACGCCGTCG 
CAGATGGGTG CATTGCTGAT GGGCCTGCGA GTCCGCGGCG AGACCGTCGA CGAAATCACC 
GGCGCGGTGA CGACGATGCG CGCCAAGATG CTGACGGTCG CAGCGCCGCC CGACGCGGTC 
GACGTCGTCG GCACCGGCGG CGACGGCTCC GGCTCGGTCA ACGTCTCGAC CTGCACTTCG 
TTTGTCGTGG CCGGCTGCGG CGTTCCGGTC GCCAAGCACG GCAACCGCGC GCTGTCGTCG 
AAATCCGGCG CCGCCGACGT GCTCAATGCC CTCGGCGTCA AGATCGACAT CACCCCGGAC 
CACGTCGGCC GCTGCGTGGC GGAGGCCGGC ATCGGCTTCA TGTTCGCGCC GACGCATCAT 
CCGGCGATGA AGAACGTGGG TCCTACCCGC GTCGAGCTCG CTACCCGCAC GATCTTCAAT 
CTGCTCGGGC CGCTGTCGAA TCCCGCCGGC GTCAAGCGCC AGATGATCGG CGTGTTCTCG 
CGGCAATGGG TGCAGCCGCT GGCGCAGGTG CTGCAGAATC TCGGCTCAGA ATCGATCTGG 
GTGGTGCACG GCTCCGACGG GCTCGACGAG ATCACCCTGT CCGGCCCGAC CGCCGTCGCC 
GAATTGAAGA ACGGCGAGAT CAGGACCTTC GAGATCGGCC CCGAGGACGC CGGCCTGCCC 
CGCGCGCCGG CCGACGCGCT GAAGGGCGGC GATGCCGAGG CCAATGCGGT GGCGCTGCGC 
GCCGTGCTGG AAGGCATGCC GGGGCCGTAT CGCGACGTCG CGCTGCTCAA CGCCGCGGCG 
ACGCTGATCG TCGCCGGCAA GGCGAAGGAT CTCAAGGAAG GCGTCGCGCT CGGCGCCCAA 
TCGATCGACA GCGGCGCCGC CGAAGCACGT TTGAAAAAGC TGATCGCGGT ATCGGCGGCC 
GCCTAA

Protein sequence

MGTMIDFKAV IAKVATGASL TRDEAANAFD AMMSGDATPS QMGALLMGLR VRGETVDEIT 
GAVTTMRAKM LTVAAPPDAV DVVGTGGDGS GSVNVSTCTS FVVAGCGVPV AKHGNRALSS 
KSGAADVLNA LGVKIDITPD HVGRCVAEAG IGFMFAPTHH PAMKNVGPTR VELATRTIFN 
LLGPLSNPAG VKRQMIGVFS RQWVQPLAQV LQNLGSESIW VVHGSDGLDE ITLSGPTAVA 
ELKNGEIRTF EIGPEDAGLP RAPADALKGG DAEANAVALR AVLEGMPGPY RDVALLNAAA 
TLIVAGKAKD LKEGVALGAQ SIDSGAAEAR LKKLIAVSAA A