Gene P9303_15761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_15761
Symbol	trpD
ID	4775956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1379931
End bp	1381043
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	57%
IMG OID	640087085
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001017585
Protein GI	124023278
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGTCCC CATCACCCAG CCCGGAGTGC TTCGCACCCG GGTTTTTTTC TGCTCCGATG 
CCTACTTCAG CTATTGCCTC TCCCTCTTGG TCGCAAATCC TCGAGATGTT GCTCGAGGGA 
CAAAACCTGC CCGAGGTGGA AGCAACTGCC TTGATGGAGG CTTGGTTGGC GGAACAACTA 
ACCCCTGTGC AGACAGGTGC GTTTCTAGCA GCTTTGCGAG CCAAGGGGGT AACCGGAAGT 
GAGTTGTCAG GCATGGCCCA GGTGTTGCGA GGTGCTTGTC CCTTGCCTTG CCCATTGCCA 
GGCATCCCTA TGGTCGACAC CTGTGGAACA GGTGGCGACG GTGCAGATAC CTTCAACATC 
TCAACCGCAG TGGCGTTTAC TGCTGCCGCC TGCGGGGCGA ATGTGGCTAA GCATGGCAAT 
CGCAGTGCAA GTGGCAAAGT CGGTTCAGCA GATGTTCTCG AGGGCCTGGG TCTGCAGCTC 
AAGGCTCCTC TTGTCTCTGT GGTGGAGGCC CTGGCTGAGG TACGCGTCAC ATTTTTGTTT 
GCCCCGGCCT GGCACCCCGC TTTGGTCAAC TTGGCCCCGT TGCGGCGCAG CCTTGGAGTG 
CGCACCGTGT TCAATCTTCT AGGTCCACTG GTGAATCCTT TACAACCGAA TGCCCAAGTT 
CTCGGGGTAG CTAAGGCTGA GCTGCTCAAT CCAATGGCGG AAGCATTGCA ACGGCTTGGC 
TTGCAGCGGG CCGTTGTTGT CCATGGCGCC GGTGGCCTTG ATGAAGCGTC GTTGGAGGGA 
GTCAATGCAA TGCGTTTGCT TGAGGATGGT CATGTGCGAC AAGCATCGAT CGATTCGGCA 
GAACTCGGGC TTACTAGAGC TCCTTTGCAG GCTCTCCAGG GGGGTGATTT GGCAACAAAT 
CAAGCGATTC TTTCCGCTGT ACTTCAGGGA GGCGGCACCG CCCCTCAAAG GGATGTGGTG 
GCATTGAACA CAGCCCTAGT GCTCTGGGCT GCTGGCCTAC AAGATGATTT ACGAGCAGGT 
GTTTCTGCTG CAAAGACTTG CCTGCAGGAG GGCCTCCCCT GGCAGCGGCT AGAAGGGCTC 
CGCATGGCAC TTGATCATCA AATTGGAGAA TGA

Protein sequence

MLSPSPSPEC FAPGFFSAPM PTSAIASPSW SQILEMLLEG QNLPEVEATA LMEAWLAEQL 
TPVQTGAFLA ALRAKGVTGS ELSGMAQVLR GACPLPCPLP GIPMVDTCGT GGDGADTFNI 
STAVAFTAAA CGANVAKHGN RSASGKVGSA DVLEGLGLQL KAPLVSVVEA LAEVRVTFLF 
APAWHPALVN LAPLRRSLGV RTVFNLLGPL VNPLQPNAQV LGVAKAELLN PMAEALQRLG 
LQRAVVVHGA GGLDEASLEG VNAMRLLEDG HVRQASIDSA ELGLTRAPLQ ALQGGDLATN 
QAILSAVLQG GGTAPQRDVV ALNTALVLWA AGLQDDLRAG VSAAKTCLQE GLPWQRLEGL 
RMALDHQIGE