Gene Ssed_1684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_1684
Symbol	trpD
ID	5609927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	-
Start bp	2018449
End bp	2019507
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	56%
IMG OID	640932554
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001473423
Protein GI	157374823
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA GCACAGATCT ACAACCACTT ATCGACAAAT TGTATCGAGG TGAGAGTGTC 
TCACGCAGCA AAGCCAAGCA ACTGTTCAGC TGCATCATTA ACGGTGAGAT GAGCGAAGCG 
GCAATGGCAG GCATGTTAGT CGCCATGAAG ATGCGCGGCG AAACCATAGA TGAGATATCC 
GGCGCTGCAG ATGCGCTTAT ATCGGCGGCA AAGGCATTCC CAACTCCCAG TGATGCGACT 
CGAAAACAGG GAATCGTCGA TATTGTCGGT ACCGGCGGCG ATGGCCACAA CACCATCAAT 
ATCTCCACAA CGGCGGCCTT CGTTGCTGCA GCGTCCGGGG CTAAGGTGGC TAAGCATGGC 
AATCGCAGTG TATCGAGCAA ATCAGGCTCA TCGGATCTGC TGGCGCAATT TGGTATCGAC 
CTTACCATGG CGCCGGAGAC CGCCCGGGAT TGCTTAGATG AATTGGGGCT CTGTTTCCTG 
TTTGCTCCAC ACTATCACGG CGGGGTTCGC CACGCAGTTC CCGTCAGACA GGCGCTCAAG 
ACCCGCACCC TGTTCAATGT CCTGGGGCCA CTCATCAACC CCTCTCACCC GGACTACATC 
CTGCTCGGCG TTTACAGCGA AGAGTTGGTT CAACCGATAG CTGAAGTACT CAAAGCACTG 
GGGATGAAGC GCGCGATGGT CGTTCATGGT AGCGGACTGG ACGAAGTCGC TGTCCATGGC 
AATACTTCAG TCTGTGAGCT CACAGACGGC GAGCTCAAAC AATACACCCT AACCCCTGAG 
GTGCTGGGCG TACCCAGGGC AAACCTGAAA GAGTTAGAGG GCGGCTCGCC CGAAGAGAAT 
GCCGAGTTCA CCCGCGCTAT CTTACAGGGC CAAGGCCGGA CGGCGCATAC CAACGCGGTC 
GCGGTTAATG CAGGTTGCGC CCTGTACATT TCAGGCGTGT GTGATAGCGT CGAGTCGGGT 
ACAGCACTGG CACTAGAGAC GTTAGCCAGC ACCAAGGCCT ATACACTTCT TGAGCGGCTT 
GCCAGTGCAA GCGCTAACCA AGCAAAAGTC GGAGCATAA

Protein sequence

MSDSTDLQPL IDKLYRGESV SRSKAKQLFS CIINGEMSEA AMAGMLVAMK MRGETIDEIS 
GAADALISAA KAFPTPSDAT RKQGIVDIVG TGGDGHNTIN ISTTAAFVAA ASGAKVAKHG 
NRSVSSKSGS SDLLAQFGID LTMAPETARD CLDELGLCFL FAPHYHGGVR HAVPVRQALK 
TRTLFNVLGP LINPSHPDYI LLGVYSEELV QPIAEVLKAL GMKRAMVVHG SGLDEVAVHG 
NTSVCELTDG ELKQYTLTPE VLGVPRANLK ELEGGSPEEN AEFTRAILQG QGRTAHTNAV 
AVNAGCALYI SGVCDSVESG TALALETLAS TKAYTLLERL ASASANQAKV GA