Gene Sare_3530 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3530
Symbol	trpD
ID	5704598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4071353
End bp	4072414
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	73%
IMG OID	641272957
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001538323
Protein GI	159039070
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000658769
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGCGAAC GGACCTGGCC GCAACTGCTC GCCGCGCTGC TTCGCGGCGA CGAGCTCTCC 
ACCGCTGACA CAGCCTGGGC AATGGGTGAG ATCATGTCCG GCTCGGCTGG CTCGGCGCAG 
ATCGCCGGTT TCGCCATCGC GCTACGGGCC AAGGGCGAAA CCCCCGCCGA GGTGTCCGGC 
TTGGTGGAGG CGATGCTTCA GCACGCGGTT CGGGTCGAGC TGCCCGAGGA CCTACGCGCG 
ACCGCAGTGG ACGTGGTGGG CACCGGCGGC GACCTCGCGC ACACCGTCAA CATCTCCACC 
ATGGCCTCCC TGGTGGTGGC CGGTGCCGGC GTACGGGTCG TCAAGCACGG CAACCGGGCC 
GCCTCCTCGT CCTGCGGCAC CGCGGACGTG CTGGAGTTTC TCGGCCTGCC GCTGGACCTG 
GGTCCGGAGG GGGTGGCGGC CTGCGTCGCC GAGGCAGGTA TCGGCTTCTG CTTCGCGGCC 
CGGTTCCACC CCGGTATGCG CCATGCCGGT CCGGTCCGCC GGGAACTGGG CGTACCGACC 
GCCTTCAACT TCCTCGGCCC GCTCACCAAC CCGGCCCGTC CGCGGGCCGG CGCGGTCGGC 
TGCTTCGACG CGCGGATGGC ACCGGTCATG GCAGCGGTCT TCGCCGCCCG CGGTGACTCG 
ACGCTCGTCC TGCGGGGCGA GGACGGGCTG GACGAGTTCA CCACTGCCGC CCCCACCCGG 
GTGTGGGCGG CGCAGAACGG CACCGTCCGG GAGGCCCTGC TCGACGCAGC CGACCTCGGG 
GTGCCCCGGG CCACCCTCGC CGACCTGCGC GGCGGTGATG TCGCGTGCAA CGCCGACGCG 
GTGCGCCGCC TGCTGGCCGG TGAGACCGGG CCGATACGCG ACGCCGTGTT GGTCAACGCC 
GCCGCCGCGC TGGCCACCCA GGCACCCCTG GACGGTGACC TGACCGAGGC GCTGCGGACC 
GGTCTGTCCC GCGCGGCCGA ATCGATCGAC TCCGGCGCTG CCGCCCGCAC CCTGAACCGG 
TGGATCGAGG TCGCCCACGC CGTCCGGCCA GTGCTCGGCT GA

Protein sequence

MGERTWPQLL AALLRGDELS TADTAWAMGE IMSGSAGSAQ IAGFAIALRA KGETPAEVSG 
LVEAMLQHAV RVELPEDLRA TAVDVVGTGG DLAHTVNIST MASLVVAGAG VRVVKHGNRA 
ASSSCGTADV LEFLGLPLDL GPEGVAACVA EAGIGFCFAA RFHPGMRHAG PVRRELGVPT 
AFNFLGPLTN PARPRAGAVG CFDARMAPVM AAVFAARGDS TLVLRGEDGL DEFTTAAPTR 
VWAAQNGTVR EALLDAADLG VPRATLADLR GGDVACNADA VRRLLAGETG PIRDAVLVNA 
AAALATQAPL DGDLTEALRT GLSRAAESID SGAAARTLNR WIEVAHAVRP VLG