Gene Smed_1408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1408
Symbol	trpD
ID	5322259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1489869
End bp	1490882
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	65%
IMG OID	640790350
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001327089
Protein GI	150396622
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.457707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATT TGAAACCGTT CGTCGCCAAA GTCGCAGCGC GCGAGGCACT TAGCCGCGAC 
GATGCACGCG CGGCCTTCGA GATCATCATG TCCGGGGCGG CCACGCCGTC GCAGATCGGC 
GGCTTTCTCA TGGCGCTCCG TGTACGCGGC GAAACGGTCG ACGAGATCGT GGGTGCCGTC 
GGGGCGATGC GTGCACGCAT GTTGCACGTG AAGGCGCCGG ACGGTTCGAT CGACATTGTC 
GGCACCGGCG GCGACGGCGC CGGCACCTAC AATATTTCGA CGTTGGCCGC GCTGATCGTT 
GCAGGCGCGG GGGTGCCGGT CGCCAAGCAC GGCAACCGTG CGCTGAGCTC GAAATCAGGA 
ACGGCCGATG CGCTCTCCTG CCTGGGCGTC AATCTCGAAA TAGGGCCCGA GGCAATCTCG 
CGCTGCATCG GCGAAGCCGG TCTGGGCTTC ATGTTCGCGC AGCAGCACCA TTCGGCTATG 
CGCCATGTCG GTCCGACGCG GGTGGAACTC GGAACGAGAA CGATCTTCAA CCTGCTCGGC 
CCCCTCGCCA ATCCGGCCGG CGTTCGGCAA CAGCTCGTCG GCGTCTACGC GCCGCAATGG 
GTCGATCCGC TGGCAGAGGT GCTCCGCGAT CTCGGCTCCG AGAGTGTCTG GGTCGTCCAT 
GGCGAAGGGC TCGACGAGAT CACGACGACC GGAGTGACCA AGGTTGCGGC GCTCAAGGAC 
GGCACGATCA CCAACTTCGA ACTGACACCG GCCGATTTCG GGCTCGAGCG CGTTACGCTC 
GATGCCTTGA AGGGCGGTGA CGGCGCCCAT AACGCCGCCG CGCTGCAAGC TGTTCTCGAC 
GGTGCGGAGA ATGCCTACCG GGACATTTCC CTTGCGAACG CCGCCGCTTC GTTGATGATA 
GCGGGGCGCG CAAAGGACCT GATGGAGGGC ATGGACTTGG CCCGGAAATC GCTTTCGAGC 
GGCGCCGCAA AGGTCGCCTT GCAGCGATTG ATCACCGTTT CGAACGCGGC ATGA

Protein sequence

MSDLKPFVAK VAAREALSRD DARAAFEIIM SGAATPSQIG GFLMALRVRG ETVDEIVGAV 
GAMRARMLHV KAPDGSIDIV GTGGDGAGTY NISTLAALIV AGAGVPVAKH GNRALSSKSG 
TADALSCLGV NLEIGPEAIS RCIGEAGLGF MFAQQHHSAM RHVGPTRVEL GTRTIFNLLG 
PLANPAGVRQ QLVGVYAPQW VDPLAEVLRD LGSESVWVVH GEGLDEITTT GVTKVAALKD 
GTITNFELTP ADFGLERVTL DALKGGDGAH NAAALQAVLD GAENAYRDIS LANAAASLMI 
AGRAKDLMEG MDLARKSLSS GAAKVALQRL ITVSNAA