Gene Smed_2550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2550
Symbol
ID	5323418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2648242
End bp	2649348
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	62%
IMG OID	640791493
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001328215
Protein GI	150397748
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTG CCCTGAAAAG CCCTGAGCCG CGTTCCGGCA TTCTGGACAT CGCCGCCTAC 
GTGCCCGGCA AGGAAATAGC GCCCGGTCTT GCCAAGGTGC ACAAGCTTTC GTCGAACGAA 
ACGCCTCTCG GCGCGAGCCC GCGCGCGATC GAGGCTTTCC AGAAGGCAGC TTTCAATCTC 
GAACGCTACC CGGACGGTCA GGCGAATGCG TTGAAGGAAG CGATCGCTGC CGTTCATGGG 
CTGAATGCCG CCAATATCCT GTGCGGAAAC GGGTCGGACG AACTGCTCGG TCTTCTCTGC 
CAGACCTATC TCGGCCCTGG CGACGAGGGG ATCGTCACCC AGCATGGTTT TCTGGTCTAC 
AGGATCCAGA TCGCTGCCTC CGGCGGGACG CCCGTCACGG TCAGCGAAAG GGACGAGCGC 
GTCGATGTCG ATGCGATCAT CGCGGCCGTC ACCGAACGGA CGAGGATCGT GTTCATAGCC 
AACCCGGGCA ATCCGACCGG CACCTATGTC CCGGTGGACG AAGTCCGGCG CCTGCATGCG 
GCTTTGCCGG CCGGCGCTCT GCTGGTGCTC GATGCCGCCT ATGCGGAATA TGTCAGGCGC 
AACGACTATG AAGCCGGGCT TGAGCTCGTA TCCTCCAACC GCAATGTCGT GATGACGCGA 
ACCTTCTCGA AAATCTACGG CCTCGCGGGT TTGCGCATCG GCTGGATGTA TGCGCCGCGC 
GACGTGGTGG AGGCGTTGGA CCGCGTGCGC GGCCCCTTCA ACCTGAATGC TCCGGCGATC 
GCCGCCGGCG CCGCGGCAAT CCGCGATCAG GCCTTTATTG CCGAGGCGGG CGACCACAAT 
CAAAAATGGC TGGCAATCGT CAGTCAGGCG CTGACGAAAA TCGGCCTCCG CGTTACGCCG 
TCGGTGACGA ACTTCGTGCT GATCCATTTT CCGGCAGAAG CCGGCATGTC TGCCGGCGAT 
GCGGATTCCT ATCTGACAAG CCGCGGTTTC ATCTTGCGTG CCGTCGGCGC CTACGGTTTT 
CCCAATGCGC TGAGAATGAC GATAGGCACG AAAGAAGCGA ACGAGGGCGT CGTTGCGGCG 
CTGACTGAAT TCATGGGACG GAAATGA

Protein sequence

MNLALKSPEP RSGILDIAAY VPGKEIAPGL AKVHKLSSNE TPLGASPRAI EAFQKAAFNL 
ERYPDGQANA LKEAIAAVHG LNAANILCGN GSDELLGLLC QTYLGPGDEG IVTQHGFLVY 
RIQIAASGGT PVTVSERDER VDVDAIIAAV TERTRIVFIA NPGNPTGTYV PVDEVRRLHA 
ALPAGALLVL DAAYAEYVRR NDYEAGLELV SSNRNVVMTR TFSKIYGLAG LRIGWMYAPR 
DVVEALDRVR GPFNLNAPAI AAGAAAIRDQ AFIAEAGDHN QKWLAIVSQA LTKIGLRVTP 
SVTNFVLIHF PAEAGMSAGD ADSYLTSRGF ILRAVGAYGF PNALRMTIGT KEANEGVVAA 
LTEFMGRK