Gene Smed_0665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0665
Symbol
ID	5321501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	715869
End bp	716990
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	61%
IMG OID	640789601
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001326356
Protein GI	150395889
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAT TCTCGCGCCT CACGCCTCTC ATCCAGTCTT TGCCGGCCAC CGTCCCCTTC 
GTCGGCCCGG AAGCCCTCGA GCGTCAGCGT GGCCGCAAGA TAACGGCGCG AATCGGTGCC 
AATGAGAGCG GATTCGGCCC GGCTCAATCC GTGTTGCACG CCATTCGGCA AGCGGCTGAT 
GAGACCTGGA AATATTCCGA TCCCGAGAAT CACGACCTGA AGCAGGCGCT CGCCGACCAT 
CTCGGCATCC CTTCCGAGAA TATCGCCGTG GGCGAAGGCA TAGACGGCCT TCTAGGCCAG 
ATCGTACGAC TCGTCGTGGA AGCGGGCATG CCGGTCATAA CCTCTCTTGG GGGCTATCCG 
ACGTTCAATT ATCATGTCGC AGGCCACGGC GGGCGGCTCG TGTCGGTGCC CTATGCCGAC 
GATCAGGAAG ATCTCGAAGG ACTGCTCGCT GCGGCGGAGC GCGAGAATGC TCCGCTTGTG 
TATCTGGCCA ATCCCGACAA TCCGATGGGA AGCTGGTGGC CGGCCGAGCG CGTGATCGCC 
TTTGCGAACG CCCTTCCGGA AACGACGCTC CTGGTGCTGG ACGAAGCCTA TTGCGAGACG 
GCCCCGCCGG ACGCTCTCCC CTCGATCGAG AGCCTTATCG ATAAGCCGAA CGTCATTCGG 
ACGCGTACCT TCTCCAAAGC TTACGGCCTG GCCGGAGCTC GTATCGGTTA CACGCTGTCG 
ACGCCCGGCA CCGCCCAGGC TTTCGACAAG ATACGCAACC ATTTCGGGAT GAGCCGTATC 
GGGGTGGCGG CAGCGATCGC CGCTTTGGCC GACCAGAATT ACTTAAAGGA AGTCAAGCTC 
AGAATCGCGA ATTCACGCGA CCGGATCGGC CGGATCGCCG GCGAAAACGG GCTCCTCGCA 
CTTCCCTCGG CCACGAATTT CGTAACTGTC GATTGTGGAA AAGATGCAGC CTATGCGCGG 
GGAATTGTCG ATCGGCTGAT GAGCGATCAC GGGATCTTCA TCCGGATGCC GGGGGTCGCG 
CCGCTTAACC GCTGCATTCG CATCAGCACC GCGCCCGATG CTGAAATGGA TTGTCTGGCG 
GTCGCGCTTC CGCAGGTGAT CAGGAAACTG GCTTCCGGTT GA

Protein sequence

MSEFSRLTPL IQSLPATVPF VGPEALERQR GRKITARIGA NESGFGPAQS VLHAIRQAAD 
ETWKYSDPEN HDLKQALADH LGIPSENIAV GEGIDGLLGQ IVRLVVEAGM PVITSLGGYP 
TFNYHVAGHG GRLVSVPYAD DQEDLEGLLA AAERENAPLV YLANPDNPMG SWWPAERVIA 
FANALPETTL LVLDEAYCET APPDALPSIE SLIDKPNVIR TRTFSKAYGL AGARIGYTLS 
TPGTAQAFDK IRNHFGMSRI GVAAAIAALA DQNYLKEVKL RIANSRDRIG RIAGENGLLA 
LPSATNFVTV DCGKDAAYAR GIVDRLMSDH GIFIRMPGVA PLNRCIRIST APDAEMDCLA 
VALPQVIRKL ASG