Gene Sfum_2015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_2015
Symbol
ID	4459681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	2466341
End bp	2467462
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	59%
IMG OID	639702781
Product	histidinol-phosphate aminotransferase
Protein accession	YP_846133
Protein GI	116749446
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.788991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.413564
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACT TCCCTCCCCT GGACAGGCTC ACACCCGAAT ACATCAGAAA CTTCGAACCC 
TACATCCCGA GCAAGCCCGA CGAGGAACTG AAAAGACTCT ATGGTTGCGA GCGGCTTTTT 
CGCTTGAACA ACAACGAAAA CCCCTTGGGG CCTCCTCCCG CCGCACGGCG GGTGATCCGG 
GAGTTCCCGC CGCCGCGGGC ATCCGTCTAT CCCAGCGGGG ATGCCTACTA CCTGCGGTTG 
AAGCTTGCCG AAAAGTTCGA CATGCATCCG GATCAGTTCC TGGTCGGGAA CGGAGCCAAC 
GAAGTCATCT CCTTTGCGAT CAAGGCATTC TGCGAGGCGG GGGACAATAT CGTCACAGCG 
GACAAAACCT TTGCGGTCTA CGAGTGGGTG GCCACCTTTT CCGGATTCGG CGCGCACCTC 
GTTCCGCTCG CGGACTTCGG ATTCGACGCG GAAGGGATGC TCCGGGCGAT GGACGACCGC 
ACCAAGATCC TGTTTGTATG CAATCCCAAC AATCCCACAG GGAGCATCTG GAAGAGGGGT 
ATGCTGCGTG GTTTCCTGGA TCGCGTGGCA GGGAGCCGGA TTGTTGTCGT TGACGAAGCA 
TACGCGGAAT TCGTGGAAGA TCCGGAATTC CAGAATGCCA TGGACCTGAT CCCGGAATAT 
CCCAACCTCG TCGTGTTCAG AACCTTTTCC AAGATGTATG CCCTGGCGGG GCTGCGCATC 
GGGTACCTGG CAGGGGCGAT GGAAGTGGTC GACGTCATTC GAAGGACCTG CGTCGTCTAC 
TCCGTCAATG TGCTGGCGCA ACTCGCCGCC CTGGCGGCCA TCGAGGAATG CGCGGAACAC 
ATCGAACGCA CGCGGGAGCT GGTGCGGAAG GGGAAGTCCT TTCTCGTACG GGAAATCGGG 
GCGCTGGGAC TGGAGTACGT TTCCGGCGAG GGGAACTTCG TCATGCTCAA ACTGCCCATG 
AATGACGGTC TGGCCTATCG CAAGCTCATG ACTCGGGGCG TCATGATCCG CAGCATGACC 
GGGTTCCGTT TTCCCAACTG GATCCGGGTG ACGGTTTCCA CGGATGAAGC CATGGAGTGC 
TTCATCGAGG CATTGACCGA AGCGCTCGGA GAACGCGGGT GA

Protein sequence

MSNFPPLDRL TPEYIRNFEP YIPSKPDEEL KRLYGCERLF RLNNNENPLG PPPAARRVIR 
EFPPPRASVY PSGDAYYLRL KLAEKFDMHP DQFLVGNGAN EVISFAIKAF CEAGDNIVTA 
DKTFAVYEWV ATFSGFGAHL VPLADFGFDA EGMLRAMDDR TKILFVCNPN NPTGSIWKRG 
MLRGFLDRVA GSRIVVVDEA YAEFVEDPEF QNAMDLIPEY PNLVVFRTFS KMYALAGLRI 
GYLAGAMEVV DVIRRTCVVY SVNVLAQLAA LAAIEECAEH IERTRELVRK GKSFLVREIG 
ALGLEYVSGE GNFVMLKLPM NDGLAYRKLM TRGVMIRSMT GFRFPNWIRV TVSTDEAMEC 
FIEALTEALG ERG