Gene Sfum_3303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3303
Symbol
ID	4458366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	4044426
End bp	4045691
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	61%
IMG OID	639704075
Product	histidyl-tRNA synthetase
Protein accession	YP_847411
Protein GI	116750724
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.375458
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGCA TCCAGGCCAT CAGAGGCATG AACGATATTC TGCCGGGGCA GATCGAATGG 
TGGCAGAAAG TGGAGAAAGC CGCCCGCGAA GTCCTGGAGG ATTTCGGCTA CCGTGAGATT 
CGAACTCCCG TCCTCGAGAA GCTCGAGCTC TTCGCCAGGG GAATCGGCGA GAGCACCGAC 
ATTGTGGAAA AGGAAATGTA CGCCTTCCCC GACCGCAAGG GGGACATGCT GGGTCTGCGT 
CCGGAGGCCA CCGCATCGGT GGTGAGAGCA TACATCCAGC ATAATCTGCA GGCGGATCCC 
TTCACTCAGA AGTTCTACCT GATGGGACCG ATGTTCCGCC ATGAACGCCC CCAGAAAGGG 
CGCTATCGAC AGTTTCACCA GATCGACGCG GAAGCGTTCG GCATCGACGA TCCCATGCTC 
GACGCCGAAG TCATGTACAT GCTCCGGCTT TTCTTCGAAC GCGTCGGCCT GAGCGGAGTC 
GTTCTGCACA TCAACTCCCT AGGCTGCCAT GAATGCCGGC AGGAATATCG TTCGGTTTTG 
AAGGAATATC TCGGAGGCCA CGTCGAGCGC CTGTGCCCGG ATTGCCTGCG GCGGCGCGAG 
ACCAATCCCC TGCGGGTGTT CGACTGCAAG GTGGAACGTT GCCAGGCTGT GCTCGAGGAC 
GCTCCTTTGC TGCCGGACTA CATCTGCGGC GACTGCGGAG AACACTTCGC CCGAGTAAGG 
GACTACCTCC AGCAGCTCCA AACGGATTTC GTCATCGACC CGAGAATGGT GCGGGGATTG 
GACTATTACA CGCGAACCAC CTTCGAAGTC ATAACGGACC GCCTGGGAGC TCAAAATGCC 
GTGGGGGGCG GCGGACGCTA CAACGGGCTG GTACGGGATC TGGGAGGGCC GGACTTGCCC 
GGCATCGGGT TCGCCATCGG GATGGAACGC CTCATCCTGC TGCTCCAGCA GGAAGGGGAG 
GAATCGAAGC GAAGCCCGCG GCTGTTCATC GCAACCCTGG GGGAAGCGGC AAGACTGAAG 
GGCTTTCTGC TGGCCCAGCA GTTTCGAGCC CTCGGCGTTT CGACCGAAAC GGACTATGAA 
GCCAGGAGCC TCAAGAGCCA GATGCGCCGC GCCGACCGGT CGGGAGCGCG TTACGTACTC 
ATCCTGGGAG AAGAGGAAAT CGCCCGGGGC GAAATCCAGC TCCGGGACCT GCGGGAGAAG 
TCCCAGGTCA ATCTGCCCCT GGCGTCGGCG TCGGAAACCG TCCACCGGAT GTGTCGAGAC 
GCCTGA

Protein sequence

MESIQAIRGM NDILPGQIEW WQKVEKAARE VLEDFGYREI RTPVLEKLEL FARGIGESTD 
IVEKEMYAFP DRKGDMLGLR PEATASVVRA YIQHNLQADP FTQKFYLMGP MFRHERPQKG 
RYRQFHQIDA EAFGIDDPML DAEVMYMLRL FFERVGLSGV VLHINSLGCH ECRQEYRSVL 
KEYLGGHVER LCPDCLRRRE TNPLRVFDCK VERCQAVLED APLLPDYICG DCGEHFARVR 
DYLQQLQTDF VIDPRMVRGL DYYTRTTFEV ITDRLGAQNA VGGGGRYNGL VRDLGGPDLP 
GIGFAIGMER LILLLQQEGE ESKRSPRLFI ATLGEAARLK GFLLAQQFRA LGVSTETDYE 
ARSLKSQMRR ADRSGARYVL ILGEEEIARG EIQLRDLREK SQVNLPLASA SETVHRMCRD 
A