Gene DvMF_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2037
Symbol	hisS
ID	7173956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	2526655
End bp	2527935
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	643540554
Product	histidyl-tRNA synthetase
Protein accession	YP_002436448
Protein GI	218887127
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	86
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA ACAATTCCGA CAAGACCGCA CAAAAGGTTA CGGGCGACAA GGTGGGCACC 
ATCAAGGGGT TCGCCGACAT GTTCAGCCCC GACAGTGACG TGTTCACCTT CATGGAGAAC 
ACCGCGCGCG AGGTGTTTGG CCGCTACGGC TACGCCGAAC TGCGCACCCC GCTGCTGGAA 
CGCACCGAAC TGTTCTGCCG CTCCATCGGC ACCGAGACCG ACGTGGTGCA GAAGGAAATG 
TACACCTTCC CCGACCGCAA GGGCCGTTCG CTGACCCTGC GCCCGGAAGC CACGGCGGGC 
GTCATGCGCG CGTTCATCGA TGCGGGCCGC CACGCGCAGG AGCCGGTCTC CAAGCTGTTC 
ACCACCGGCC CCATGTTCCG CTACGAGCGC CCGCAGAAGG GCCGCATGCG CCAGTTCCAC 
CAGATCAACT GCGAATGCCT TGGCCCGCAG GAACCGCAGG CCGACGCCGA ACTGGTGCTG 
ATGCTCATGA CCTTCCTGCG CGAACTGGGG CTGACCGACC TTTCGTTGCA GGTGAACTCG 
CTGGGCTGCC GCGAATGCCG CCCGGTGTAC CGGGCCGCGC TGCGCGACTT TCTGGATTCC 
ATCGACCGCG AATCGCTGTG CGAGGACTGC CGCCGCCGCA TCGACACCAA CCCGTTGCGG 
GTGCTGGACT GCAAGGTGCC CACCTGCCGC GAGCTGACCG CCGAGGCCCC GCGCATCATC 
GACCACAACT GCCCGGAATG CCGCAGCCAC TTCGACACGG TGCTGCGCGT GTTCGACGCC 
GCGCAGTTGC CCTACGTGCT CACCCCGCGC CTGGTGCGCG GGCTGGACTA CTACAACCGC 
ACCACCTTCG AGGTGGTGTC CGGCTCCATC GGCGCGCAGT CGTCGGTGGC GGGCGGCGGG 
CGGTATGACG GCCTGGTGGC GCAACTGGGC GGCCCCGACG TGCCCGGCGT GGGCTTTGCC 
TGCGGCATGG AACGCCTGGC CCTGATGATG CCCGCGCTGG AGAAGAAGCG GCCCGATTTC 
TACATCGCCG TGCTGGACCC GGCTGCGGCG GACGCGGCCA TGCTGCTGGC GCAGGAACTG 
CGCGCGGCGG GCAAGGCGGG CGAGGTGTCC TTTGCCGCGC GCGGCATCAA GGGCCAGATG 
CGCCAGGCCG GACGCACCGG CGCGCGCTGC ACCCTGCTGC TGGGCGGCGA CGAGATGGCC 
AACGGCACCG TTGTCATCAA GGACATGGAC AGCGGCGAGC AGCGCAGCGT GCCGCAGGGC 
GAGGCCGCAA ACCACGTATA G

Protein sequence

MSTNNSDKTA QKVTGDKVGT IKGFADMFSP DSDVFTFMEN TAREVFGRYG YAELRTPLLE 
RTELFCRSIG TETDVVQKEM YTFPDRKGRS LTLRPEATAG VMRAFIDAGR HAQEPVSKLF 
TTGPMFRYER PQKGRMRQFH QINCECLGPQ EPQADAELVL MLMTFLRELG LTDLSLQVNS 
LGCRECRPVY RAALRDFLDS IDRESLCEDC RRRIDTNPLR VLDCKVPTCR ELTAEAPRII 
DHNCPECRSH FDTVLRVFDA AQLPYVLTPR LVRGLDYYNR TTFEVVSGSI GAQSSVAGGG 
RYDGLVAQLG GPDVPGVGFA CGMERLALMM PALEKKRPDF YIAVLDPAAA DAAMLLAQEL 
RAAGKAGEVS FAARGIKGQM RQAGRTGARC TLLLGGDEMA NGTVVIKDMD SGEQRSVPQG 
EAANHV