Gene EcSMS35_2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2666
Symbol	hisS
ID	6146367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2735262
End bp	2736536
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	55%
IMG OID	641617537
Product	histidyl-tRNA synthetase
Protein accession	YP_001744702
Protein GI	170682103
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.557016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.28458
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAAAAA ACATTCAAGC CATTCGCGGC ATGAACGATT ACCTGCCTGG CGAAACGGCC 
ATCTGGCAGC GCATTGAAGG CACACTGAAA AACGTGCTCG GCAGCTACGG TTACAGTGAA 
ATCCGCTTGC CGATTGTAGA GCAGACCCCG CTATTCAAAC GTGCGATTGG TGAAGTCACC 
GACGTGGTTG AAAAAGAGAT GTACACCTTT GAGGATCGCA ATGGCGACAG CCTGACTCTG 
CGCCCTGAAG GGACGGCGGG CTGTGTACGC GCCGGCATCG AGCATGGTCT TCTGTACAAT 
CAGGAACAGC GTCTGTGGTA TATCGGGCCG ATGTTCCGTC ACGAGCGTCC GCAGAAAGGG 
CGTTATCGTC AGTTCCATCA GTTGGGCTGC GAAGTTTTCG GTCTGCAAGG TCCGGATATC 
GACGCTGAAT TGATTATGCT CACCGCCCGC TGGTGGCGCG CGCTGGGTAT CTCCGAGCAC 
GTAACTCTTG AGCTGAACTC TATCGGTTCG CTGGAAGCAC GCGCCAATTA CCGCGATGCG 
CTGGTGGCAT TCCTTGAGCA GCATAAAGAA AAGCTGGACG AAGACTGCAA ACGCCGCATG 
TACACTAACC CGCTGCGCGT GCTGGATTCA AAAAATCCGG AAGTGCAGGC GCTTCTCAAC 
GACGCTCCGG CATTAGGCGA TTATCTGGAC GAGGAATCTC GTGAGCATTT TGCCGGTCTG 
TGCAAACTGC TTGAGAGCGC GGGGATCGCT TACACCGTCA ACCAGCGTCT GGTGCGTGGT 
CTGGATTACT ATAACCGTAC CGTTTTCGAG TGGGTGACTA ACAGCCTCGG TTCCCAGGGC 
ACCGTGTGTG CAGGCGGTCG TTATGACGGT CTGGTGGAAC AACTGGGCGG TCGTGCAACA 
CCGGCTGTCG GTTTTGCGAT GGGCCTCGAA CGTCTTGTAT TGTTAGTACA GGCCGTTAAT 
CCGGAATTTA AAGCCGATCC TGTTGTCGAT ATATACCTGG TGGCTTCAGG TGCTGATACA 
CAATCTGCGG CTATGGCATT AGCTGAGCGT CTGCGTGATG AATTACCGGG CGTGAAATTG 
ATGACCAACC ACGGCGGCGG CAACTTTAAG AAACAGTTTG CCCGTGCTGA TAAATGGGGT 
GCCCGCGTTG CTGTGGTGCT GGGTGAGTCT GAAGTGGCTA ACGGCACAGC AGTAGTGAAG 
GATTTGCGCT CTGGTGAGCA AACGGCAGTT GCGCAGGATA GCGTAGCCGC GCATTTGCGC 
ACGTTACTGG GTTAA

Protein sequence

MAKNIQAIRG MNDYLPGETA IWQRIEGTLK NVLGSYGYSE IRLPIVEQTP LFKRAIGEVT 
DVVEKEMYTF EDRNGDSLTL RPEGTAGCVR AGIEHGLLYN QEQRLWYIGP MFRHERPQKG 
RYRQFHQLGC EVFGLQGPDI DAELIMLTAR WWRALGISEH VTLELNSIGS LEARANYRDA 
LVAFLEQHKE KLDEDCKRRM YTNPLRVLDS KNPEVQALLN DAPALGDYLD EESREHFAGL 
CKLLESAGIA YTVNQRLVRG LDYYNRTVFE WVTNSLGSQG TVCAGGRYDG LVEQLGGRAT 
PAVGFAMGLE RLVLLVQAVN PEFKADPVVD IYLVASGADT QSAAMALAER LRDELPGVKL 
MTNHGGGNFK KQFARADKWG ARVAVVLGES EVANGTAVVK DLRSGEQTAV AQDSVAAHLR 
TLLG