Gene EcE24377A_2798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2798
Symbol	hisS
ID	5590346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2789699
End bp	2790973
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	55%
IMG OID	640926449
Product	histidyl-tRNA synthetase
Protein accession	YP_001463836
Protein GI	157155202
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0241493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAAAAA ACATTCAAGC CATTCGCGGC ATGAACGATT ACCTGCCTGG CGAAACGGCC 
ATCTGGCAGC GCATTGAAGG CACACTGAAA AACGTGCTCG GCAGCTACGG TTACAGTGAA 
ATCCGCTTGC CGATTGTAGA GCAGACCCCG CTATTCAAAC GTGCGATTGG TGAAGTCACC 
GACGTGGTTG AAAAAGAGAT GTACACCTTT GAGGATCGCA ATGGCGACAG CCTGACTCTG 
CGCCCTGAAG GGACGGCGGG CTGTGTACGC GCCGGCATCG AGCATGGTCT TCTGTACAAT 
CAGGAACAGC GTCTGTGGTA TATCGGGCCG ATGTTCCGTC ACGAGCGTCC GCAGAAAGGG 
CGTTATCGTC AGTTCCATCA GTTGGGCTGC GAAGTTTTCG GTCTGCAAGG TCCGGATATC 
GACGCTGAAC TGATTATGCT CACCGCCCGC TGGTGGCGTG CGCTGGGTAT CTCCGAACAC 
GTAACTCTTG AGCTGAATTC TATCGGTTCG CTGGAAGCAC GCGCCAATTA CCGCGATGCG 
CTGGTGGCAT TCCTTGAGCA GCATAAAGAA AAGCTGGACG AAGACTGCAA ACGCCGCATG 
TACACTAACC CGCTGCGCGT GCTGGATTCC AAAAATCCGG AAGTGCAGGC GCTTCTCAAC 
GATGCTCCGG CATTAGGCGA TTATCTGGAC GAGGAGTCTC GTGAGCACTT TGCCGGTCTG 
TGCAAACTGC TTGAGAGCGC GGGGATCGCT TACACCGTAA ACCAGCGTCT GGTGCGTGGT 
CTGGATTACT ATAACCGTAC CGTTTTCGAG TGGGTGACTA ACAGTCTCGG CTCCCAGGGC 
ACCGTGTGTG CAGGCGGTCG TTATGACGGT CTTGTGGAAC AACTGGGCGG TCGTGCAACA 
CCGGCTGTCG GTTTTGCGAT GGGCCTCGAA CGTCTTGTAT TGTTAGTACA GGCCGTTAAT 
CCGGAATTTA AAGCCGATCC TGTTGTCGAT ATATACCTGG TGGCTTCAGG TGCTGATACA 
CAATCTGCGG CTATGGCATT AGCTGAGCGT CTGCGTGATG AATTACCGGG CGTGAAATTG 
ATGACCAACC ACGGCGGCGG CAACTTTAAG AAACAGTTTG CCCGTGCTGA TAAATGGGGT 
GCCCGCGTTG CTGTGGTGCT GGGTGAGTCT GAAGTGGCTA ACGGCACAGC AGTAGTGAAG 
GATTTGCGCT CTGGTGAGCA AACGGCAGTT GCGCAGGATA GCGTAGCCGC GCATTTGCGC 
ACGTTACTGG GTTAA

Protein sequence

MAKNIQAIRG MNDYLPGETA IWQRIEGTLK NVLGSYGYSE IRLPIVEQTP LFKRAIGEVT 
DVVEKEMYTF EDRNGDSLTL RPEGTAGCVR AGIEHGLLYN QEQRLWYIGP MFRHERPQKG 
RYRQFHQLGC EVFGLQGPDI DAELIMLTAR WWRALGISEH VTLELNSIGS LEARANYRDA 
LVAFLEQHKE KLDEDCKRRM YTNPLRVLDS KNPEVQALLN DAPALGDYLD EESREHFAGL 
CKLLESAGIA YTVNQRLVRG LDYYNRTVFE WVTNSLGSQG TVCAGGRYDG LVEQLGGRAT 
PAVGFAMGLE RLVLLVQAVN PEFKADPVVD IYLVASGADT QSAAMALAER LRDELPGVKL 
MTNHGGGNFK KQFARADKWG ARVAVVLGES EVANGTAVVK DLRSGEQTAV AQDSVAAHLR 
TLLG