Gene B21_02368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02368
Symbol	hisS
ID	8114155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2502990
End bp	2504264
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	55%
IMG OID	644848570
Product	hypothetical protein
Protein accession	YP_003000143
Protein GI	251785839
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.965235
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAAAAA ACATTCAAGC CATTCGCGGC ATGAACGATT ACCTGCCTGG CGAAACGGCC 
ATCTGGCAGC GCATTGAAGG CACACTGAAA AACGTGCTCG GCAGCTACGG TTACAGTGAA 
ATCCGCTTGC CGATTGTAGA GCAGACCCCG CTATTCAAAC GTGCGATTGG TGAAGTCACC 
GACGTGGTTG AAAAAGAGAT GTACACCTTT GAGGATCGCA ATGGCGACAG CCTGACTCTG 
CGCCCTGAAG GGACGGCGGG CTGTGTACGC GCCGGCATCG AGCATGGTCT TCTGTACAAT 
CAGGAACAGC GTCTGTGGTA TATCGGGCCG ATGTTCCGTC ACGAGCGTCC GCAGAAAGGG 
CGTTATCGTC AGTTCCATCA GTTGGGCTGC GAAGTTTTCG GTCTGCAAGG TCCGGATATC 
GACGCTGAAC TGATTATGCT CACTGCCCGC TGGTGGCGCG CGCTGGGTAT TTCCGAGCAC 
GTAACTCTTG AGCTGAACTC TATCGGTTCG CTGGAAGCAC GCGCCAATTA CCGCGATGCG 
CTGGTGGCAT TCCTTGAGCA GCATAAAGAA AAGCTGGACG AAGACTGCAA ACGCCGCATG 
TACACTAACC CGCTGCGCGT GCTGGATTCA AAAAATCCGG AAGTGCAGGC GCTTCTCAAC 
GACGCTCCGG CATTAGGTGA CTATCTGGAC GAGGAATCTC GTGAGCATTT TGCCGGTCTG 
TGCAAACTGC TGGAGAGCGC GGGGATCGCT TACACCGTAA ACCAGCGTCT GGTGCGTGGT 
CTGGATTACT ACAACCGTAC CGTTTTCGAG TGGGTGACTA ACAGTCTCGG CTCCCAGGGC 
ACCGTGTGTG CAGGCGGTCG TTATGACGGT CTTGTGGAAC AACTGGGCGG TCGTGCAACA 
CCGGCTGTCG GTTTTGCGAT GGGCCTCGAA CGTCTTGTAT TGTTAGTACA GGCCGTTAAT 
CCGGAATTTA AAGCCGATCC TGTTGTCGAT ATATACCTGG TGGCTTCAGG TGCTGATACA 
CAATCTGCGG CTATGGCATT AGCTGAGCGT CTGCGTGATG AATTACCGGG CGTGAAATTG 
ATGACCAACC ACGGCGGCGG CAACTTTAAG AAACAGTTTG CCCGTGCTGA TAAATGGGGT 
GCCCGCGTTG CTGTGGTGCT GGGTGAGTCT GAAGTGGCTA ACGGCACAGC AGTAGTGAAG 
GATTTGCGCT CTGGTGAGCA AACGGCAGTT GCGCAGGATA GCGTAGCCGC GCATTTGCGC 
ACGTTACTGG GTTAA

Protein sequence

MAKNIQAIRG MNDYLPGETA IWQRIEGTLK NVLGSYGYSE IRLPIVEQTP LFKRAIGEVT 
DVVEKEMYTF EDRNGDSLTL RPEGTAGCVR AGIEHGLLYN QEQRLWYIGP MFRHERPQKG 
RYRQFHQLGC EVFGLQGPDI DAELIMLTAR WWRALGISEH VTLELNSIGS LEARANYRDA 
LVAFLEQHKE KLDEDCKRRM YTNPLRVLDS KNPEVQALLN DAPALGDYLD EESREHFAGL 
CKLLESAGIA YTVNQRLVRG LDYYNRTVFE WVTNSLGSQG TVCAGGRYDG LVEQLGGRAT 
PAVGFAMGLE RLVLLVQAVN PEFKADPVVD IYLVASGADT QSAAMALAER LRDELPGVKL 
MTNHGGGNFK KQFARADKWG ARVAVVLGES EVANGTAVVK DLRSGEQTAV AQDSVAAHLR 
TLLG