Gene VC0395_A0289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0289
Symbol	hisS
ID	5135784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	302957
End bp	304225
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	50%
IMG OID	640531747
Product	histidyl-tRNA synthetase
Protein accession	YP_001216245
Protein GI	147674318
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAAAAA CTATTCAAGC AATCCGAGGC ATGAACGATT GTCTCCCAAC CCAGTCTCCA 
CTTTGGCAAA AAGTGGAAGG CGTGGTGAAA AATGTAATCA GCGCTTACGG TTACAGCGAA 
GTTCGTATGC CAATCGTTGA GATGACTCAT CTATTTAGCC GCGCCATCGG TGAAGTGACC 
GATGTGGTGG AAAAAGAGAT GTACACCTTT GAAGATCGCA ATGGTGATAG CTTAACGCTG 
CGACCTGAAG GTACGGCGGG CTGTGTGCGC TCTGGTATCG AAAATGGTTT GCTGTACAAC 
CAAGAGCAAC GTTTGTGGTA CATGGGACCG ATGTTCCGTC ACGAACGTCC GCAAAAAGGT 
CGTTACCGTC AATTCCATCA GTGTGGTGTT GAAGTGTTTG GTTTAGATGG CCCCGATGTG 
GACGCTGAAC TGATCATGAT GACGGCACGT CTGTGGCGCG AATTGGGTAT TGCACAACAT 
GTGCGTTTAG AGCTCAACTC GATTGGCTCT CTAGAGGCTC GCGCTAATTA TCGCACCGCC 
TTGATTGACT ATCTTGAGCA GTACCAAAAC GTACTGGATG AAGATTGCAA GCGCCGCATG 
TACACCAACC CGCTGCGTGT GCTTGATTCG AAGAATCCTG ATGTACAAGC GATTTTAGGT 
GATGCCCCTC AGCTCTCTGA TTATCTCGAT GCTGAATCAA AACAACATTT TGCGGGCTTG 
TGTGAACTTC TGGATGCGGC GGGTATCGAA TACACGGTAA ATCAACGTTT AGTTCGCGGC 
CTTGATTATT ACAACCGCAC GGTTTTTGAG TGGATCACCG AAAGTCTGGG ATCGCAAGGT 
ACCGTTTGTG GCGGCGGCCG CTATGATGGC TTGGTTGAAC AACTGGGCGG TAAACCAACC 
CCTGCGGTAG GTTTCGCTAT GGGCCTAGAG CGTTTAGTGC TGATGATGGA AACACTCGGT 
AATACGGATG TCCGTCGCAG CGTAGATGTG TATATGGTTA CTGCAGGTGA AGGCACCATG 
ATGGCGGGAA TGAAGCTTGC GGAACAGTTA CGTGAGCAAG TGCCCGGCCT ACGTGTGATG 
ACTCACTTCG GTGGCGGCAA TTTTAAAAAG CAATTTAAAC GCGCGGATAA AGTGGGCGCA 
GCGATTGCCT TGGTTTTGGG TGAAGATGAA GTTGCAGCCC AAACCGTTGT GGTAAAAGAT 
TTGGCGGGAG GCGAGCAAAA TACTGTTGCC CAAGCTGAAG TAGCTAAACT ACTGGCACAT 
TTAGCCTAA

Protein sequence

MAKTIQAIRG MNDCLPTQSP LWQKVEGVVK NVISAYGYSE VRMPIVEMTH LFSRAIGEVT 
DVVEKEMYTF EDRNGDSLTL RPEGTAGCVR SGIENGLLYN QEQRLWYMGP MFRHERPQKG 
RYRQFHQCGV EVFGLDGPDV DAELIMMTAR LWRELGIAQH VRLELNSIGS LEARANYRTA 
LIDYLEQYQN VLDEDCKRRM YTNPLRVLDS KNPDVQAILG DAPQLSDYLD AESKQHFAGL 
CELLDAAGIE YTVNQRLVRG LDYYNRTVFE WITESLGSQG TVCGGGRYDG LVEQLGGKPT 
PAVGFAMGLE RLVLMMETLG NTDVRRSVDV YMVTAGEGTM MAGMKLAEQL REQVPGLRVM 
THFGGGNFKK QFKRADKVGA AIALVLGEDE VAAQTVVVKD LAGGEQNTVA QAEVAKLLAH 
LA