Gene A9601_06791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_06791
Symbol	hisS
ID	4717381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	603778
End bp	605058
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	32%
IMG OID	640078392
Product	histidyl-tRNA synthetase
Protein accession	YP_001009072
Protein GI	123968214
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATAACT TAAAAAACCT AAGAGGAACA GTAGACCTAT TTCCTGATCA ATTAATAAAG 
TGGCAAAACG TTGAAAAAAT TTTATTAGAG CAGCTCTCTA GAGCATCCAT CAAAGAAATA 
AGAACACCAA TATTGGAAAT GACCGAATTA TTTATAAGAG GAATTGGTGA AGGAACAGAT 
GTTGTCAGTA AGGAAATGTA TACATTTCTT GATAGGGGGG AGAGGTCTTG CACTCTAAGA 
CCTGAAGGAA CAGCCTCAGT CGCACGAGCG TTAATACAAA ACGGAATATC TTCTAATCCT 
ATTCAAAAAC TTTGGTACAT GGGTCCTATG TTTCGATACG AAAGACCTCA AGCTGGCAGG 
CAAAGACAGT TTCATCAATT AGGTGTTGAG TTTATAGGAC ATGATTCAGT TAGAAGTGAT 
GTTGAAATTA TTGCTTTAGC TTGGGATATA TTACGCAAAT TAGGAATAAA AGAACTCAAT 
CTTGAAATAA ATACGTTAGG TGATACTAAT GACAGATCAA ATTTTCAAAA ATCTTTTTTA 
AAATGGTTAG AAACAAATAA AGATTCTCTA GATTTAGATT CTCAGAATAG AATTTCTAAA 
AACCCTTTGA GGATTTTGGA CTCAAAGAAT ATTCAAACTA AAAAAGTTCT TGAAAATGCA 
CCAAGATTAT TTAATTTTTT ATCTGAAAAA AGTCATAACA GATATTTAGA CTTAAAAAGA 
CAATTAGAGG TTTTAAAAAT ACCTTATGTA GAAAATTTTA ATCTTGTAAG AGGTTTAGAT 
TACTACACTC ATACAGCTTT TGAAATTACT AGTGGGGCTT TGGGCTCCCA AGCTACAGTT 
TGCGGAGGAG GGAGATACGA CGATTTAATA AAACAAATGG GAGGGCCAAA CACTCCTGCA 
ATTGGTTTCG CTATTGGTTT AGAAAGATTA ATTTTACTCG CAGGAAAAGA GCTTGAAATT 
CCAAGAAATA CTGATATCTA TATCATTAAT AAAGGCTTAG TTGCTGAATC ATTAGCAATG 
GATTTATCAA GAAAATTAAG AAATTACGAT TTGTTAGTTG AGTTAGATTT AAGCGGAGCC 
TCATTCTCTA AGCAATTTAA AAAGGCAAAT AAACTTAAAT CTAAAAGTAT TATTGTTATT 
GGTGAGGATG AGGCAGTTAA TGGGGAATTT ATTATAAGGC TCTTTGATCA ATCGGGTAAT 
GGGAATGAAG AGGAGGTTAT ATCTTTTGAG AATGATATTA AATTAGAAAA TTGGATAAAC 
AATAACTTAC TTGTAAAGTG A

Protein sequence

MNNLKNLRGT VDLFPDQLIK WQNVEKILLE QLSRASIKEI RTPILEMTEL FIRGIGEGTD 
VVSKEMYTFL DRGERSCTLR PEGTASVARA LIQNGISSNP IQKLWYMGPM FRYERPQAGR 
QRQFHQLGVE FIGHDSVRSD VEIIALAWDI LRKLGIKELN LEINTLGDTN DRSNFQKSFL 
KWLETNKDSL DLDSQNRISK NPLRILDSKN IQTKKVLENA PRLFNFLSEK SHNRYLDLKR 
QLEVLKIPYV ENFNLVRGLD YYTHTAFEIT SGALGSQATV CGGGRYDDLI KQMGGPNTPA 
IGFAIGLERL ILLAGKELEI PRNTDIYIIN KGLVAESLAM DLSRKLRNYD LLVELDLSGA 
SFSKQFKKAN KLKSKSIIVI GEDEAVNGEF IIRLFDQSGN GNEEEVISFE NDIKLENWIN 
NNLLVK