Gene A9601_00341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00341
Symbol	dhsS
ID	4716716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	32388
End bp	33551
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	33%
IMG OID	640077731
Product	soluble hydrogenase small subunit
Protein accession	YP_001008429
Protein GI	123967571
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0075] Serine-pyruvate aminotransferase/archaeal aspartate aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCATAC AACAAAAATT ATCATTGATG ATTCCTGGAC CCACACCAGT TCCAGAAAAA 
GTATTACAAG CATTAAGTAA ACATCCAATA GGCCATCGCA GCAAAGAATT CCAAGATCTC 
GTAGAGAGTA CTACTAAAAA TTTACAATGG CTTCATCAAA CTCAAAATGA TGTTCTAACA 
ATTACTGGAA GTGGGACTGC CGCAATGGAG GCCGGAATAA TAAATACCTT AAGTAGAGGA 
GATAAAGTAA TTTGTGGAGA CAATGGAAAA TTTGGAGAAA GATGGGTAAA AGTTGCTAAA 
GAATTTGGTC TAGAAGTAAT AAAAATTGAT TCAGAATGGG GTACTCCACT TGATCCAGAA 
AAATTCAAAA AGGTATTAGA AGAAGATACA CAAAAAGAAA TTAAAGCTGT TATTTTGACT 
CATTCTGAAA CCTCAACAGG TGTAATTAAT GACTTAAAAA CCATAAGTTC ATATATTCGC 
AAACACAATA CAGCTTTATC AATTGTTGAT TGCGTTACAA GTCTTGGAGC TTGCAATGTT 
CCAGTAGATG AATGGGAATT AGATATCGTT GCTTCAGGAT CACAAAAAGG TTATATGATA 
CCTCCAGGGC TTAGTTTTAT AGCAATGAGC CAAAAAGCAT GGGAAGCTGC AGAAAAATCT 
AATCTACCAA AATTTTATTT AAATTTAAAA TCATACAAAA AAAGTCTTTT AAGTAACAGT 
AACCCATATA CTCCAGCAGT TAATTTGGTT TTTGCTTTAG ATGAATCTTT AAAAATGATG 
AAAGAAGAAG GCTTAGATAA CATTTTCTTC AGACACAATA AACATAAATT AGCAATGAGC 
AATGCTGTAA AGGCTTTAGA TCTTAAATTA TTTGCTGATG AAAAATACTT GAGCCCATCA 
ATTACTGCGG TAAAAACTGA AGGAATAGAT GCTGAAGAAT TTAGGAAAAC TATAAAAAAT 
AATTTTGATA TTTTACTTGC TGGTGGTCAA GATCATATGA AAGGAAAAAT ATTTAGAGTC 
GGGCACTTAG GTTATGTTAA TGATAGAGAT ATTATTACGG TGGTTTCTGC TATAAGTAAT 
ACACTTCTCA ACCTCGGTAA AATTACAGCC AAACAAGCTG GTGAAGCATT AAAAGTTGCT 
TCAAGATATC TAGCAGAGAA TTAA

Protein sequence

MAIQQKLSLM IPGPTPVPEK VLQALSKHPI GHRSKEFQDL VESTTKNLQW LHQTQNDVLT 
ITGSGTAAME AGIINTLSRG DKVICGDNGK FGERWVKVAK EFGLEVIKID SEWGTPLDPE 
KFKKVLEEDT QKEIKAVILT HSETSTGVIN DLKTISSYIR KHNTALSIVD CVTSLGACNV 
PVDEWELDIV ASGSQKGYMI PPGLSFIAMS QKAWEAAEKS NLPKFYLNLK SYKKSLLSNS 
NPYTPAVNLV FALDESLKMM KEEGLDNIFF RHNKHKLAMS NAVKALDLKL FADEKYLSPS 
ITAVKTEGID AEEFRKTIKN NFDILLAGGQ DHMKGKIFRV GHLGYVNDRD IITVVSAISN 
TLLNLGKITA KQAGEALKVA SRYLAEN