Gene A9601_05891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_05891
Symbol
ID	4717289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	514532
End bp	515572
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	37%
IMG OID	640078301
Product	dehydrogenase
Protein accession	YP_001008982
Protein GI	123968124
COG category	[R] General function prediction only
COG ID	[COG5322] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.735878
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGGGT TAATAGGCCA CTCAACCAGT TTTGAAGATG CAAAAAGAAA AGCTTCGATG 
CTAGGCTTTG ATCACATTGC TGATGGCGAC TTGGATGTTT GGTGTACTGC TCCTCCTCAG 
CTTGTTGAAA ATGTAGAAGT TAAGAGTGCA ACTGGAATAT CTATTGAAGG TTCTTATATA 
GATTCTTGCT TTGTTCCAGA AATGCTTTCT AGGTTTAAAA CCGCTAGAAG AAAAGTACTA 
AATGCTATGG AACTAGCTCA GAAAAAAGGG ATTAATATTA CAGCTTTAGG AGGATTTACT 
TCTATTATTT TTGAGAATTT TAATCTTCTA CAGCATAAAC AAATTAGAAA TACTTCATTA 
GAGTGGGAAA GATTTACTAC TGGCAATACT CATACCGCCT GGGTTATTTG TAAGCAACTA 
GAAATAAATG CTCCTCGCAT TGGGATAGAC CTTAAAAAAG CAACTGTTGC TGTAATTGGT 
GCTACAGGTG ATATTGGTAG CGCTGTTTGT AGGTGGCTTA TCAATAAAAC TGGGATTTCA 
GAACTCCTTA TGGTAGCAAG ACAACAAGAA CCTCTAGCGC TGTTACAAAA AGAATTAGAT 
GGTGGCACCA TAACAAGTTT GGATGAGGCA TTGCCTCAGG CGGACATTGT TGTGTGGGTT 
GCAAGTATGC CTAAAACTAT TGAAATTAAT ACTGACAACT TACAAAAACC ATGTTTAATG 
ATTGATGGTG GATATCCCAA AAATCTTGAT GAGAAATTTC AGGGTGAAAA TATTTATGTT 
TTAAAAGGAG GTATAGTAGA GTTTTTCAAT GATATTGGTT GGAATATGAT GGAACTTGCG 
GAAATGCAAA ACCCTCAGCG AGAGATGTTT GCTTGCTTTG CAGAAGCTAT GATTTTAGAA 
TTTGAGAAGT GTCATACAAA CTTTAGTTGG GGAAGAAATA ACATTTCCCT TGAAAAGATG 
GAATTTATTG GAGCAGCTTC TTTAAAGCAT GGTTTTTCCG CCATTGGACT TGATAAGCAG 
CCTAAAGTAT TAACTGTCTA A

Protein sequence

MFGLIGHSTS FEDAKRKASM LGFDHIADGD LDVWCTAPPQ LVENVEVKSA TGISIEGSYI 
DSCFVPEMLS RFKTARRKVL NAMELAQKKG INITALGGFT SIIFENFNLL QHKQIRNTSL 
EWERFTTGNT HTAWVICKQL EINAPRIGID LKKATVAVIG ATGDIGSAVC RWLINKTGIS 
ELLMVARQQE PLALLQKELD GGTITSLDEA LPQADIVVWV ASMPKTIEIN TDNLQKPCLM 
IDGGYPKNLD EKFQGENIYV LKGGIVEFFN DIGWNMMELA EMQNPQREMF ACFAEAMILE 
FEKCHTNFSW GRNNISLEKM EFIGAASLKH GFSAIGLDKQ PKVLTV