Gene A9601_02951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02951
Symbol
ID	4716981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	272134
End bp	273138
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	36%
IMG OID	640077996
Product	putative oxidoreductase
Protein accession	YP_001008690
Protein GI	123967832
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCAA CCTCATCACC CGTAAAGGTT GGAGTCATAG GTATAGGAAA TATGGGATGG 
CATCATGCTC GAGTACTAAG TTTACTCAAA GATGCAAATC TCATTGGAGT CGCAGATCCA 
AATGAAGAGA GAGGCAAATT AGCTATTGAA CAATTTCAAT GTGAATGGTT CAAAGATTAT 
AAGGACCTAA TTCCAAAAGT TGATGCTATC TGTATCGCCG TCCCAACACT ACTTCATCAA 
AAAGTAGGAC TAGATTGTCT TAAGAGAGGA GCTAACGTTC TCATTGAAAA ACCAATTGCA 
GCTAACGAGT TGGAAGCAAA ATCTTTGATA GAGGCCGCTA ATGAGAGTAA CTGTCTATTA 
CAAGTTGGGC ATATTGAAAG ATTTAATCCT GCTTTCAGAG AATTAAATAA AATAGTAAAT 
AATGAAGAAA TTGTTGTTTT AGAAGCAAGG AGGCACAGTC CTCATGCAGA CAGAGCAAAT 
GATGTATCTG TCGTAATGGA TTTAATGATT CATGACATTG ATCTTATTTT GGAGCTTGTA 
AACTCAAAAA TACAAAAATT AGCAGCAGTT GGAGGAAGAA ATAGCGAAGG ATTAATAGAT 
TATGTCAATG CTACTTTAGT TTTTAAAAAT AATGTTATTG CAAGCCTAAC TGCAAGCAAA 
ATGAGTCACA AAAAAATTAG AAATTTAAGT GCTCACTGCC AAAATAGCCT AGTAGAAACT 
GATTTTTTAA ATCACTCTTT ACAAATCCAT CGAAAGTCTC ATGAATCATA CACAGCTGAG 
CATGGAGAAT TAGTTTATAG AAATGATGGA TATGTCGAAG AAGTTAGCAC AACCTCCATT 
GAACCTCTTT ATGCAGAACT GGAGCATTTT CTTAAGTGCG TTCAAGGTAA AGAGACACCT 
GAGGTAGATG GTGAGCAAGC CTCAAGAGCT TTGAAAATTG CTGATTTTAT AGAGCGTGCT 
GTAGAAAATT CTGGAGATGC AATTTTACTT GAAAATCCTT TCTAA

Protein sequence

MQPTSSPVKV GVIGIGNMGW HHARVLSLLK DANLIGVADP NEERGKLAIE QFQCEWFKDY 
KDLIPKVDAI CIAVPTLLHQ KVGLDCLKRG ANVLIEKPIA ANELEAKSLI EAANESNCLL 
QVGHIERFNP AFRELNKIVN NEEIVVLEAR RHSPHADRAN DVSVVMDLMI HDIDLILELV 
NSKIQKLAAV GGRNSEGLID YVNATLVFKN NVIASLTASK MSHKKIRNLS AHCQNSLVET 
DFLNHSLQIH RKSHESYTAE HGELVYRNDG YVEEVSTTSI EPLYAELEHF LKCVQGKETP 
EVDGEQASRA LKIADFIERA VENSGDAILL ENPF