Gene A9601_14101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_14101
Symbol
ID	4718131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1182007
End bp	1183119
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	33%
IMG OID	640079131
Product	hypothetical protein
Protein accession	YP_001009801
Protein GI	123968943
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGCGA AATTCAAACC TATCACTAAT AGAAAAATTA AAGTTGGAAT AGTTGGTTGC 
GGTCGAATTT TTAAAAAGCA TCTTGAGGCA ATTACAAATA ATTTTGAAAG AATAGAATTA 
GTTGCAATTT GCGATGAAAA TAATGATTCT TTAGAAAAAG CTAATGAATT TATTAAAGAT 
GTTTGTTCAA AAATAAAAAA TTTTTCAAAT AATCCCAAAA GGTTTTTTTC CTATAAAATA 
TTGTTGGATT ATTGCTCTCA AAATCCTAAT TTCATTGATT TAATTGTATT AGCAACACCA 
AGTGGTTTGC ATCCAAGTCA AGTAATTAGT GCTGCTAAAT GTGGTCTAAA TGTTATGACT 
GAGAAGCCAA TGGCTACGAA ATGGGCTGAC GGGCTATCTA TGGTTAAAGC CTGCGATGAT 
GCTGGTGTAA GATTATATGT CATAAAGCAA AACAGATTTA ATAGAACTCT TCAGTTACTT 
AAAAAGCAAA TTGTAAATGG TAGGTTTGGA AGAATAGCAA TGGTAACTTC TAATGTTTTT 
TGGCAAAGAC CTCAATCTTA TTACGATCAA GATTCGTGGC GAGGTACCTG GGAGTTTGAT 
GGTGGTGCTT TAATGAATCA AGCTAGCCAT TATGTTGATT TAATGGAATG GTTGGTTGGC 
CCAATTGCAT CGGTTAATGC TTCAATTGCA ACTGTTGGAC GCAATATTGA AGTTGAGGAT 
ACAGCAACTT TAAATTTGAG ATGGCGAAAT GGTGCGCTAG GTTCTATGTC TGTTACCATG 
CTTACTTATC CTAAAAATTT AGAGGGCTCA ATAATTGTGT TGGGTGAAAA TGGTTCAGTA 
AAGGTAGGGG GTGAAGCTGT CAATAAAATA GAATTTTGGG AATTCAAAGA CAATCATCCT 
GATGATAAAA ATGTTGAAAT TAACAACTAT GAAGTTAAAA GTGTTTATGG CTCAGGACAT 
TCATTATTTT ATTCAAATAT TCTTGATCAT TTTCAAGGAA AAAATGTTGA TGTTTGTGAT 
GGAAGAGAAG GTTTAAAAAG CCTTGAATTA TTAATAGGAG CTTATAGGTC TGCTAGAGAT 
GGTAAGAATA TTTATTTGCC CTTAGACTAC TGA

Protein sequence

MYAKFKPITN RKIKVGIVGC GRIFKKHLEA ITNNFERIEL VAICDENNDS LEKANEFIKD 
VCSKIKNFSN NPKRFFSYKI LLDYCSQNPN FIDLIVLATP SGLHPSQVIS AAKCGLNVMT 
EKPMATKWAD GLSMVKACDD AGVRLYVIKQ NRFNRTLQLL KKQIVNGRFG RIAMVTSNVF 
WQRPQSYYDQ DSWRGTWEFD GGALMNQASH YVDLMEWLVG PIASVNASIA TVGRNIEVED 
TATLNLRWRN GALGSMSVTM LTYPKNLEGS IIVLGENGSV KVGGEAVNKI EFWEFKDNHP 
DDKNVEINNY EVKSVYGSGH SLFYSNILDH FQGKNVDVCD GREGLKSLEL LIGAYRSARD 
GKNIYLPLDY