Gene P9301_03531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_03531
Symbol
ID	4912463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	320549
End bp	321988
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	36%
IMG OID	640159924
Product	putative neutral invertase-like protein
Protein accession	YP_001090577
Protein GI	126695691
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGA GATTTAGTCA AAAAAATTTA AGAGTAAGAC CAAGTTCTGA TGAGGAGAAA 
ATTGTAACAA ATGCAAAAAA ACACTTCGAA AAGACTTTAG TTGAAATATC AGGTGAGTTA 
GTGGGAAGTG TTGCTGCACT GGAACACCCA ACAAAAAATA AAAAGTTAAA TTATGGAGAA 
ATATTTTTAA GAGATAATGT TCCTGTAATG ATTTATCTCA TTACACAAAA GCGTTATGAA 
ATTGTCAAAA AATTCCTCAG TTTATGTCTA GAGTTACAAA GCACTAATTA TCAAACACGT 
GGTGTATTTC CTACTAGTTT CGTTGAAGAA AATGGAAAGC TCATTGGAGA CTATGGTCAA 
AGGTCAATCG GGAGGATTAC TTCAGCAGAT GCAAGTTTAT GGTGGCCCAT TTTATGTTGG 
TATTATGTCA ATAAAAGCGG CGATTATGCC TTCGGAAAAA GTCAAAGTGT TCAAAGAGGT 
ATTCAACTTC TACTAGATCT AGTTCTACAT CCAACATTTG AGGGTACTCC AGTACTTTTT 
GTTCCAGATT GCGCATTTAT GATCGATAGA CCTATGGATG TATGGGGGGC ACCTTTAGAA 
GTTGAAGTTT TACTTCATGG ATGTTTAAAA AGTTGCATAA ACCTTATGGA ATTAAGTAGA 
GCAGATCATG TCAGTAGACT TTTAGACCAA AGACTAATTC TCACAAATCA ATGGGTTAAA 
GATTTAGGAG GTTTTCTTTT AAAGCATTAT TGGGTTACCA GCCAAACAAT GCAAATTTTA 
AGAAGAAGGC CAACTGAGCA GTATGGAGAT GATCAACACT TCAATGAATT TAACGTTCAA 
CCTCAAGTAG TTCCATCATG GCTACAAGAT TGGTTAGAGA ATAGAGGTGG CTACTTAATA 
GGAAATATTA GGACAGGAAG ACCTGACTTT CGATTTTACA GTTTAGGTAA TTCTCTAGCA 
TGTATGTTCG GAGTACTGCC TCCCGAGGAA CAAAGAGCTT TATTTAGATT AGTTTTGCAT 
AACAGACAGC ATTTGATGGC TCAAATGCCC ATGAGAATTT GTCATCCTCA TATGGATGTT 
GAAGAATGGC AAAATAAAAC CGGATCGGAT CCAAAGAATT GGCCTTGGAG TTACCATAAT 
GGTGGTCATT GGCCAAGTTT ACTTTGGTTT TTTGGTGCAG CCGTTCTATT GCATCAAAAA 
AATTACGGTT CTGATGATGT GATTCTCATG GAAGAGATGA AATCTTTAAT AGAAGAATCC 
TACTGGTGTC AACTTAATCA ATTGCCTAAG CAAGAATGGG CAGAATATTT TGATGGGCCT 
ACAGGAACTT GGGTTGGACA ACAATCAAGA ACTTATCAAA CCTGGACAAT AGTTGGATTT 
TTATTAATGA ATCATTTTTT AAGGAATGAT TATAACGATC TGGATATGTT TAAGATTTAA

Protein sequence

MAERFSQKNL RVRPSSDEEK IVTNAKKHFE KTLVEISGEL VGSVAALEHP TKNKKLNYGE 
IFLRDNVPVM IYLITQKRYE IVKKFLSLCL ELQSTNYQTR GVFPTSFVEE NGKLIGDYGQ 
RSIGRITSAD ASLWWPILCW YYVNKSGDYA FGKSQSVQRG IQLLLDLVLH PTFEGTPVLF 
VPDCAFMIDR PMDVWGAPLE VEVLLHGCLK SCINLMELSR ADHVSRLLDQ RLILTNQWVK 
DLGGFLLKHY WVTSQTMQIL RRRPTEQYGD DQHFNEFNVQ PQVVPSWLQD WLENRGGYLI 
GNIRTGRPDF RFYSLGNSLA CMFGVLPPEE QRALFRLVLH NRQHLMAQMP MRICHPHMDV 
EEWQNKTGSD PKNWPWSYHN GGHWPSLLWF FGAAVLLHQK NYGSDDVILM EEMKSLIEES 
YWCQLNQLPK QEWAEYFDGP TGTWVGQQSR TYQTWTIVGF LLMNHFLRND YNDLDMFKI