Gene A9601_03511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_03511
Symbol
ID	4717040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	320956
End bp	322395
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	36%
IMG OID	640078055
Product	putative neutral invertase-like protein
Protein accession	YP_001008746
Protein GI	123967888
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.268956
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAAA GATTTAGTCA AAAAAATTTA AGAGTAAGAC CAAGTTCTGA TGAGGAAAAA 
ATTGTAACAA ATGCAAAAAA ACACTTCGAG AAGACTTTGG TTGAGATATC AGGCGAGTTA 
GTGGGAAGCG TCGCTGCACT AGAACATCCA ACAAAAAATA AAAAATTAAA TTATGGAGAA 
ATATTTTTAA GAGACAATGT TCCTGTAATG ATTTATCTCA TTACCCAAAA ACGTTACGAA 
ATTGTCAAAA AGTTCCTAAG TGTATGCCTT GAGTTACAAA GCTCTAACTA CCAAACACGT 
GGCGTATTTC CTACTAGTTT CGTTGAAGAA AATGGACAGC TCATTGGAGA CTATGGTCAG 
AGATCAATAG GGAGGATTAC TTCAGCTGAT GCAAGTTTAT GGTGGCCCAT TTTATGTTGG 
TATTATGTCA ATAAAAGCGG TGATTATGCC TTTGGAAAAA GTCAAAGCGT TCAAAGAGGT 
ATTCAACTTC TACTAGATCT AGTTCTACAT CCAACATTTG AGGGTACTCC AGTACTTTTT 
GTGCCAGATT GCGCATTTAT GATTGATAGA CCTATGGATG TATGGGGAGC ACCACTAGAA 
GTTGAAGTTT TACTTCATGG ATGTTTAAAA AGTTGCATTA ACTTAATGGA ATTAAGTAGA 
GCAGATCATG TTAGTAGACT TTTAGATCAA AGACTTATTC TTACAAATCA ATGGGTTAAG 
GATTTAGGAA GTTTTCTTTT AAAGCATTAT TGGGTTACAA GCCAAACAAT GCAAATTTTA 
AGAAGAAGGC CAACTGAGCA GTATGGTGAT GATCAGCACT TCAATGAATT TAATGTTCAA 
CCTCAAGTGG TTCCCTCATG GCTACAAGAT TGGTTAGAGA ATAGAGGCGG TTACTTAATA 
GGAAATATTA GGACAGGAAG GCCTGACTTT CGATTTTACA GTTTAGGCAA TTCTTTAGCA 
TGTATGTTCG GAGTTCTTCC TCCTGAAGAA CAAAGAGCTT TATTTAGATT AGTTTTACAT 
AACAGACAGC ATTTGATGGC TCAAATGCCT ATGAGAATTT GTCATCCTCA TATGGATGTA 
GAGGAATGGC AAAATAAAAC TGGATCCGAT CCAAAGAATT GGCCTTGGAG TTACCATAAC 
GGTGGTCATT GGCCAAGCTT ACTTTGGTTT TTTGGTACAG CTGTCCTATT ACATCAAAAA 
CATTATGGTT CAGACGATGT GATCCTCATG GAAGAAATGA AATCTTTAAT AGAGGAATCA 
TATTGGTGTC AACTTAATCA ATTGCCTAAG CAAGAATGGG CAGAATATTT TGATGGTCCT 
ACAGGAACTT GGGTTGGACA ACAATCAAGA ACATATCAGA CTTGGACAAT TGTTGGATTT 
TTATTAATGA ATCACTTTCT AAGGAATGAG TATAACGATT TAGATATGTT TAAGATTTGA

Protein sequence

MAERFSQKNL RVRPSSDEEK IVTNAKKHFE KTLVEISGEL VGSVAALEHP TKNKKLNYGE 
IFLRDNVPVM IYLITQKRYE IVKKFLSVCL ELQSSNYQTR GVFPTSFVEE NGQLIGDYGQ 
RSIGRITSAD ASLWWPILCW YYVNKSGDYA FGKSQSVQRG IQLLLDLVLH PTFEGTPVLF 
VPDCAFMIDR PMDVWGAPLE VEVLLHGCLK SCINLMELSR ADHVSRLLDQ RLILTNQWVK 
DLGSFLLKHY WVTSQTMQIL RRRPTEQYGD DQHFNEFNVQ PQVVPSWLQD WLENRGGYLI 
GNIRTGRPDF RFYSLGNSLA CMFGVLPPEE QRALFRLVLH NRQHLMAQMP MRICHPHMDV 
EEWQNKTGSD PKNWPWSYHN GGHWPSLLWF FGTAVLLHQK HYGSDDVILM EEMKSLIEES 
YWCQLNQLPK QEWAEYFDGP TGTWVGQQSR TYQTWTIVGF LLMNHFLRNE YNDLDMFKI