Gene P9211_13341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_13341
Symbol
ID	5730986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1200669
End bp	1202708
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	38%
IMG OID	641285705
Product	hypothetical protein
Protein accession	YP_001551219
Protein GI	159903875
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0846301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAACTCC CAATAGATCA TTTTCGTTTG CTCGGAGTTA GTCCATCTGC TGATGCAGAG 
GAGGTTCTTA GGTTCTTTCA GCTGAGATTA AATCGTATTC CGCATCCTGG ATTTACTCCT 
GAAGTTATTG CGCAGAGGTC TGAACTTTTA CGTCTTTCTG CTGATTTGCT TTGTGATAAA 
GATTTGAGGG AGGATTATGA GTCAGCTCTT TTAAATGGAG CCGTAGGGCT TGATCTTTCA 
TTTAATAGAG AAGTAGCAGG ACTCATTCTG CTTTGGGAAG GCGGAGTAGC GGATGAAGCT 
TTTAAGCTTG CAAGAAAAGC ACTTCAACCT CCTCAAACAC CAGCACTGGG AAGCGGCCGT 
GAGGCGGATT TGGCATTGAT AGGGGCCTTG GCTTGTAGAG ATGCTGCAAT ACAGGAGCAA 
GAACTAAGAC GTTACGCTTC GGCTGCGGAA CTCCTTGAGG AAGGTATTCA ATTGCTTCAA 
AGGATGGGGA AACTTCCTGA ACAGAGAAAG ATAATTGAAA GAGATTTAGA AGTGTTACTA 
CCTTATAGAA TCCTTGATTT GTTAAGCAGA GATTTATCTG ATGAGAAATC TCACGAAGAA 
GGATTGAATC TATTAGATAG TCTTGTCCTT AAGAGGGGAG GCTTGGAAGG GGATAATTTG 
TCGAATTCTT CTATTGAACT ATCACAGCGA GAGTTTGAAC TTTTCTTTCA GCAAATAAGG 
AATTTCCTAA CTGCGCAAGA GCAGATTGAC TTATTTCTCC ATTGGCAAAG GAGAGGATCT 
CCAGATGCTG GTTTTTTGGG TGCCCTGGCT TTGGTCGCAT CAGGCTTCCA TTGGCGGAAA 
CCTGAATTTT TGCAAAAAGC AAAGAAACAG TTGAAGGCAT TGAATCAGCA GGGCTTTGAT 
TCAATGCCTT TGCTTGGCTG TATAGATCTT TTGCTGGCGG ATGTTCAGCA GGCAGGCGTT 
CGTTTTAAAA GTAGTCCTGA TAAAGGATTA CAAGATTGGC TAAATGCATA TCCTGGAGAA 
GAATTGGCTG CTTTATGTCA TTACTGTAGA AATTGGCTGC TTAGAGACGT TCTACCAGGT 
TTCAGAGATA TTGAGATTGA CACTGTTGAT TTAGAGGCTT GGTTCGCAGA TAGGGATGTT 
CAAGAATATG TAGAGCAAAT AGAACGCAGA GGGGCTTTTG GGATTGCTCG AGCAGGGTTT 
TCTCTTTTTT CTGGACTGTC TTCAGATAAA ACAAATGATT CAATAAACTC CTTAGAGAAT 
GATTCGACTC TTTCTAATGT TGATGAAATT GAGAAGGATT CTGAAAAAAA CAACAAATAC 
CTAGGTTCTC CTGAAGAGGA GCTCAGTGAT GAGAAAACTT TCTTGGAAAA CTTAGTTCAA 
TTGTTGAAGT GGAGACCTTT TTATATAGAA ATAGCAAAAC CACGAATTAA AATTCCAGAA 
AATAACTTTT TTAAAGCAAC TTTAGCGTTG TTCCTATTAC TGTTTTCAGG AACATTTACT 
GCTTTGATTT TATATAGAAA TAATCCAACT GAAGATAATA TATCTGAAAG CTTTAAAGAG 
CCTTCTGAAA AAATTGTCAG TAAAAAAACA GATATTAATT TGAATATAAA GCAACAGGAT 
CAGACTAAAT TAGAAAAAAG ATACAACACT TTAACAAACA AATCACCATC AAAAGATGAA 
GTCCAACAAT TAATTGAGGC TTGGCTTTCT GGGAAGGCAG GTATCTTATC TGGGGTTAAC 
AATTTAGATT TATCAAATGT AGCAAGACCT TCTCTTGTGA AAATTGTTCT CGAGCAAAGG 
GAGAAAGATA TTGCTCTTGG AGAAAGACAG ATTATCTATG CAAATATTAA AAGTTTAGAG 
ATAGAGGAAC AAACTGAAAA GAGAATATCT GTAAAAGCAG TACTTAACTA TAAAGACCAA 
AGAGTTAATT CTTCTGATCA GATCATTTCC GAGACAACGA TTCCCTCATT AAAGCTAAAG 
TATGTTTTAG GAAGAGAAAA AAATATATGG CAGTTGCTTG ATTTTTCAAG TAGCACATAG

Protein sequence

MELPIDHFRL LGVSPSADAE EVLRFFQLRL NRIPHPGFTP EVIAQRSELL RLSADLLCDK 
DLREDYESAL LNGAVGLDLS FNREVAGLIL LWEGGVADEA FKLARKALQP PQTPALGSGR 
EADLALIGAL ACRDAAIQEQ ELRRYASAAE LLEEGIQLLQ RMGKLPEQRK IIERDLEVLL 
PYRILDLLSR DLSDEKSHEE GLNLLDSLVL KRGGLEGDNL SNSSIELSQR EFELFFQQIR 
NFLTAQEQID LFLHWQRRGS PDAGFLGALA LVASGFHWRK PEFLQKAKKQ LKALNQQGFD 
SMPLLGCIDL LLADVQQAGV RFKSSPDKGL QDWLNAYPGE ELAALCHYCR NWLLRDVLPG 
FRDIEIDTVD LEAWFADRDV QEYVEQIERR GAFGIARAGF SLFSGLSSDK TNDSINSLEN 
DSTLSNVDEI EKDSEKNNKY LGSPEEELSD EKTFLENLVQ LLKWRPFYIE IAKPRIKIPE 
NNFFKATLAL FLLLFSGTFT ALILYRNNPT EDNISESFKE PSEKIVSKKT DINLNIKQQD 
QTKLEKRYNT LTNKSPSKDE VQQLIEAWLS GKAGILSGVN NLDLSNVARP SLVKIVLEQR 
EKDIALGERQ IIYANIKSLE IEEQTEKRIS VKAVLNYKDQ RVNSSDQIIS ETTIPSLKLK 
YVLGREKNIW QLLDFSSST