Gene P9211_01791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_01791
Symbol
ID	5730920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	172009
End bp	173613
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	34%
IMG OID	641284523
Product	hypothetical protein
Protein accession	YP_001550064
Protein GI	159902720
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.806064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAC GCACCTTCCT AATTGCATTA AGTGTCACAA TAGGGTTATT GCTCATCATC 
TCTTTTGGTA TTTGGAGGGG CGCTGCAGCT CAAAGCCCAT TAAACCTAAA AAATGAACCA 
ATAACACTAC CCTCAACAGC AAAGTTTTTT CCTAAAGAAG CACTTTTAAC AATTCATTTA 
AAACTTGATG TAAATCGTTT CCCTAGATAT ATCGAGGCTG TTGTTCCTGA GAAGAAAAGA 
AATAAAGCAC GAAGTGAAAC TGTAAAGATA AGAAATGGTT TCTTTGCACT TGCAGGCCTA 
GACTTTGAAA GGGACTTATC GTCATGGGTT AATCCTAAAT TTAGTTTATC AATTATTAAA 
GTTAATGGAG AGCAAGAACA TTTTGGCTGG CTATTAGCTA TTCAAGGTGA TGACAAAGAA 
GGTCCTTCAT CATTTATGAA AAGTTTTTGG GATAAAAAAG TTTTAGATGG GGAAGATGTG 
TTGCAAGAAA ATTACAATAA TTTTGAGATT TATTCTTATA ACGACCCTTT ATTTCCTAAA 
AAGAGAAAAG AGATCTCAAC TACAATTGTA GAAGATAAAG TGGTTTTAGC TTCATCGGAA 
AAGGTAATCC TGAAAAAAGC AATAGATACT TCAAAAGATC CACAATTAAG TCAACTAAAT 
GATCAAGAGC TTATTCAATC AATTGAAAAA ATGAATACTG GCATAGGTCT CATTAATGCT 
TCTGAAGAAG CACTTGAAAC CTTGCTTGAT TTACCAAAAT CTCTGACTCA GAAAAATTCC 
TTAGAAAGGC TTGTAGCGTC AATTAAGGCT GAAGGTCCTG AATTATTATT AGATGGGTTA 
TTTAAATTTA AAGAGAGCGG AACGGAGATT AAAAGTCAAA GAGAATCTGC AATAAGCTTA 
GTCAATGGTT CAGGAGGACC TATTCAAGAT ATAGCTATCT TAAGTGAACC CTTTAAATTA 
ATAGATAGTG CTAGTGAAGA CCCAGAAGCA AAGTTATTAG GCCCTATATT AAGGCAATAC 
ATCAATGATC TAGATTCTAC TGCTATAAAT AGAATAACTA ATTCTGAAAA AGGTCCATTA 
GTCTGGATTA ATGAGGATGC TGGATGGATT ATAGGGACTA AAGACAATTC TCAGGATTTA 
GAAATAGATA AATCTCTAAG AAGTAATGGA TTCTCTAAAA GTTCACTTGC TTTAAAGGAA 
AAGAAAATAG ATGTCTGGTC AAAACTAGCA ATAAATAAAT CTGGTAAATA TGACAATATA 
ATCAATAATG TTGAAATAAT ATTGTCTCAA GAGAATGAAA GTAATTGGTG GGGTAACAAT 
ATTGCCGCTT TAGAACAAAG GCTGCAAGTT AATTCATTAA CGAATAACAA TAAAAGATTT 
CAGAACTTGA TTTCTAATGA CGGAAATTAC TTTGATCAGC AAGTTTTTCT AGGTCCTACT 
TCATCCCAAA AAATACTTAG CGACTGGAAA CCTTGGAAGC TTCTCCAGGC AGTAATAGGT 
CACTCACTCA AGCAAAATAT TAAAAGCATA GCCATCTCTA TAGGGGCATC AAAAGATGAC 
ATAGAACAGA CAATTAATTT TCATGCAAAG CTTTTACTAG GTTGA

Protein sequence

MKARTFLIAL SVTIGLLLII SFGIWRGAAA QSPLNLKNEP ITLPSTAKFF PKEALLTIHL 
KLDVNRFPRY IEAVVPEKKR NKARSETVKI RNGFFALAGL DFERDLSSWV NPKFSLSIIK 
VNGEQEHFGW LLAIQGDDKE GPSSFMKSFW DKKVLDGEDV LQENYNNFEI YSYNDPLFPK 
KRKEISTTIV EDKVVLASSE KVILKKAIDT SKDPQLSQLN DQELIQSIEK MNTGIGLINA 
SEEALETLLD LPKSLTQKNS LERLVASIKA EGPELLLDGL FKFKESGTEI KSQRESAISL 
VNGSGGPIQD IAILSEPFKL IDSASEDPEA KLLGPILRQY INDLDSTAIN RITNSEKGPL 
VWINEDAGWI IGTKDNSQDL EIDKSLRSNG FSKSSLALKE KKIDVWSKLA INKSGKYDNI 
INNVEIILSQ ENESNWWGNN IAALEQRLQV NSLTNNNKRF QNLISNDGNY FDQQVFLGPT 
SSQKILSDWK PWKLLQAVIG HSLKQNIKSI AISIGASKDD IEQTINFHAK LLLG