Gene P9301_01201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_01201
Symbol
ID	4911057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	117894
End bp	119048
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	29%
IMG OID	640159685
Product	hypothetical protein
Protein accession	YP_001090344
Protein GI	126695458
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAC CAATACATAA AGTTGAAGTC AAATTATCAA TTAAAGAAAT TTCCAAGGAG 
ATATGGAATG AATTAGCCAA TGGAATTAAT AATCCATTTT ATGAATGGAC TTGGATTAAA 
AACCTTGAGA TATCAAAAAG TGTTTCAAGA GAAACTGGTT GGCAGCCATT ATATTTTGTT 
GCTGTTAAAA ATGAAGAGAT ATTAGGTATT GCACCACTTT TTTTAAAAAA TCATAGCTAT 
GGAGAATTCA TTTTTGACCA ATCATTTGCA AGATTGGCTC AAGAGCTGAA TTTAAATTAT 
TACCCTAAAT TAATTGGAAT GAGTCCTTAT AGTCCTGTAA ATGGATATCA ATTTCTTTAT 
AAAAAAAATA AAGACAAGAA CGAAATTACA AATTTACTTA TAAACCACAT CGAAAGCTTT 
GCGATTAAAA ACAAAGTTCT AAGTTGTAAT TTTTTATATA TTGATGAAAG CTGGGGCAAC 
CATCTTAAAT CTTTGGGATA CCATGAATGG ATAAATTCCA GCAGTGAATG GAGGAGTAAT 
GGAGAAAAAA CATTTAATGA TTTTCTTTCT AGATTTAACT CTAATCAGAG AAAAAATATA 
AAAAAAGAGA GGAAATCAAT TACTAAACAA GATATTAAAG TAGAAATTTT TAATGAAGAT 
GATATCAACC AAGAAATACT CAAAAAAATG CATAATTTTT ATGAACAGCA TTGCTCGAGG 
TGGGGAGTTT GGGGAAGTAA ATATCTAACA TCTACATTTT TCGAAACACT GGTTGATAAT 
AAAAAAAATC TTTTACTTTT TAGCGCATCA AAACATGATT CAGATGAAAT TTTTGCTATG 
TCGATGTGCG TTAAAAATCA AAACAACTTA TGGGGTAGAT ATTGGGGTAG TCAAAAAGAA 
ATATCTAATT TACATTTTGA ATTATGCTAT TACCAGCCAA TTGAATGGGC AATAAAAAAT 
GGTATCCATT TGTTTGATCC TGGAGCGGGT GGCAAACATA AGAGACGTAG AGGATTTTTT 
GCAAAAAGCA CTATTAGCTT GCATAAGTGG TTTGACAAAA ATATGGAAAA TATAATTAGT 
CCTTGGCTAA ATGAAGTGAA TAAACAAACC GAGATGGAAA TTGATTTTGA AAATAAATCT 
ATACCCTTTA AATAA

Protein sequence

MNQPIHKVEV KLSIKEISKE IWNELANGIN NPFYEWTWIK NLEISKSVSR ETGWQPLYFV 
AVKNEEILGI APLFLKNHSY GEFIFDQSFA RLAQELNLNY YPKLIGMSPY SPVNGYQFLY 
KKNKDKNEIT NLLINHIESF AIKNKVLSCN FLYIDESWGN HLKSLGYHEW INSSSEWRSN 
GEKTFNDFLS RFNSNQRKNI KKERKSITKQ DIKVEIFNED DINQEILKKM HNFYEQHCSR 
WGVWGSKYLT STFFETLVDN KKNLLLFSAS KHDSDEIFAM SMCVKNQNNL WGRYWGSQKE 
ISNLHFELCY YQPIEWAIKN GIHLFDPGAG GKHKRRRGFF AKSTISLHKW FDKNMENIIS 
PWLNEVNKQT EMEIDFENKS IPFK