Gene P9211_00841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00841
Symbol
ID	5731472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	89476
End bp	90573
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	39%
IMG OID	641284427
Product	hypothetical protein
Protein accession	YP_001549969
Protein GI	159902625
COG category	[S] Function unknown
COG ID	[COG3330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCCAAG ATAGAGAATC ACTGTCACGT CTAACCCTTC GTCAATTAAG ACTGAAAGCA 
AGTGATTTAG GCATACCTTT ATATAGTCGC AAGACCAAAT CAGTTCTTGC GAATGAAATC 
CTTTTGTATC AGGAAAGAAA GGAGTCGGAA AATCATTTAG TTGCTTCTAA TGCAGTTAAA 
GGTCCAAGAG GCTTAATTAA TAACTCTTTT TTCGCTTCCA AAACTTCAAC TAGGGTTGTT 
TTTCTTCCTA GAGATCCTGA ATGGGCTTAT GTTTTTTGGG AGATTTCTGA AACTGATCGA 
AAAAGTGCCC AGGAAAAAGG TGCAAGCAGA TTATGTTTGC GATTGGCTGA TGTGACAACA 
GTTAAAAAAG GAGCTGTTAA TCCAGGGACA CTGAGAGAGG TAATAGTGGA TAGTCATAGT 
ACAGAATGGT ATTTGCCTAT ACCTATTGGG GACAGAGATT ATCGAGTAGA GCTTGGCTAT 
CGTTTTGGTG CAGAATGGAT TTCGTTGGCA TTTTCTTCTA TTGCTCGTGT CCCTTCATTA 
CATCCAAGCG AGCAGATATT GGATCAGTTT GTCCCTTTTA GTTTAGAAGC TACTACTAGT 
AGTGATTTGA TAGAAAACAC TTCTGAAGCA ATCGAGAAAC AAGATAGTGG TTTACATGAG 
CGCTTATATC AAACAGCCAC AACTCATTTC GAGAAAACCA GAGTTGGTTC TGAAGAATTC 
CAGCAAGGTA ATAGATCTAG TCAAGAAGAA CTTAATGATT CTGGTTCAGG TCTTTGGGCG 
AGTGGTTTGA ATCAATCAGG GATTGGAGGA TTGCAACCTA GAGAAAGATC TTTTTGGTTA 
GTGGCCGATG CAGAATTGAT TGTTTATGGA TCCACAGATC CTTCTGCAAA ACTTACTATT 
GGCGGCGAAG AGGTGCCATT GGCTGCTGAT GGAACATTTC GTTTACAAGT ACCTTTTAGG 
GATGGATCTC AGAATTATTT GATACAAGCT GAGGATTCAA CTAGAACTCA AAAACGAAAT 
GTTGAAATGA AATTTGAACG CATTACTCCT GAAGATAATA CAAATCCAAT TGATCAAGCC 
AAGTCCGAAT GGTTCTAA

Protein sequence

MAQDRESLSR LTLRQLRLKA SDLGIPLYSR KTKSVLANEI LLYQERKESE NHLVASNAVK 
GPRGLINNSF FASKTSTRVV FLPRDPEWAY VFWEISETDR KSAQEKGASR LCLRLADVTT 
VKKGAVNPGT LREVIVDSHS TEWYLPIPIG DRDYRVELGY RFGAEWISLA FSSIARVPSL 
HPSEQILDQF VPFSLEATTS SDLIENTSEA IEKQDSGLHE RLYQTATTHF EKTRVGSEEF 
QQGNRSSQEE LNDSGSGLWA SGLNQSGIGG LQPRERSFWL VADAELIVYG STDPSAKLTI 
GGEEVPLAAD GTFRLQVPFR DGSQNYLIQA EDSTRTQKRN VEMKFERITP EDNTNPIDQA 
KSEWF