Gene P9303_21931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_21931
Symbol
ID	4777826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1950855
End bp	1952018
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	39%
IMG OID	640087708
Product	hypothetical protein
Protein accession	YP_001018193
Protein GI	124023886
COG category	[R] General function prediction only
COG ID	[COG0457] FOG: TPR repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAC CACTTAGTCT AATAATTACA GCGTCTGCTG TTGTTATTAG TCCATTGTCT 
GCTGTAGCTG AGATTGATCC TGAACTTCAT AAGCTGTGTA TAGATGCCAA AGATTACAAA 
GGATGTATCG AGGCAAGAAC AGAACCATCG CCTGAGATTG AGTCAAATGA AAATGAAGTT 
GAAGTATCGG CACCTTCAAC CTACAACTAT GAAAAAGATT CAGTAAGGCA GCTAAAGATT 
AGAGGTAAGT ATGGAAGGTA CTTAACCTTT ATAGGTCGAA CACCAAACAC CTATAGCGGG 
ACTAGCGGTT CATATAGTCC AGGTAGTGGT GGGACCTTAA ATTGTTCTAC TTACGGTTCC 
TCTACTTATG CTACAACTAA TTGCTACCGC ACTGGTTATG TAGCACCTTC TTATACACCA 
GCCAGACCAG GTGGTACACA ACATCAAAGG TTCAGGTATG AACTTGATTG CCAAGATCAA 
ACATATAATA TTAAAGGTGA CTTAAAGTCA GCCGGAGGGT TTAAGAAGGG TTGGATGCAT 
GTGAGTAATG ATCCTGTCGC TAGTGCTGTA GCTAGAAAAT ACTGTCCTGT TATTGATACG 
TTGGCTGTTG CTGGATATGT AAACAAGGGG GATGTTTTTG AGTCAGGATC CATACTATGG 
AAGGATCGTT GGGGTCCAGA ACCAAAAGCA TCTATTAGCG AAGAAAAATA TTATTTATTC 
AAAACGTATG TAAAAAATAA ACAATACAAG GAGGCGTTAA AACTATCAAA TAAATTGGTC 
ATTGATTTTC CTGATGATCC ACGCTCATGG ACTCATCTAG GCGTTGCATA TTTTATTTTA 
AAGGATTATT CTGCTGCAAA GGAACAATTA AACAAGGCAA TATTTATCAA CCCGCTGTTT 
GAAGATGCCT ACTATAATCG AGGCCTAGTT TATTCAGCCT TAGGTTTATA CGATCAAGCA 
ATCCGTGATT ACACTAAAGC TATTCGTATG TACCCAGATA GAATGCACTT TTGGGTGAAT 
AGGTCTACTG CTTATTGGAG AAAAGGAGAC AAGCAGAAAT CTTGTAGTGA TTCTCGTAAG 
TTAATTCAAT TAGGACTCCA GAATCCAGAG TGGCAAAAAT GGTGGCAAAA GTTTGGCAAA 
AAAGAATGCA AGAAATACAA GTAA

Protein sequence

MIKPLSLIIT ASAVVISPLS AVAEIDPELH KLCIDAKDYK GCIEARTEPS PEIESNENEV 
EVSAPSTYNY EKDSVRQLKI RGKYGRYLTF IGRTPNTYSG TSGSYSPGSG GTLNCSTYGS 
STYATTNCYR TGYVAPSYTP ARPGGTQHQR FRYELDCQDQ TYNIKGDLKS AGGFKKGWMH 
VSNDPVASAV ARKYCPVIDT LAVAGYVNKG DVFESGSILW KDRWGPEPKA SISEEKYYLF 
KTYVKNKQYK EALKLSNKLV IDFPDDPRSW THLGVAYFIL KDYSAAKEQL NKAIFINPLF 
EDAYYNRGLV YSALGLYDQA IRDYTKAIRM YPDRMHFWVN RSTAYWRKGD KQKSCSDSRK 
LIQLGLQNPE WQKWWQKFGK KECKKYK