Gene P9303_03471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_03471
Symbol
ID	4778108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	354184
End bp	355248
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	43%
IMG OID	640085850
Product	hypothetical protein
Protein accession	YP_001016364
Protein GI	124022057
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.604179
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTTT CATTCTTTCG CTCCTCTTTG GCGCTGATTG TTTCAGCATT CAGCATGACA 
GCTCTGACTT ACCTTGACTC TGAGAAGAAA GCACTGGCTG GTAATAATTG TCCTAAGGCA 
GCAATTGTTG CCGAGCTTGC GGAGGTAGAG AAGGCGACTC CCATCACAAA AGAAAACTAT 
GCTTTTGCGG AAACCGATAT CATTCTAGCG GAATATGTGA AGAAGATAGC CAAAAATAAC 
TGCTCCGAAG GCATAGGAGA ATTCATGCAT ATTAGAGATG CTATTGATAT TAACGATCGT 
ACAATCATTC GCCCGAATTT CGATACGCTG TATTCAGCAG CTGTGATTGA CCTCAATAGA 
CCGGCAGTCA TTGTGATGCC TGAAACAGAT AGGCTGCAAA TTTTAGCCGC GCTTGATGAG 
GAACATTGGA ATGTTCTTCT CGCAGATCAG CCTGGACGCT ACGAATTTAC AAAAGAGGCA 
GTGGGAGCTA GATACATTTT TTTGATTGTA CGCACACAGG TCAATATGAA TGACCCAGAT 
GACCTTCAGA AGGTTTCTGC TTTGCAAGAT CGAATTCAAA TTCAACAAAC TGATAAAGGA 
GAATATCTTC AGACCAAAAG ATGGGATCGT CGTGAGATTC TTGCATTGCG AGATGAGTAC 
AACGAACGCT GGAGCTCTGA GGGCATAAAA AGTGAGTTGG TGTTTGGGGG GAAAGGTGAG 
ATCTCCCCTG AGATGAGAAA TTTTGGCGTA GCCTTTGGAT GGGGTGGCCT TCCTAAAAAA 
GGAGCTGTCT ACCCTTCGCT GCAAGTGCCA GTTTCAACTG GTCCGCTGAC CTTAACTCTT 
AAGGATGTAC CAATCGCTGA TAACTCATTT TGGTCAGTCA CTATATACAA TCAGGAAGGC 
TTTTCTCGGG GAGAGCATTA TAATATCAAC AGCGCTTTTG CTAAAGCGAA TAAAAATGGA 
GAGTACGTTT TAAATTTCGG GACATCATTA GGGCAAGATA ACTATCTTGA GATTTATCCT 
GGCTGGAATG CAACACTTAG AATTTACTCT CCTCAGTCTG CGTAA

Protein sequence

MDFSFFRSSL ALIVSAFSMT ALTYLDSEKK ALAGNNCPKA AIVAELAEVE KATPITKENY 
AFAETDIILA EYVKKIAKNN CSEGIGEFMH IRDAIDINDR TIIRPNFDTL YSAAVIDLNR 
PAVIVMPETD RLQILAALDE EHWNVLLADQ PGRYEFTKEA VGARYIFLIV RTQVNMNDPD 
DLQKVSALQD RIQIQQTDKG EYLQTKRWDR REILALRDEY NERWSSEGIK SELVFGGKGE 
ISPEMRNFGV AFGWGGLPKK GAVYPSLQVP VSTGPLTLTL KDVPIADNSF WSVTIYNQEG 
FSRGEHYNIN SAFAKANKNG EYVLNFGTSL GQDNYLEIYP GWNATLRIYS PQSA