Gene P9303_03421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_03421
Symbol
ID	4777514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	350160
End bp	351416
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	57%
IMG OID	640085845
Product	hypothetical protein
Protein accession	YP_001016359
Protein GI	124022052
COG category	[S] Function unknown
COG ID	[COG4995] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.634587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGCA GCATGTTGAA AGCCCTCTCG CTCACCGTTG CTGTGGGAAC AGCCCTGCTC 
ATGAGTGGAG GCCCCAGCCA CAGCCAAACA TCACCTGAGC TCACCAAAAA GGTGCTGCAG 
ATGGAGCGCG ATCGAGAACA AGAATTTGAA AACTACTTCG GTGAAGACCT GGCATCCGTC 
AGCAAAACGG CTGATGAAAC TGCCGCCGAA CTCGAACGGC TGAGTGCAGA AACCGGAACA 
CGCTCAGCGC TGCTGTATGT GATTCCGCGG AAAAGCCACC TGCACCTGGT GCTGATTCCG 
CCCAGTGGCA CTCCGATCGT CAAAGACTTC TATGAAGTCA CCGACCCCGA GCTGTTCGCG 
GTCTCGCGCC GCTTTCACAA GGGCATCCTG CGGATGGATA CAACCCAAAG TCAAAGCGCA 
GGCCAGCAGT TGTACGACTG GATCATCAAG CCGTATGAGC AGGAGCTGGC GGATGCAGAG 
ATTGACCTAC TTCTGTTCTG CCTGGGTGAT GGCGTGAAGG ATCTGGCTTT GCCAGCCCTG 
TTCAACAACG GCTCCTACCT GATCGAGAGC TATGCGATGG CGCGGATCCC CGCGTTCAAC 
CTGATCGAGA CGACCTACAA ACCCTTTAAA AGCGGTCAGC TGTTGGCCAT GGGAGCCAGC 
CAGTTTCAAG ATCCATCGAT TCCAACCTTG CCAGGCACAG CACAAGAAAT CGCAGCCCTC 
AGCCAAAGCC TTGGGTCTGC AGGGCAAAGC ACATGGGGGG TAACACGGTT GGAGAACAGG 
GCCTTCACGC AGAAGCGGAT CAACCAGAAC CTCTCCAAGA AGCCTTACAC CACGCTGCAC 
GTGAGCACCC ATGCCCAGTT TCAGCCTGGC CAGGTGGAGG AGTCCTACAT CCAACTCTGG 
GATCAGAAGC TGAAGCTGAA CGCTCTCAAT GCAATCGACT GGGACCAGTC CAAGGCAGAT 
CTGATCGTGC TCAGCGCCTG TCAGACCGCT CTGGGAGACA CCGATGCCGC CAATGGATTT 
GCCGGACTCG CGCTCAAAGC CGGGGTGCCC TCAGCCATCG GCACCCTTTG GTCGGTCAAC 
GATCAATCGA CCACGGAGTT GATGACATCG TTCTACGGCG CACTGCCGGA CAGCCGCACC 
AAAGCTCAGG CCCTGCAAAC GGCACAGATC ACTGCGATCC GACAACCATC GTCGTCAACG 
TCGAGCGCTG CTCCCTACTA CTGGGCTGGC TTCAGCCTGA TCAGCACACC TTGGTGA

Protein sequence

MMRSMLKALS LTVAVGTALL MSGGPSHSQT SPELTKKVLQ MERDREQEFE NYFGEDLASV 
SKTADETAAE LERLSAETGT RSALLYVIPR KSHLHLVLIP PSGTPIVKDF YEVTDPELFA 
VSRRFHKGIL RMDTTQSQSA GQQLYDWIIK PYEQELADAE IDLLLFCLGD GVKDLALPAL 
FNNGSYLIES YAMARIPAFN LIETTYKPFK SGQLLAMGAS QFQDPSIPTL PGTAQEIAAL 
SQSLGSAGQS TWGVTRLENR AFTQKRINQN LSKKPYTTLH VSTHAQFQPG QVEESYIQLW 
DQKLKLNALN AIDWDQSKAD LIVLSACQTA LGDTDAANGF AGLALKAGVP SAIGTLWSVN 
DQSTTELMTS FYGALPDSRT KAQALQTAQI TAIRQPSSST SSAAPYYWAG FSLISTPW