Gene P9303_03251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_03251
Symbol
ID	4777989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	335857
End bp	336966
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	56%
IMG OID	640085828
Product	hypothetical protein
Protein accession	YP_001016343
Protein GI	124022036
COG category	[S] Function unknown
COG ID	[COG1873] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACGACAA ACCCATCCCC GAACGATCCA CTGGACAAGG TTCCTAGCGA CCGCCTCTGG 
CTGCGCTCCG AGCTCATGGG GACCCACGTG ATCACCCGTG ATACCGGACG TCGTCTCGGC 
GTCGTGGGAG AAGTCGTGGT CGACATTGAT CGCCGCGAAG TGGTGGCCCT AGGCCTGCGA 
GACAATCCCC TCACGCGTTA CCTGCCCGGC CTCCCACGTT GGATGCCACT TGATCGGATC 
CGTCAGGTGG GGGACGTCAT CCTCGTGGAT TCCTCTGACT CACTCAAAGA GGGTTTCACC 
CCAGATCGCT ACAGCCGAGT GATCAACTGC CAAGTGATCA CAGAATCTGG CCAGCAACTA 
GGCAGAGTCC TGGGCTTCTC CTTCGACATC GAAACAGGGG AACTCACAAC CCTGGTGATT 
GGAGCAATCG GTGTGCCCTT ATTGGGCGAA GGGGTCTTGA GTACCTGGGA GATGCCTGTA 
GACGAGGTGG TCAGCAGCGG CGCAGACAGG ATCATTGTGT ATGAAGGAGC AGAAGAGAAG 
CTCAAACAAC TGAATAGCGG CTTCCTCGAA AAACTCGGAG TCGGCGGCCC CAGCTGGGAA 
GAACAGGAGC GAGAGCGCTA CAGGATGAAT CTTGTGCCAG TGGAAAACCA GCTCAATTCA 
GGACAGCCAA CTGAACAGGA GCAGCGCCGG CTCCAACCTT CCACCACTCA AACCTTTGAG 
CCGGAAGAGG AACTTGAATA CGTTGAACTG GAAGAGCGTC AACAGGAAGT CATCCCCCAA 
CAGCGCTATC TCGACGAAAC ACCCTCAAGC TCCCCAACGC GCTACCGCAA TGACAGAGAA 
GAAAGAATGA CCTTCGAAGA ACCTCCTGCC TATGAACAAA GGCCAGTCTT CGAAGAATCA 
GCTGCCTATG AACAAAGACG AACCTTTGAA GATCAACAAC CCCAAAGACC AAGGCCAGCT 
TCACGTCGAC CTGTTCAGAG CCTTGGTGAT CCTCTTGATG TGGAGCCCCT CGACTTTTCA 
GGACGTGATC AAGCTGGCCG AGACCGAGAT GCAGAGGTGG AGGAGCCCCC ACCGCGCCGT 
AATGGCACCG AACTGGACGA CCCTTGGTGA

Protein sequence

MTTNPSPNDP LDKVPSDRLW LRSELMGTHV ITRDTGRRLG VVGEVVVDID RREVVALGLR 
DNPLTRYLPG LPRWMPLDRI RQVGDVILVD SSDSLKEGFT PDRYSRVINC QVITESGQQL 
GRVLGFSFDI ETGELTTLVI GAIGVPLLGE GVLSTWEMPV DEVVSSGADR IIVYEGAEEK 
LKQLNSGFLE KLGVGGPSWE EQERERYRMN LVPVENQLNS GQPTEQEQRR LQPSTTQTFE 
PEEELEYVEL EERQQEVIPQ QRYLDETPSS SPTRYRNDRE ERMTFEEPPA YEQRPVFEES 
AAYEQRRTFE DQQPQRPRPA SRRPVQSLGD PLDVEPLDFS GRDQAGRDRD AEVEEPPPRR 
NGTELDDPW