Gene P9303_07651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_07651
Symbol
ID	4776956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	704071
End bp	705234
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	54%
IMG OID	640086274
Product	Phage integrase family
Protein accession	YP_001016781
Protein GI	124022474
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.131913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCTGA GCAACGAGCT AATCAACATC AACCGTGCCC TGGCTGACAG CGGCATCAAC 
CTGAGAATTG AACAGCGAGG CCAGTGGCTC AATTTACGCG GAGCACTGCC CTGCCGGAAT 
GGAACTGGAT TGATCAAAAC TCAACGAATC AGTTTGCAGC TTTTGGCAGA ACAAAAAGGA 
TTGAAAGAGG CTGAGCGAAT TGTGCAACTG GTGCACTACC AACTGCAACG CAAACAATTC 
GACTGGTCCC AGTGGACGAC CAAATCGACA CGGAAACAAC CTGAACAGAT AGCGACTGGG 
CTCAGAGAAG CTTTGGTCAG CTTTGAAGAA GCATTCTTTA CTGATCCATA TCGCCGACGG 
TCACCAGCCG GTAGCCGCAG CACATGGACG TCCGCTTACC TTCCTTATTT ACGACGACTC 
AAAGCCCTAG CTGTTAACAA GCAGAGCTGT TTTGATTCAA ACCTTTTAAG AGACACTCTG 
GCCAGTTATG CAGATGGCAG CCGAAGCCGA CAGCAATGCG CCACGGCCCT AGGTGCATTG 
GCACGCCACC TGGAAATGGC GCTGCCGGAA GACTGGCGAG CAGAAGCAGA TGGATATGGA 
CTACATCAGG CGCGCTTTCG TCAACTACCC AGCGACAAGC AGATCATCGA GGCGGTGGAG 
CGCATCCCCA ACCCAGGATG GCGACTTGCC TATGGACTGA TGGCCACTTA CGGCCTGCGC 
AATCACGAGG TGTTCTTCTG CGACCTTGCT GCTTTAGCGA AGGGGGAAGA TCAGGTGCTG 
CGGGTCCTAC CAAACACAAA AACCGGCGAG CATCAGGTTT GGCCGTTTCA TCCAGACTGG 
GTCGAGCATT TTGAACTTGA ACAACTAGCA AACAATGCCC AGGCCCTGCC GCCGGTGAAT 
GTCGACCTGC GTCACACCAC ACTGCAACAG GTGGGGAGAA GAGTGTCGGA ACAATTCCGA 
CGCTATCAAC TGCCCCTCAC CCCCTACAAC CTGCGGCATG CCTGGGCGGT ACGCACAATC 
CACATCGGCC TTCCAGACAC CGTTGCAGCA AGAATGATGG GCCATTCAGT GGCTATTCAT 
ACCCGCACCT ATCACCACTG GATCACCCGA CGTGACCAAC AACAAGCGGT AGATGCAGCC 
CTAGCTCGAA AGCTCAGCCC ATGA

Protein sequence

MELSNELINI NRALADSGIN LRIEQRGQWL NLRGALPCRN GTGLIKTQRI SLQLLAEQKG 
LKEAERIVQL VHYQLQRKQF DWSQWTTKST RKQPEQIATG LREALVSFEE AFFTDPYRRR 
SPAGSRSTWT SAYLPYLRRL KALAVNKQSC FDSNLLRDTL ASYADGSRSR QQCATALGAL 
ARHLEMALPE DWRAEADGYG LHQARFRQLP SDKQIIEAVE RIPNPGWRLA YGLMATYGLR 
NHEVFFCDLA ALAKGEDQVL RVLPNTKTGE HQVWPFHPDW VEHFELEQLA NNAQALPPVN 
VDLRHTTLQQ VGRRVSEQFR RYQLPLTPYN LRHAWAVRTI HIGLPDTVAA RMMGHSVAIH 
TRTYHHWITR RDQQQAVDAA LARKLSP