Gene P9303_24941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_24941
Symbol
ID	4777176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2190860
End bp	2192143
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	54%
IMG OID	640088015
Product	hemolysin-like protein
Protein accession	YP_001018490
Protein GI	124024183
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTTGC TTTTCCTGGC TGTATTGCTG GTTCTACCGG CTTTTTTCGC GGCTGGAGAG 
GTTGCCTTGT TGCGGCTGCG GCCTAGTCGA GTACAGGTTT TAGTGGAAGA GCAGCAGCCC 
GGAGCTTCCG CCGTTCATCG TCTTCAGCGC CGTTTGAGGA GGGCGTTGAT GGTGTCTCAA 
CTGGGTGGAA TGCTGGCGTT GGTAGCCCTG GGCTGGGTTG GCCGTGGTGT TGGACATCGC 
TGGTGGCCTC TAGCTGATCC TGCTAGTCGC TGGTTGGACG GGGGGCTTTT TCTGCTGCTT 
GTGGTGTTGG CCACCTTGTT GGCTGGTTTT CTTCCTAAGG CCTGGGTGCT GAACCGTCCA 
GAGGCTTCAG CTCTAAACCT CGCTCCATTG TTGGAGATGG TGATGCGTGT GCTTGCTCCC 
CTTTTGGCTC TTCTGGAAGC TGTCGCTTCG ATGATGTTAC GGCTGGTTGG TTTGAATGCA 
CATTGGGATT CTCTTGTTCC TGCTCTCTCT GCTGGTGAGC TGGAGTCTCT GATCGAAATT 
GGCGGTGTAA CAGGCCTTCG TCCTGATGAG CGCAACATCC TTGAAGGTGT TTTTGCCTTG 
CGCGACACTC AAGTTAGAGA GGTGATGGTG CCACGTTCTG GCATGGTCAC CTTGCCTGTT 
GGGGTCTGCT TCGCTGAACT GATGAGAGTG GTGCATAGCA CCCGCCATGC GCGCTTTCCA 
GTGATCGGTC AGTCCCTAGA TGATGTCAGG GGTGTGCTTG ATTTACGTCG GTTGGCGGAA 
CCCATCTCCC GGGGTGCTTT GCAGGCAGAA TCTCCGCTTG AACCTTTTTT AGAACCAGCT 
GTAAGGGTTC TTGAGACCAG CACTTTGGCT GAATTGTTGC CGATGATCCG AAGTGGACAG 
CCCCTACTGC TTGTCGTTGA TGAGCATGGC GGTACAGAAG GATTGGTTAC AGCTGCCGAT 
CTCACTGGTG AGATCGTGGG CGATGAGCCC CATGCAGACG ACGATGAGCC GGATCTTGAG 
CTGATTGAGG GTCAGTCAGA CACATGGATG GTTGCAGGAG ATCTTGAGAT CATTGAGCTC 
AATCGACAGC TCAATCTGGA CTTGCCTGAA GCTGATGGAC ATCACACCTT GGCTGGCTTT 
CTGCTTGAAA AGTTGCAACA CATCCCTTCT GCTGGAGAGG CCTTGCGCTG CGATGGTTTG 
CAGTTCGAGA TCGTAACGAT GAAGGGTCCT CGTATCGAGC GTGTGCGACT GATTCTTCCC 
AGTCACGATC ACACTGAGGA ATGA

Protein sequence

MRLLFLAVLL VLPAFFAAGE VALLRLRPSR VQVLVEEQQP GASAVHRLQR RLRRALMVSQ 
LGGMLALVAL GWVGRGVGHR WWPLADPASR WLDGGLFLLL VVLATLLAGF LPKAWVLNRP 
EASALNLAPL LEMVMRVLAP LLALLEAVAS MMLRLVGLNA HWDSLVPALS AGELESLIEI 
GGVTGLRPDE RNILEGVFAL RDTQVREVMV PRSGMVTLPV GVCFAELMRV VHSTRHARFP 
VIGQSLDDVR GVLDLRRLAE PISRGALQAE SPLEPFLEPA VRVLETSTLA ELLPMIRSGQ 
PLLLVVDEHG GTEGLVTAAD LTGEIVGDEP HADDDEPDLE LIEGQSDTWM VAGDLEIIEL 
NRQLNLDLPE ADGHHTLAGF LLEKLQHIPS AGEALRCDGL QFEIVTMKGP RIERVRLILP 
SHDHTEE