Gene P9303_00501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_00501
Symbol
ID	4778970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	50668
End bp	51813
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	55%
IMG OID	640085550
Product	SqdX
Protein accession	YP_001016072
Protein GI	124021765
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATCG CCTTTTTCAC AGAGACCTTC CTCCCAAAAG TGGATGGAAT CGTGACACGA 
CTCACCAAAA CGGTGCAGCA CCTGGTTGAA GCCGGTGATG AAGTGATGGT GTTCTGCCCG 
GAAGGCTGTC CTAGCGAATA CATGGGAGCC GAATTGATAG GAGTGCCAGC CATGCCACTG 
CCGCTCTATC CGGAACTGAA GCTTGCCCTG CCCAGACCAG CCGTTGCCGA AGCCCTAGAA 
ACCTTCGAGC CCGATCTCGT ACACGTTGTC AATCCAGCTG TACTAGGCCT TGGGGGAATT 
TGGCTAGCCA AAACCAACGG AATCCCTCTA ATCGCTAGCT ACCACACCCA CCTCCCGAAA 
TACCTAGAGC ATTACGGCAT GGGCATGCTG GAGCCCTTGC TCTGGGAACT TCTCAAGGCA 
GCCCACAATC AAGCAATACT CAATCTCTGC ACCTCAACAG CAATGGTGTC TGAATTGAGC 
GAGAAAGGGA TCCAAAACAC CGCCCTGTGG CAACGCGGCG TGGATACCGA ACTCTTTCGA 
CCGGAACTGC GCAACGAAAC CATGCGCTTA CGCCTTTTAA ACACAAACGA CGATCAAGGT 
GCCCTGCTTC TCTACGTAGG GCGGCTCTCC GCCGAAAAGC AAATCGAACG CATCAAACCT 
GTTCTAGATC GCATACCCGA GGCACGATTG GCCCTAGTAG GCGATGGACC TCACCGCCAG 
CAACTGGAAA AAGCATTTGA AGGCACTGCT ACAACATTTG TGGGCTATCT CGAAGGGGAA 
GAACTAGCCA GTGCATATGC AAGCGGGGAT GCCTTTCTAT TCCCCTCAAG CACCGAAACC 
CTTGGGCTCG TTTTACTGGA AGCAATGGCA GCAGGTTGTC CTGTAGTGGG AGCCAATCGT 
GGCGGAATTC CAGACATCAT TACCGACGGA GTCAACGGCT GTCTCTACGA GCCGGATGGA 
GTGGATGGAG GGTCCACCAG CCTCATCAAT GCGACCCGAC GACTGCTCGG CAACGATCTC 
GAGCGTCAAG GTCTGCGCAA AGCAGCCCGT CAAGAAGCCG AACGCTGGGG ATGGGCCAGT 
GCCACGCAAC AACTGCGGAG CTACTACAGA ACAATCCTCG GCCAACCCCT CAACCTGGCC 
GCCTGA

Protein sequence

MKIAFFTETF LPKVDGIVTR LTKTVQHLVE AGDEVMVFCP EGCPSEYMGA ELIGVPAMPL 
PLYPELKLAL PRPAVAEALE TFEPDLVHVV NPAVLGLGGI WLAKTNGIPL IASYHTHLPK 
YLEHYGMGML EPLLWELLKA AHNQAILNLC TSTAMVSELS EKGIQNTALW QRGVDTELFR 
PELRNETMRL RLLNTNDDQG ALLLYVGRLS AEKQIERIKP VLDRIPEARL ALVGDGPHRQ 
QLEKAFEGTA TTFVGYLEGE ELASAYASGD AFLFPSSTET LGLVLLEAMA AGCPVVGANR 
GGIPDIITDG VNGCLYEPDG VDGGSTSLIN ATRRLLGNDL ERQGLRKAAR QEAERWGWAS 
ATQQLRSYYR TILGQPLNLA A