Gene P9211_17931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_17931
Symbol
ID	5730831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	1620978
End bp	1622126
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	41%
IMG OID	641286179
Product	SqdX
Protein accession	YP_001551678
Protein GI	159904334
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.335649
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATTG CTTTTTTTAC TGAAACTTTT CTTCCTAAGG TTGATGGAAT AGTGACTCGG 
CTAACGAAAA CACTTGAACA TCTTTCCAAA GCAGGGGATG AAGTAATAGT TTTTTGCCCT 
GAAGGATGTC CTGATGAATA CATGGGAGCC AAAATGATTG GTGTCCCTGC AATGCCCTTA 
CCTCTTTACC CAGAACTAAA ACTTGGTCTT CCTGGCCCTG CAGTATCTGA AGCTCTTGAA 
AACTTAAAGC CTGATTTAAT ACATGTAGTT AATCCAGCCG TTCTGGGGTT AGGAGGTATT 
TGGCTTGCAA AGAGTAATAA CATCCCGCTC GTAGCGAGTT ATCACACACA TCTTCCTAAA 
TACCTTGAAC ACTATGGAAT GGGGATGCTT GAGCCACTTC TTTGGGAATT ACTAAAAGCC 
GCACATAATC AGGCAATTTT AAATCTTTGT ACCTCAACAG CAATGGTGAA GGAGCTGAGT 
GATAAAGGAA TTCAAAATAC AGCCTTATGG CAAAGAGGAG TCGACACAGA AACCTTCAAC 
CCAGAATTAA GAAGTGATGA AATGCGCCAA AAATTACTCG GAAAACATAG TGATACTGGT 
GAATTACTAA TCTATGTCGG AAGATTGTCA GCAGAGAAGC AAATCGAACG CATAAAACCT 
GTTTTAGAAG CTTTGCCCAA TACCCGTTTG GCATTGGTTG GAGATGGCCC CTACAGACAA 
CAATTAGAGA AAATATTTGA AAACACTGCT ACAACATTCG TTGGTTACCT TTCGGGAAAA 
GAGTTAGCTG GAGCCTATGC ATCAGGAGAT GCATTTTTAT TTCCTTCCAG TACAGAAACC 
CTAGGCTTAG TACTCCTTGA AGCAATGGCT GCAGGATGCC CTGTAGTCGG AGCGAACAAA 
GGGGGTATTC CAGATATTAT TAATGATGGT CAAAATGGCT GTTTATATGA TCCTGATGGG 
GCGAATGGAG GGGCCACAAG CCTTATAAAC GCAACTAAGA AATTACTAGG TAATGAAATT 
GAAAGACAAT CAATGAGAAA TGCAGCGAGA ATAGAAGCAG AAAAATGGGG TTGGTCTAGC 
GCAACTACTC AACTAAGAGA TTTTTATCGA GCAATTCTTG AAAAACAATC CAACAAAATA 
GCCGCTTAA

Protein sequence

MKIAFFTETF LPKVDGIVTR LTKTLEHLSK AGDEVIVFCP EGCPDEYMGA KMIGVPAMPL 
PLYPELKLGL PGPAVSEALE NLKPDLIHVV NPAVLGLGGI WLAKSNNIPL VASYHTHLPK 
YLEHYGMGML EPLLWELLKA AHNQAILNLC TSTAMVKELS DKGIQNTALW QRGVDTETFN 
PELRSDEMRQ KLLGKHSDTG ELLIYVGRLS AEKQIERIKP VLEALPNTRL ALVGDGPYRQ 
QLEKIFENTA TTFVGYLSGK ELAGAYASGD AFLFPSSTET LGLVLLEAMA AGCPVVGANK 
GGIPDIINDG QNGCLYDPDG ANGGATSLIN ATKKLLGNEI ERQSMRNAAR IEAEKWGWSS 
ATTQLRDFYR AILEKQSNKI AA