Gene P9303_22191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_22191
Symbol	xylB
ID	4778067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1969067
End bp	1970350
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	58%
IMG OID	640087735
Product	carbohydrate kinase, FGGY family protein
Protein accession	YP_001018219
Protein GI	124023912
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAACT CGTCCCTGGC GCTCGGCATC GACCTTGGCA CCAGCGGCGT ACGGCTTGCC 
GTGCTCAACG AGCACGGCAA GCTGATCCAC ACAAGCACAG CGGACTATCC AAAAGGGCTT 
GAGATCCCTG AAGACTGGAA AACCTGCTGC ACAGAGCTGA TTCGGGCTTT GCCCACCAAC 
CTTCGGCTGG CCCTGAGGGC ATTAGCCGTG GATGGCACAT CAGGAACTCT GCTGGCCTGC 
GACCACACTG GCACAGCCCT TAGCAGAGCC CTTCCATACA ATCTGAGCTG CCCAGAGCAA 
AGGCAAACAC TCATCTCCCT TGTCTCCCAT GGAGAACCAG CCTCAAGTGT GAGCAGCAGC 
TTGGCAAGGG CTCTACGACT AATCAGCACC CATGGCCAAA GCGTTCTGCT ACGCCATCAA 
GCGGACTGGA TCAGCGGCTG GTTGCTAGGC AATTGGTGCT GGGGAGAAGA AGGCAACAAC 
CTGCGCTTAG GCTGGGATTT AGTCAATCAG ACCTGGCCTG CCAGCATTGC CGAAACAGCC 
TGGCGGGCAG CACTTCCTGA GATCGTAAGC AGCGGCAAAG TTCTGGGTAA GGTGGCACCT 
GAGCAGTCCC AAAGCCTTGG CCTACCGAAA CAACTCCTCG TAGTAGCAGG GACCACCGAC 
GCCAATGCTG CTGTTTTAAC TGCCAATGCA GGTCCCGACG ACGGCATCAC CGTGCTGGGC 
AGCACCCTTG TGCTGAAACG TTTTACGGAA GGTCCAATCC GTGGTGCTGG CATCACCAAC 
CATCGCGTTG GCGGACGATG GCTCTGCGGC GGAGCCTCCA ATGCCGGTGG CAGCGTCCTT 
CGACAACTGT TCAGTGATAC CGAGCTCAAA GAGTTAAGCC GCCAGATCAA TCCAGAGTTC 
AACAGTGGTC TAATGCTGCG CCCTCTTCCC GGCCCCGGCG AACGCTTCCC AATTGACGAT 
CCCACACTCG AACCACAGCT AACGCCACGA CCTGTGAGCG ATTCCCTCTA CCTCCATGGC 
CTGCTGGAAG GCCTCGCACA CATCGAATTG CAAGGCTGGC AACGTCTCAA AGAGCTTGGC 
GCTCCCCCTC CCAAGCAAGT GATCAGCCTG GGAGGGGGAG CACGCAATCC CCAATGGCGT 
CGATTAAGAG AACGGATCCT TGGCATACCC GTCAAGACTT GCACCAACCC ACCAGCTGCC 
GGAGTAGCCC GTCTGGCCTT GCAAGCGATC TCTCCTCAAC ACAACTTGGT TAGTACCAAG 
CAAGAATCGG ATCAACAGCT CTGA

Protein sequence

MPNSSLALGI DLGTSGVRLA VLNEHGKLIH TSTADYPKGL EIPEDWKTCC TELIRALPTN 
LRLALRALAV DGTSGTLLAC DHTGTALSRA LPYNLSCPEQ RQTLISLVSH GEPASSVSSS 
LARALRLIST HGQSVLLRHQ ADWISGWLLG NWCWGEEGNN LRLGWDLVNQ TWPASIAETA 
WRAALPEIVS SGKVLGKVAP EQSQSLGLPK QLLVVAGTTD ANAAVLTANA GPDDGITVLG 
STLVLKRFTE GPIRGAGITN HRVGGRWLCG GASNAGGSVL RQLFSDTELK ELSRQINPEF 
NSGLMLRPLP GPGERFPIDD PTLEPQLTPR PVSDSLYLHG LLEGLAHIEL QGWQRLKELG 
APPPKQVISL GGGARNPQWR RLRERILGIP VKTCTNPPAA GVARLALQAI SPQHNLVSTK 
QESDQQL