Gene NATL1_03991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_03991
Symbol	xylB
ID	4780902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	368016
End bp	369251
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	34%
IMG OID	640083668
Product	carbohydrate kinase
Protein accession	YP_001014228
Protein GI	124025112
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.14778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAACA ATTCTTTTGT ACTTGGTATA GATCTTGGTA CATCAGGCGT AAGGATTGCA 
ATCATTAATA CTAAAAAAAA AATACTATTC ACATCATCAA CAAAATACTC TAAAGGTCTG 
GAAATATCTG GAGACTGGAT AAATAGCCTC AAAAATCTAA TACAAGAAAT TCCAAAAGAT 
CTTAAAGAAA AGTTGGTTTC TTGTTCAGTA GCAGGAACCT CTGGAACACT TTTAGCATGC 
AATAGAGATG GAGTTCCTCT AGGGAAAGCC CTACCTTATT TCTTACCCTT TTCGGAATAT 
TCATGCGAGA TAGAAAATCT ATTTACTAAA GAATGTGCAG GATCAAGTGT AAGTGGAAGT 
GTTGGAAGAG CGCTAAAACT TCTAGCCTTA TATGGTAATG AAATAATCTT AAGGCACCAA 
GCAGATTGGA TTAGTGGATG GCTTATCAAT AATTGGGAGT ATGGGGAAGA AGGTAACAAT 
ATTAGGATGG GTTGGGAAAT ATCAAATAGT TCATGGCCAG AAAAATTTCA AAATTTAAAA 
TGGTTAAAAT GTCTTCCGAA AATAATTCCT TCAGGTCAAA TAATGGGAAA TATATGTACT 
AAAAAAGCAA ATGAATTAAG TTTACCAAAA AATCTTAAAG TCATAGCAGG AACTACAGAT 
TCTAATGCTG GGGTTTTAGC TACTTTCCCT AATAAAAATG ATGGGATAAC AATCCTTGGT 
AGCACAATAG TAATTAAAAA ATTTGTAAAT AACCCCTTGG AGGGGAAAGG TATTTCAAAT 
CATAAATTGT TAGGGAATTG GCTATCTGGT GGAGCATCTA ATACAGGGGC TTCGATACTA 
CTAGACTTCT TTAATCTTGA ATATATTGCA GAATTAAGCA AACAAATAAA TCCTAATAAA 
TCATCAGGAT TAAACCTTCT TCCATTGTCA AGTCAAGGAG AAAGATTTCC AATAGATGAC 
CCCAATTTAC AACCTAAACT TGAGCCAAGA CCAGTCAGTG ATTCTCTTTA TCTTCATGCA 
TTATTTGAAG GGTTAGCGAA AATAGAAGCA AGAGGCTGGC AAAAACTTAA TGAATTAGGA 
GCTGATTTAC CTCGGCAAAT AATTACTATT GGAGGAGGTG CAAAAAATAT TACTTGGAAA 
AAAATAAGAG AAAGAGAAAT TGGCATACCA ATAAAAATAT GCAACACCCC CCCCGCTGCT 
GGAGTAGCAA GTATTGCTTT GCAGGGATTA TTATGA

Protein sequence

MLNNSFVLGI DLGTSGVRIA IINTKKKILF TSSTKYSKGL EISGDWINSL KNLIQEIPKD 
LKEKLVSCSV AGTSGTLLAC NRDGVPLGKA LPYFLPFSEY SCEIENLFTK ECAGSSVSGS 
VGRALKLLAL YGNEIILRHQ ADWISGWLIN NWEYGEEGNN IRMGWEISNS SWPEKFQNLK 
WLKCLPKIIP SGQIMGNICT KKANELSLPK NLKVIAGTTD SNAGVLATFP NKNDGITILG 
STIVIKKFVN NPLEGKGISN HKLLGNWLSG GASNTGASIL LDFFNLEYIA ELSKQINPNK 
SSGLNLLPLS SQGERFPIDD PNLQPKLEPR PVSDSLYLHA LFEGLAKIEA RGWQKLNELG 
ADLPRQIITI GGGAKNITWK KIREREIGIP IKICNTPPAA GVASIALQGL L