Gene A9601_00101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00101
Symbol	rsbU
ID	4716692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	13122
End bp	14465
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	27%
IMG OID	640077707
Product	protein phosphatase 2C domain-containing protein
Protein accession	YP_001008405
Protein GI	123967547
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACAAACT ATCAAAAAGA AAAAATATTT TCGAACAAAT TTATTAAAAA TTTTTTAGAA 
AACGAATCTA CAGAAATTTT AAAAAATAAA TATAAATTTG CTGAAATTGC ATCTTCACTA 
GCATATTATT TAAAATCGTT TTCCAACATA AATAAATTAT TAGATTATAT TTCTTTAATT 
TTTAAACATA TTTTTTCTGA GAATATAATT TTAATTATTC CTTTAAATTA TGAGGGTGAT 
ATATGGAATG AAAATATAAA AATTTCTGTT AATGATAAAT ATTTAACAAT TCAAAAAGAA 
ATCAATAAAT TTTTGAATCA ATTTCATTTT TCAAAAAATT TTAAAATAAA AGAAATTTTA 
ACTTTTGAAA ATGCTTTAAA AAATAATTTT AAAGAATATA AAATTGAAAC AAAAAAAATA 
ATATCTAGAG GTAAATGTAG AGGATTTATT TATATTTTTA GCAAAGATAT TTATATACAG 
TCGATTACTG AAGATAGTAA TTTTAATTTT ATTGAAAATT GTCTAGCTGT TGGATTAGAA 
AATCACTATT TATTAAAAAC AAAGAAAAAG CATGAAAACG TAGATAGAGA AATCTCCACT 
GGTGCTGAAA TTCAATCTCA ATTACTTCCG GATTATTGCC CAATTATCCA TGGTATAGAT 
TTAGCAGCTC ATTGTAGACC AGCTCTTCAG CTCGGAGGGG ATTACTATGA TTTTATGTGC 
TTGAAGACGA ATATCTCTGA AAAAAGAAAA GAAAAATCAA GATGGGCTTT TGTTATAGGT 
GATGTCATGG GTAAAGGGAT TCCGGCTGGC CTTTTAATGA CGATGTTGAG AGGAATGCTA 
CGCGCTGAGG TTCTTACAGG TCTGCCTCCA GATAGAATTT TGCATGATTT GAATCAACTA 
GCAATAAATG ATTTAGATCA ATCACATAGA TTTGTGACTT TATTTTACTC AGATTATGAC 
CCTAGAACTA GAAAATTGAG ATTCGCTAAT GCAGCACATA ATCCTCCTCT GCTTTGGAAA 
AGTTCAGATC AGAAAATTAT TAAATTAGAT GCAGAAGGAT TTGTACTTGG ACTACAAAAA 
GATGCAGAAT ACCAATGTGG TGAAATAAAG CTTAATCAAA ATGATTTAGT TCTCTATTAC 
ACAGATGGAG TAATAGATAC TTCTAATTCC TTAGGGCAAA GATTTGACGA GGAAAGGTTA 
ATTAAAACGC TTACAAAATT TTGCAAGCAA TCATATTCAT CCCAAGAAAT TTTAAATAAA 
ATATTTAAAA AGTTAGATGA TTTTACTGGA CAAAATAGAC ACTTGGAAGA TGACGCCTCG 
ATGGTTATTT TTCAATTGAA ATAG

Protein sequence

MTNYQKEKIF SNKFIKNFLE NESTEILKNK YKFAEIASSL AYYLKSFSNI NKLLDYISLI 
FKHIFSENII LIIPLNYEGD IWNENIKISV NDKYLTIQKE INKFLNQFHF SKNFKIKEIL 
TFENALKNNF KEYKIETKKI ISRGKCRGFI YIFSKDIYIQ SITEDSNFNF IENCLAVGLE 
NHYLLKTKKK HENVDREIST GAEIQSQLLP DYCPIIHGID LAAHCRPALQ LGGDYYDFMC 
LKTNISEKRK EKSRWAFVIG DVMGKGIPAG LLMTMLRGML RAEVLTGLPP DRILHDLNQL 
AINDLDQSHR FVTLFYSDYD PRTRKLRFAN AAHNPPLLWK SSDQKIIKLD AEGFVLGLQK 
DAEYQCGEIK LNQNDLVLYY TDGVIDTSNS LGQRFDEERL IKTLTKFCKQ SYSSQEILNK 
IFKKLDDFTG QNRHLEDDAS MVIFQLK