Gene P9211_02101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_02101
Symbol
ID	5731791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	201543
End bp	203153
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	41%
IMG OID	641284554
Product	ABC transporter, ATP binding component
Protein accession	YP_001550095
Protein GI	159902751
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAGTT CTTTAGGGGA TGTTTTAAAT ATTCAAAACT TGAGGGTTTG TTATCCCAAC 
ACTTCTAAAT GGGTATTGGA TCGCTTCAAT TTAAATATTC GAGCTGGAGA ACGTGTTGCT 
CTCATTGGTA GCTCAGGGTC TGGGAAAAGT ACTGTTGCTA AGGCTTTAAT GCAAATTCTT 
CCTTCAGGGA GTATCTGTCA AGGTTCTCTA TTAGTTGCTG GACAAGATCT CATGAACTTA 
GAGCCTAAAA GCTTGGTTCA ACTTAGAGGA GAGTTGGTTG GTTTGGTTTT TCAAGATCCA 
ATGAGTCGCC TGAATCCATT AATGACAATT GGAGATCATA TCTTGGATAC ATTAAAGGCA 
CATAGACCAG AGAAGACTTC TTCTTGGCGC AGATTTCGGG CTGAAGAATT GTTGATAAAA 
GTTGGGATCA ATCCTGCTCG TTTCAATGCT TTTCCTCATC AATTTAGTGG TGGCATGCGT 
CAACGATTAG CCATTGCTTT GGCAATTGCT TTGAATCCAC CTTTAGTCAT TGCAGATGAG 
CCTACTTCTA GCTTGGATGT CGCAGTGGCA AACCAGGTAA TGAGAGAGTT GAACAACCTT 
TGCAATGAAC TTGGCACTAG TCTCTTATTA ATTACCCATG ACCTTGCTCT GGCAGCCAGA 
TGGTGTGAAC GCATGGCAAT CCTTGGGGAA GGCAATATAG TTGAGGAAGG TTTCAGTAGA 
GATGTTGTAG AGCAGCCATT ATCTTTGCTG GGGAAGAGCT TGGTTGGTGC TGTTAAAGCG 
CGAGAACAAA AATCTTTAAA GTCTCAAATT GAGGGAAAAG TTGTATTAAA GGTTGATCGA 
TTGCGATGTT GGCATGCTGG GGGTTGGTTG CCTTGGCAAA CTAATTGGAT TAAAGCTGTT 
GATGAAGTTA GTTTTTCTTT GCTACAAGGG GAAACATTAG GAGTAGTAGG AGTATCAGGC 
TGTGGGAAGA GCACTTTGTG TAGAGCCCTC GTGGGCTTGT TGCCTATCAG AGGAGGTGAT 
GTGATGTTGT TTGGGCAAAA TTTAGCAAGA TTAAATAGGT CCTCTGTTAA ACAAGCTAGA 
CAGGCATTAC AGATGATCTT TCAGGATCCT TTTGGTTCTA TGAATCCCAA GATGACAGTT 
TTAGACACCA TCTCCGATCC ACTACTTGCT CATAATTTAT GCAATAAAGC AAGTGCAAAA 
GAGCAATCAA GAAAGCTGTT GGATCAAGTA GGTTTAAGCC CACCTGAAAA CTTTCAACAC 
CGTTTACCTC ATGAACTTTC TGGTGGTCAG CAACAAAGAG TTGCGATTGC GCGTGCTCTT 
GCTTTGACTC CCAAGGTACT TATTTGTGAT GAAAGTGTGA GTATGCTAGA TGCTGAAATG 
CAAGCAGATG TCCTAAATTT ATTGAGCTCA CTGCAAAAAA AACTTGGATT AGCAATTCTT 
TTTATCACGC ATGATTTATC GGTTGCCCAT AGCTTTTGCC ATAGGTTGAT TGTTTTAGAT 
AAGGGAAAAA TTGTTGAAGA AGGTTTGTCA CATCAGATAT TTAATAAACC TCAGAATGAA 
CTTACTAAAA CACTAGTTAG TGCTTGCCCA AGGATTAAAT CCTTTAATTG A

Protein sequence

MTSSLGDVLN IQNLRVCYPN TSKWVLDRFN LNIRAGERVA LIGSSGSGKS TVAKALMQIL 
PSGSICQGSL LVAGQDLMNL EPKSLVQLRG ELVGLVFQDP MSRLNPLMTI GDHILDTLKA 
HRPEKTSSWR RFRAEELLIK VGINPARFNA FPHQFSGGMR QRLAIALAIA LNPPLVIADE 
PTSSLDVAVA NQVMRELNNL CNELGTSLLL ITHDLALAAR WCERMAILGE GNIVEEGFSR 
DVVEQPLSLL GKSLVGAVKA REQKSLKSQI EGKVVLKVDR LRCWHAGGWL PWQTNWIKAV 
DEVSFSLLQG ETLGVVGVSG CGKSTLCRAL VGLLPIRGGD VMLFGQNLAR LNRSSVKQAR 
QALQMIFQDP FGSMNPKMTV LDTISDPLLA HNLCNKASAK EQSRKLLDQV GLSPPENFQH 
RLPHELSGGQ QQRVAIARAL ALTPKVLICD ESVSMLDAEM QADVLNLLSS LQKKLGLAIL 
FITHDLSVAH SFCHRLIVLD KGKIVEEGLS HQIFNKPQNE LTKTLVSACP RIKSFN