Gene P9301_11551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_11551
Symbol	ddpA
ID	4912038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	968408
End bp	969979
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	30%
IMG OID	640160741
Product	ABC transporter substrate-binding protein
Protein accession	YP_001091379
Protein GI	126696493
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA AAATTGTTTT ATCAATATTT ATAATTTTAA TTTCTTTTTT ACAGAATTCT 
TGCGGCTCAA AAAGAATATC TAAAAAAATT ATAGTAGCAA GTTCTGGAAA AATTGAATCT 
TTAGATCCAG CTAGAGCAAA TACTCTTAAA GCAATTCAAT TAATCAGTTC TCTTGGAGAC 
ACATTATATG AATTAAATTC TAAGGGAGAA TTAATACCTG AATTGGCCTC GGGGATGCCA 
GTTATTTCAA AGGATAGACT TCAAATAACT ATCAATTTAA GAAAGAATGT TTTTTTTCAC 
GATGGAACTG CTTTTAACTC AAATGCTATG AAGTTTACCT TTGATAGATT CAAAAGAATT 
GGAACTATGA ACTACATTTT AGGAAATAAG ATTAAATCAA TAGAAACGCC AAGTGAATAT 
TCAGTCATAA TAAATTTGAA TAAACCATCA AGTTCTTTAA ATGGTTTACT CACATCAGTA 
AATTTAACTC CAATATCCCC TACATTTTAC AAACAATATT CTGATAAGTT TCTAAATGAA 
AAATTTGTTG GTACTGGCAA GTATGTGCTG ACCAGTTTTT CTAATGAAGT TCAATCAATT 
GATCCATATT TGAATTATTG GGGTGAAAAG CCCTTCAATA ACGGCGTTAA TTTTGTGGGC 
TATTCAAATT CATCCTCTCT TTTTGGGGCT TTAAAAAGTA AACAAATTGA CGTGCTTTTA 
TCAAATTCAA TTGATGATAG TCAGAGAAAA AGTTTAAATG ATTTAAGCAA AAATAAACAG 
TTTAATGAAG GTAATAGCCC TTTCACTGAA TTAAGTTTTA TAAGCCTCAA AACTAGTTCT 
TATCCCTTAA GTAATCTTAA TTTAAGATTG GCTTTGGCAA AAAGTCTTAA TAGAAAATTG 
ATTAGTGAGA AAGTAAGTTA TGGATTAAGG AAGCCATCTA GATCAATTAT TCCTCCGATA 
TTAAAAAAAG ATAATCAAGA ACTGTGGCCT AAATATGATT ATTTAGAAGC AAGAAGGTTA 
TTGCAAAAAG AAAATTATTG CAATGGAAAT ATTCTAAAAA TACCCCTTAC TTATAGATCT 
AATGTACCAG CTGACAAGCT TATTGCTCTG ACATGGCAAG AAGAAATTAA AAATTCTTTG 
AAAGATTGTA TTGATATTGA ACTCAATGGG GTTGAATCTA CAACAGTTTA TAAGAATCTA 
AGTTTAGGAA TTTATACGGC AGTCCTTCTC GATTGGACTG GGGCTTATTC AGATCCAGAG 
GCTTATCTTA CCCCTCTTTT AAGTTGTAAT GAAATAGTTG ACGGCATATG TAAAAAAGGA 
GAATCAGTTT ATAGCGGGAG TTTTTGGGGA TCTAATAAAG TGGAAAGTTT ATTTCTTGAG 
AGTGAAAAAA TAAGTGGAAT TAAAAGATTA GAAAAACTTG TTGAAATTGA AAAAATAGCA 
GCAAGTTCAA TACCTTATAT TCCTATTTGG ATCTCCTCTC AAAAAGCATG GTCACAAAAT 
AAAATATCAA AACCTATTTT TAATGGCGCA GGAATAATTT CATTGAGTAA TCTTGAGTTA 
ATTAATGAGT AG

Protein sequence

MKKKIVLSIF IILISFLQNS CGSKRISKKI IVASSGKIES LDPARANTLK AIQLISSLGD 
TLYELNSKGE LIPELASGMP VISKDRLQIT INLRKNVFFH DGTAFNSNAM KFTFDRFKRI 
GTMNYILGNK IKSIETPSEY SVIINLNKPS SSLNGLLTSV NLTPISPTFY KQYSDKFLNE 
KFVGTGKYVL TSFSNEVQSI DPYLNYWGEK PFNNGVNFVG YSNSSSLFGA LKSKQIDVLL 
SNSIDDSQRK SLNDLSKNKQ FNEGNSPFTE LSFISLKTSS YPLSNLNLRL ALAKSLNRKL 
ISEKVSYGLR KPSRSIIPPI LKKDNQELWP KYDYLEARRL LQKENYCNGN ILKIPLTYRS 
NVPADKLIAL TWQEEIKNSL KDCIDIELNG VESTTVYKNL SLGIYTAVLL DWTGAYSDPE 
AYLTPLLSCN EIVDGICKKG ESVYSGSFWG SNKVESLFLE SEKISGIKRL EKLVEIEKIA 
ASSIPYIPIW ISSQKAWSQN KISKPIFNGA GIISLSNLEL INE