Gene P9303_03901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_03901
Symbol	malK
ID	4777058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	393891
End bp	395138
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	56%
IMG OID	640085893
Product	ABC transporter ATP-binding protein
Protein accession	YP_001016407
Protein GI	124022100
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.43703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGGCG TTCGCTTCAA GGCTCTCAAC AAGACCTACC CAAGCAGGCG GAATGAACCC 
GCTGTTGAGG TCATTCGTCA ACTGAATCTA CAAATCAACG ATGGTGAATT CCTTGTGCTG 
GTGGGCCCCT CTGGCTGCGG TAAAAGCACA CTGCTGAGGC TGCTCGCGGG CCTCGAAGCC 
CCTACAAGCG GAGAGATCTA CGTAGGCAAA CAACCTGTCT CGCAGCTACG GCCTGCCCAA 
AGGGACGTGG CGATGGTGTT CCAGAGCTAC GCGCTTTATC CCCACTTAAG TGTGCGCGAC 
AACCTGGTCT TCGGCCTACG GCGCAGCCAG CAGCGATCTC TAGGCCAACT CCTGCAAGAC 
CAACTCCATC GCAATACCCG CAACTTTCCT CCACTTCTGC AGGTTTCATC TATACGAGAG 
CAGCGAATCG AGGCCCGCAC AAGAGAAGTT GCTGAAGCCC TGGAGCTTCA ACCACTGCTC 
AATCGCCAAC CCAAAGAACT CTCTGGCGGT CAAAAACAAC GTGTTGCTCT AGGCCGGGCA 
ATGGCGAGAG AGCCGTCTGT ATTCCTGATG GACGAACCAC TCAGCAACTT GGACGCAAAA 
CTGCGCAATA GCACGCGCAC TCAAATCGTT GACCTCCAGC GTCAACTTGG CACCACCACC 
ATCTACGTCA CCCACGACCA AGTCGAGGCG ATGACGATGG GTCATCGGAT TGCGGTACTA 
AATCAAGGGC AGCTACAGCA ATTGGGCACG CCAATCGAGC TCTATCAATG GCCATCAAAC 
ATTTTTGTTG CGCAGTTCAT CGGCAGTCCG CCCATGAACG TACTGCCAGT AGTTGTTGGC 
CCAGCCAATA CGCTCCTACT AGGTGATCGT CGCCTAGCGG TTGAAGGACC AATGGCCGAA 
GCGCTGCTGC ATCTGGAAGA GGGGCAACCG ATCAGCGCTG GTCTTCGACC GGAGCATTTG 
CGCGTAGCTC CTTCCACCAA TCGCAATCTC GCGGCAATCG TGAGTCATCT GGAAGTCTTA 
GGAAATGAAC AACTGATCAC CTGCAAACTT CTTGACGGGA ACCATCTCGT TCAAGTGAGG 
GCCTCGCCCG AGCTCTCGCT CAGCGCTGGA AGCAACCTGC ATCTAGAGCC AGATCCTCGA 
GGCTGGCGAC TGTTTGGTGC CGACGGGGAA GCCATCGCAA TGACAGCTCA AGACAACACT 
GAACAAGACC CAAACGACCG CAAACTCCAC TTGCCCATTC TGGGCTAA

Protein sequence

MAGVRFKALN KTYPSRRNEP AVEVIRQLNL QINDGEFLVL VGPSGCGKST LLRLLAGLEA 
PTSGEIYVGK QPVSQLRPAQ RDVAMVFQSY ALYPHLSVRD NLVFGLRRSQ QRSLGQLLQD 
QLHRNTRNFP PLLQVSSIRE QRIEARTREV AEALELQPLL NRQPKELSGG QKQRVALGRA 
MAREPSVFLM DEPLSNLDAK LRNSTRTQIV DLQRQLGTTT IYVTHDQVEA MTMGHRIAVL 
NQGQLQQLGT PIELYQWPSN IFVAQFIGSP PMNVLPVVVG PANTLLLGDR RLAVEGPMAE 
ALLHLEEGQP ISAGLRPEHL RVAPSTNRNL AAIVSHLEVL GNEQLITCKL LDGNHLVQVR 
ASPELSLSAG SNLHLEPDPR GWRLFGADGE AIAMTAQDNT EQDPNDRKLH LPILG