Gene P9303_03991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_03991
Symbol
ID	4777025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	400178
End bp	402136
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	54%
IMG OID	640085902
Product	ABC transporter ATP-binding protein
Protein accession	YP_001016416
Protein GI	124022109
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCTGA TCAGCCTGAT AGAGGCCTCA AAAGACTTCG GCATCAACAC CCTGTTTGCC 
GACCTCACCC TGCACATCAA CGAAAGAGAA CGTCTAGGGC TGATCGGACC GAATGGAGCC 
GGGAAATCGA CGCTCCTGAA GGTGCTCGCC GGAGAAGAAC CCCTCGGAGA GGGTGAAAGG 
AGGTGCTCAG CGCGATTACG CGTAGAGCTC GTGGGCCAAG AGAGCGCTGT AAACCCTGGC 
CATACGGTGC TGCAAGAAGT CTTGGCCGGG TGCGGTGAAA AGAGAGAGCT GCTGCTGCGT 
TTCAACGAGC TCAGCAATTC GATGGCCCGC AACCCCAACG ATGCAACGCT TTTGGCTGAG 
TTAGGACAAG TCAGCCAGCG GATGGATGAC GCTCAAGCCT GGAGCTTGGA ACAGCAATGT 
CAAGAGGTCC TTCAACGTCT TGGTATCACC GATCTAGAGC GGCCGGTTGA AGAACTCTCT 
GGTGGGTATC GCAAGCGCGT CGGCCTTGCC TCCGCCTTGG TCGCCAGACC CGACGTTTTG 
CTGCTCGATG AGCCCACCAA CCATCTCGAT GCGGCAGCAG TTGAGTGGCT ACAAAGTTGG 
CTCGATCGCT TTCCAGGTGC TTTGGTGCTT GTCACCCACG ATCGCTACGT GCTCGATCGG 
GTGACACGCC GCATGGTGGA AGTAGACCGA GGCAAAGCCC ATAACTATGC CGGCAACTAC 
AGCACTTTTC TACAACAAAA GGCCGAACTT GAAGCTTCAG AAGCTTCCAC TGCTCACAAG 
TTCAAAGGGG TTTTAAGACG AGAGCTGGCC TGGTTGCGAC AGGGTCCCAA AGCACGCAGT 
ACCAAGCAGA AGGCACGCCT GCAGCGAATT GAGGAGATGC GCGCCGAACC ATTGCCGCAA 
CTGCGGGGTT CCTTGAAGAT GGCGAACGTA AGCAGGCGTA TCGGCAAGCT AGTGATTGAG 
GCGGAAGCCC TGCAAGTCAC CGCCAATGGC AAGCCCGACA GTCCTCTGCT TCTAGACAAC 
TTCACCTACA GCTTTAGTCC AGAAGACCGC GTTGGCATCA TCGGCCCGAA TGGCAGTGGC 
AAATCCACAT TGCTTGATTT AATTGCAGGC AGACGCCAAC CCAATGGTGG AACACTGCGA 
TTAGGTGAAA CAGTGCACCT GGGATATCTC GACCAGCACA CCGAAGACAT CACCAAAGGC 
AAGGGCCTAG ATCGCAAAGT GATCGATTTT GTTGAAGAAG CTGCCTCTCA AATCATTCTG 
GGAGAAGAAC AAATTACGGC CTCTCAACTA CTGGAACGCT TCCTATTTCC ACCGGCTCAG 
CAGCACAGCC CACTGGGGAA GCTCTCTGGG GGAGAACGAC GCCGACTCAC ACTCTGCCGG 
ATGCTGATCC AAGCACCGAA TGTGCTGCTG CTTGATGAAC CCACCAACGA CCTAGATATC 
CAGACACTAA GCGTGCTGGA AGATTTCCTT GAGGATTTCC GCGGCTGCGT TGTCGTGGTC 
TCTCATGACC GCTATTTCCT CGATCGCACA GTTGATCGTC TGTTCAACTT TGAGAATGGA 
CAATTGAAAC GTTTTGAGGG CAATTACAGC GCCTTTCTTG AACAACAACG ACGACAAGAG 
CGAGACTTCA ACGAAGCAAA TGAGCCCAAA TCCAGCCTCC TTTTGCAGGA TTCTGGCCCA 
TCTAGAATAT CCAAAAGATC CTCTCAAGAG GCAGAAAGCT CTTCACCCCA AGCCACAGAA 
ACCAGCAAGC CAAGACGCCG AAGCTTCAAG GAATCACGTG AACTAGAAGC TCTAAACATT 
GATATCCCAC TGCTTGAAGC CAAGCGTTCT AACCTTGAAG CTGCTTTGTC CGGTGGCGAC 
GAAGACTTAA CTCTGCTTAG TCAACAATTG GCCGAGCTGG TCGAAACATT GCACAAAGCA 
GAGGAGCGCT GGCTCGAACT CAGCGAACTG GCCATATAA

Protein sequence

MSLISLIEAS KDFGINTLFA DLTLHINERE RLGLIGPNGA GKSTLLKVLA GEEPLGEGER 
RCSARLRVEL VGQESAVNPG HTVLQEVLAG CGEKRELLLR FNELSNSMAR NPNDATLLAE 
LGQVSQRMDD AQAWSLEQQC QEVLQRLGIT DLERPVEELS GGYRKRVGLA SALVARPDVL 
LLDEPTNHLD AAAVEWLQSW LDRFPGALVL VTHDRYVLDR VTRRMVEVDR GKAHNYAGNY 
STFLQQKAEL EASEASTAHK FKGVLRRELA WLRQGPKARS TKQKARLQRI EEMRAEPLPQ 
LRGSLKMANV SRRIGKLVIE AEALQVTANG KPDSPLLLDN FTYSFSPEDR VGIIGPNGSG 
KSTLLDLIAG RRQPNGGTLR LGETVHLGYL DQHTEDITKG KGLDRKVIDF VEEAASQIIL 
GEEQITASQL LERFLFPPAQ QHSPLGKLSG GERRRLTLCR MLIQAPNVLL LDEPTNDLDI 
QTLSVLEDFL EDFRGCVVVV SHDRYFLDRT VDRLFNFENG QLKRFEGNYS AFLEQQRRQE 
RDFNEANEPK SSLLLQDSGP SRISKRSSQE AESSSPQATE TSKPRRRSFK ESRELEALNI 
DIPLLEAKRS NLEAALSGGD EDLTLLSQQL AELVETLHKA EERWLELSEL AI