Gene P9303_29931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_29931
Symbol
ID	4777053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	2642502
End bp	2643809
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	53%
IMG OID	640088517
Product	multidrug ABC transporter
Protein accession	YP_001018988
Protein GI	124024681
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.910726
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCAA GTCTCTATGG GATCGTGACA TTCATCCTGA CTCATTCCCA ATTGCGCCGA 
CCACAGATTC CCATCTTTCT CTGTGCCTTT GTCACTCTGT TGAACGATCG CCTAGGTGAA 
ACCCTCTTAC TGCCATTACT TCCATACCTC CCAGGACGCT TCACAGACAG CGGCACAATC 
CTGGGGCTAC TGGGAGGTAC TTATGCATTG GCTCAATTCG TCGTGGCTCC CCTAATTGGC 
GCTCTCAGTG ATCGCTTTGG CCGCAAACCA GTTTTAACCG CTTGCGTTGC TGGCTCAGTA 
GTAGGCCTTG GCTTATTCGC TATCACAATA TGGATTGATT GGAACATACT TCCAGCCGCT 
TGGATCGGCA TTGTTCCCCT AATCCTTCTC TTCTCAGCAA GAATCATCGA TGGCGTTAGC 
GGTGGCACAG CAAGTAGCGC CACCGCAGTG CTTGCCGACA TCTCAACACC TGAGAACCGA 
GCAAAGGCAT TCGGCCTTAT TGGCGTTGCA TTCGGCCTCG GGTTCATCTT GGGCCCTTAT 
ATCGGTGGCC GCTTAGCAGA GATCAATATC GCTCTACCCG GTATAGCCGC CACAGCCTTC 
GCAGTCGCGA ACCTGCTCCT TGTGATCTAT ATCCTTCCCG AAACACACCC GCCAGCAGCT 
CGCAATTCCC TACCAAGCAA AAGACAACTC AACCCGATCA CCCAGCTAGC ACAGATCTTT 
GCCAATCCAC TAGTAAGCCG CCTTTGTTTC GCCTTCTTCC TGTTCTTCAT GGCATTCAAC 
GGTTTCACAG CTGTGCTGGT GCTTTACCTG AAGCAAGCCT TCTCATGGAC AGTCAGTTTG 
GCAGGCCTGA CCTTTGCAGT TGTAGGCGTG ATCGCAATGG TGGTTCAAGG GCTGCTAATC 
GGTCCACTGG TCAAATCCTT CGGCGAATGG CGGCTCACCA TTGCTGGCAT TGGCTTCGTC 
ATTGCAGGCT GTCTGCTATT GCCCATGGCC ACTCAGCAGA ATTCGATTTC TGTTGTATTC 
ACTGCCGTAT CGGTACTAGC CCTTGGCACA GGTCTAGTCG TGCCATGCTT GAGAGCGCTT 
GTCTCCAGAC GCCTCGACAA CGCTGGCCAA GGGGCAGTAC TCGGTAGCCT TCAAGGTCTT 
CAGAGTCTAG GGACCTTCCT TGGTGCAGCC GCCGCAGGAT TCGCCTACGA CCAAATAGGC 
ACTCGCAGTC CCTTCTGGCT GGCCAGCCTC GTACTAGTGG GAGTGATTGC CCTTGTTGCA 
GGAGGCCTGC CTGCAAGCAC AAGGAACACA ACAATCAAAC AATCATGA

Protein sequence

MASSLYGIVT FILTHSQLRR PQIPIFLCAF VTLLNDRLGE TLLLPLLPYL PGRFTDSGTI 
LGLLGGTYAL AQFVVAPLIG ALSDRFGRKP VLTACVAGSV VGLGLFAITI WIDWNILPAA 
WIGIVPLILL FSARIIDGVS GGTASSATAV LADISTPENR AKAFGLIGVA FGLGFILGPY 
IGGRLAEINI ALPGIAATAF AVANLLLVIY ILPETHPPAA RNSLPSKRQL NPITQLAQIF 
ANPLVSRLCF AFFLFFMAFN GFTAVLVLYL KQAFSWTVSL AGLTFAVVGV IAMVVQGLLI 
GPLVKSFGEW RLTIAGIGFV IAGCLLLPMA TQQNSISVVF TAVSVLALGT GLVVPCLRAL 
VSRRLDNAGQ GAVLGSLQGL QSLGTFLGAA AAGFAYDQIG TRSPFWLASL VLVGVIALVA 
GGLPASTRNT TIKQS