Gene Caul_1281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1281
Symbol
ID	5898736
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1345811
End bp	1346971
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	73%
IMG OID	641561766
Product	RND family efflux transporter MFP subunit
Protein accession	YP_001682909
Protein GI	167645246
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0104305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGTGC ATCAACGGAT CAATAGACGC GGCCTGCGTT CGACTGCGTT ACCGGTGGTG 
CTTTGCATCG GCGCTCTGAG CCTGGCCGCC TGCGACCACA ACGACAAGGC CAAGGCCAAG 
GCGACGAAGC CTTCGCAGGC CGCCAGCCAG ACCGTCGGAG TGGCCGTGGT CACCGTCCAG 
GCCCTGCCCC GGATCATCAA CGCCTCCGGC ACCGTCACCC CCTGGGAGGA AGTTCCCGTC 
GGCGCCGAGA CCGGCGGCCT GACCGCCGTG TCGGTCAACG CCGAGGAAGG CCAGACCGTG 
CGCCAGGGCC AAGTCCTGGT GGCGATGAAC GACACCATGC TGCGCGCCCA GGCGCGTCAG 
CAGGAGGCCT CCGTGGCCAG CGCCCGCGCC ACCCTGGCCG AGGCGCAGTC CGCCCTGGCC 
CGCTCGCGCG AACTGCAGGC CAAGGGTTAT CTGGCCGCCT CGGCGCTCGA CACCGCGAAC 
ATGCGCCAGC AGACCGCCAG CGCCCAGGTG GCCGCGGCCG AGGCCGCGCG CGGCGAGACC 
CTGGCCCGCC TGGGCCAGGC CGTGGTCCGC GCCCCGGTCT CGGGCCTGAT CAGCCGTCGC 
AGCGTCACCA AAGGCCAGAT CATCTCGCCC GGAACCGAGC TGTTCCGCAT CGTCCGCGAC 
GGCCGCCTTG AGCTGGACGC CGAGATTCCC GAATCCGACC TGTCGGCGCT GCGCGCCGGC 
ATGCCCGCCA CGGTCACCTC CGACCAGGTC GGCCAGACCA CGGGGACGAT CCGCATCGTC 
ACCTCCGAGG TCAACACCCA GACCCGCGTC GGCCTGGCCC GCATCAGCCT GGCGCCGGGC 
AGCGGCTTCC GCTCCGGCAT GTTCGCCCGC GCCCAGATCG CGGCGGGCTC CCAGCCGGCC 
CCGACCATCC CGACCGCCGC GATCCTCTAT CGCCAGAACC AGGCGGGCGT GTTCGTCGTT 
GGCGCCAACA ATCGCGCCCA GTTCCGGCGC ATCGACATCC TGGCTCGCAA CGCCGACCGC 
ACCGCCGCGG GCGGGCTGAA CCCCGGCGAG CGAGTGGTGG TCGAGGGAGC CGGCTTCCTG 
GGCGACGGCG ACGCCGTGCG CGTCGCCCCG ACCTCCGGCA AGGCCCCGGC GCCCGCCGTG 
GCCGTCGCGG CGAAACCCTA G

Protein sequence

MVVHQRINRR GLRSTALPVV LCIGALSLAA CDHNDKAKAK ATKPSQAASQ TVGVAVVTVQ 
ALPRIINASG TVTPWEEVPV GAETGGLTAV SVNAEEGQTV RQGQVLVAMN DTMLRAQARQ 
QEASVASARA TLAEAQSALA RSRELQAKGY LAASALDTAN MRQQTASAQV AAAEAARGET 
LARLGQAVVR APVSGLISRR SVTKGQIISP GTELFRIVRD GRLELDAEIP ESDLSALRAG 
MPATVTSDQV GQTTGTIRIV TSEVNTQTRV GLARISLAPG SGFRSGMFAR AQIAAGSQPA 
PTIPTAAILY RQNQAGVFVV GANNRAQFRR IDILARNADR TAAGGLNPGE RVVVEGAGFL 
GDGDAVRVAP TSGKAPAPAV AVAAKP