Gene Caul_3081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3081
Symbol
ID	5900536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3343338
End bp	3344453
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	69%
IMG OID	641563584
Product	RND family efflux transporter MFP subunit
Protein accession	YP_001684706
Protein GI	167647043
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.153012
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGCA GACACTTCTT CCTCGTCGCG GCGGTCGTCG CGGTCCTCCT CATGCTCCTA 
GTTGGCGGGC TGAAGCTCGC CTTCGGCTCC AAGGCGCCGG GAGCGGGGGG ACCTGGCGGC 
GGCGGACGGG CCACGGTTGT TTCGCAGGTT GTCGTCCAGC CACGCGCCTT CACTGACCGT 
GTCGAGGTGC TGGGCGTGGC CAAGGGGCGC CAGTCGGTGA CCATCACCTC CAACACCGCC 
GAACTGATCA CCGCCGTTCA TTTCAGCGAC GGTCAGCTGG TGTCCAAGGG CCAGGTGCTG 
GTCGAACTCA AGGCTGACCA GGAGACCGCC GGCATCGCGG AGGCCCAGGC CCAGCTGGCC 
CAGGCCGAGC GGGAATACGC GCGCTGGAAG ACGCTGGCTG ATCGCGGCGT CGCCCCGCGC 
GCCTCGGCGG AGCAGTACAT GGCCGCCCGC GACACCGCCC GCGCCGCCCT GGCCTCGGCT 
AGCGCTCAGA AGCTGGACAA GGTGATCCGC GCGCCGTTCT CCGGCCGCGT CGGCATCTCG 
GACATCGCGC CGGGCACGCT GATCAGCCCA GGAACCCCGA TCGTCAGCCT CGACGACGTC 
TCGCTGATCC GCGTCGATTT CTCGGTGCCT GACCGCTACT TGCCGATCCT GAGCCAGGGC 
CTGACCATCA GCGCCGCGCC GGACGCCCTG CCGGGCCAGA TCTTCACCGG CCGCATCGCC 
CAGATCGACA CCCGCATCGA CCCGGCCACC CGCGCGATCA AGGCTCGGGC CGAGTTCCCC 
AACGCCGACG GGCGTCTCAA GCCGGGCATG CTGATCAAGG TCGGTATCGA CCAGGGCCAG 
CGTCAGGCCG TGGCGGCGCC TGAGGCGGCG ATTCAGTTCG AGGGAACCCA GGCCTCGGTA 
TTCCTTGTCG CCGACGGACC CAAGGGCAAG ATCGCCCGTC GCACCACGGT GCAGACGGGG 
TTGTCGTCGG GCGGCTATGT CGAGATCGTC TCGGGTCTTA AGGCCGGCGA CAGGATCGTC 
GCCGATGGTC TCAACCGGGT GCGGGACGGC GCGCCGATCG GCGCTGGCGG TGCGGGCGGC 
GCTCAAAAGG GCGGCAACCA GAAGAAGGCC GGCTGA

Protein sequence

MIRRHFFLVA AVVAVLLMLL VGGLKLAFGS KAPGAGGPGG GGRATVVSQV VVQPRAFTDR 
VEVLGVAKGR QSVTITSNTA ELITAVHFSD GQLVSKGQVL VELKADQETA GIAEAQAQLA 
QAEREYARWK TLADRGVAPR ASAEQYMAAR DTARAALASA SAQKLDKVIR APFSGRVGIS 
DIAPGTLISP GTPIVSLDDV SLIRVDFSVP DRYLPILSQG LTISAAPDAL PGQIFTGRIA 
QIDTRIDPAT RAIKARAEFP NADGRLKPGM LIKVGIDQGQ RQAVAAPEAA IQFEGTQASV 
FLVADGPKGK IARRTTVQTG LSSGGYVEIV SGLKAGDRIV ADGLNRVRDG APIGAGGAGG 
AQKGGNQKKA G