Gene Caul_1679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1679
Symbol
ID	5899134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1767193
End bp	1768422
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	68%
IMG OID	641562169
Product	permease YjgP/YjgQ family protein
Protein accession	YP_001683306
Protein GI	167645643
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.164561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.58926
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAAAC CCATCCCTAT TCCGCACGGC TCCGGGCGCT TTCGCCTGAT CGACGCCTAT 
CTGCTGCGCC TGCTGGTCTG GCCGATCGTC GGCTGCCTGG GCGTGACGGT GATCGCCCTG 
CTGCTGGAGC GGGTCTTGCG CCTGCTGGAC GTGCTGTCGC AGAGCAGCGC TCGCTTTGGC 
TATGTCACCT CGCTGGCCGC CAATCTGGTG CCGCACTATC TGGGCCTGGC CCTGCCGGTG 
GCCTTCTTCG TGGCGCTGTT CATCGTCATC ACCAAGCTCA GCGACGGCTC GGAGATCGAC 
GCCCTGCTGG CCAGCGGCCA GTCCCTGACC CGCATCGCCG CGCCGTTCGT CTCTGTCGGC 
GTGTTCCTGA TGGTCTTCAG CCTGATCGTC TTCGGGTACA TGCAGCCCTA CAGCCGCTAC 
GCCTATCGCG CCGTGATGCA CGAGGCGATC AACGCCGGCT GGAACGGCAA GCTCAACGGC 
GGGTCGTTCA TCGACGAGCC CAAGCTGCTG ATGACCGCCG ACGACGCGGA CGCCGCCGGC 
CAGCAGTTGA AGCGGGTGTT CATCCGCCGT CTCGACGTCA ATGGCAACGA GGAGGTGATC 
ACCGCCGCCA CCGCCGATCT GCGGGCCGAC CATGACGCCA AGTCCGTCAC CATGCTGCTG 
CGCAACGGCC AGCGGATCGG GGTCGACGCC CGCGGCGCCT ATCGCACCCT GATGTTCGAC 
CAGTTGACCA CCCAGGTTCC CCTGGCCGGC GCCGCCGCCC TGTTGCGGGC GCGCGGCGGC 
GACGAGCGCG AACTGACCCT GGGCGAGCTG GCGAGGCAGG CCAATACGCC CAACTCGGTC 
GTGCCGCGCG CCACCCTGCT GGCCGAGCTC TACGGACGGC TGGCCCGGGC GCTGTTCCTG 
CCCTTCCTGC CGCTGCTGGC CTTCCCGCTC GGTCTGGCGG CCAAGCGCGG CAACCGCACG 
CCCGGCCTGA TCATCGCCGG CGTCCTGCTA TTGGCCTTCC AGCACAGCCT GCAGCTGGGT 
CAGAGTCTGG CGGAATCCGG CAAGGCCATG CCCCTGGCGG CGATCGGGAC GCCGTGGCTG 
ATCTTCACCG GTCTCAGCCT CTGGATGTTC ATCGGCAGCC GCAAGCGGCC CGGCCAGACC 
CCGGTCACCG AGATGATCCG GCGGTTCGGG ATCGGCATCA AGCGCTTCCG CCGCATGTTC 
CGGGACAAGT TCGAGCAGGC CGAGGCATGA

Protein sequence

MKKPIPIPHG SGRFRLIDAY LLRLLVWPIV GCLGVTVIAL LLERVLRLLD VLSQSSARFG 
YVTSLAANLV PHYLGLALPV AFFVALFIVI TKLSDGSEID ALLASGQSLT RIAAPFVSVG 
VFLMVFSLIV FGYMQPYSRY AYRAVMHEAI NAGWNGKLNG GSFIDEPKLL MTADDADAAG 
QQLKRVFIRR LDVNGNEEVI TAATADLRAD HDAKSVTMLL RNGQRIGVDA RGAYRTLMFD 
QLTTQVPLAG AAALLRARGG DERELTLGEL ARQANTPNSV VPRATLLAEL YGRLARALFL 
PFLPLLAFPL GLAAKRGNRT PGLIIAGVLL LAFQHSLQLG QSLAESGKAM PLAAIGTPWL 
IFTGLSLWMF IGSRKRPGQT PVTEMIRRFG IGIKRFRRMF RDKFEQAEA