Gene Caul_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1941
Symbol
ID	5899396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2081178
End bp	2083208
Gene Length	2031 bp
Protein Length	676 aa
Translation table	11
GC content	64%
IMG OID	641562431
Product	TonB-dependent receptor
Protein accession	YP_001683568
Protein GI	167645905
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.891675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTGAAA GTCACACGAT CACGACCGGC ACGGACCTGC AGAAACTGAT CCCCACCCTG 
AACGTCGGCG TCAGCATCTT TGGCGGCACG CAACAGTTCT CGCTTCGGGG CGTGCGCACC 
GGCGTGGTCA GCTACCTGAA CGAAGTGCCG GTCGACGGCG TGCTCGCCGA CCAGATGCTG 
TGGGACCTGT CGTCCATCCA AGCGATCTCG GGACCGCAAG GGACGCTGTT TGGCAAGAAC 
AGCACCGGCG GCGCCGTCCT GTTCGTCCCC AATCAGCCCG GCGAAGAGTT CGAGGGTTAT 
GTCGAAGGCC GCCTCGGCAG GTTCAATCTG CGCGAAGGCA CCGCGGTCGT GAACCTTCCG 
GTCAATGACA AGCTGGCCCT ACGCATCGGC GCCCGCGTGA CGAAGCGCGA CGGGATCATC 
GACAATCTGA CCGGCCCGGA CCTGCAGGCG CAGGACCACC GATCGCTGCG GGTGTCGGCG 
CTGTTCAAGC CCAACGCCGT CCTGACCAAC TACACCACGT TCAACTACGC CCATCGGGAC 
GACACGCCCT ACGCCCAGAT CAGCGGATCG GGCGCTGGCA CGCCCAGCTG CCCCACCGCC 
CTGCCCGCCT GCGTCTATGG CGCAAGCTAC GCCAACGAGC TGGCCGCCCA GCGCGCCCGC 
GGTATCCGGA CCGTGTCGAT CCCGCTGGAC GCCAGCCAGT CCGCCTCGCC CTGGCAGCTG 
ACCAACGTGC TGAGCGGACA CTTTGGCGCG GTGACCGCCA AGTACATCTT CGGCTATCAG 
AAGAACAAGG ACCGCCAGTT CACCAGCCAG CTTTCGATCC CGCTGCCGGT CATCATCGGC 
CTGAACCAGA ACAGGACCAG CCTGAAGACG CGCGAGTTCC AGCTTCTGGG CAGTGCCTTT 
ACCGAACGGC TCACCTGGGT CGCGGGGCTG TACGCGTCCG ACAGCGACGT GAACAACTTC 
AACAGCTATC TGCTGTTCGC TCCGGTCGGC ACCCCGCACA ACAACAACAC CACCCAGCAG 
ACCGGTGGCA ATACGACGAC GGATTCCAAG GCCGCCTACG CCCAGGGCAC CTTGGCCGTG 
ACCGACCGGT TCAACGTGAC CGTGGGCGCC CGGTACACCC AGGATGACGT GAAGACGGCC 
CAGTTCGGCT ACAGCCCCGG GCACGTCTGC AACCTTCCGG CCGCCCTGCC CAGCGTCAAC 
ATCGCGACCT GCACCCAGCG GATCGCGGCC AAGACCGATG CGGTGACCTA CAACCTGTCG 
GCGGATTTCA AGGTGTCCGA CGACGTCCTG CTCTATGCGA CCACGCGCAA GGGCTACAAC 
GCCGGCGGCT TCAATCCGAA CATCAACGAC GCCGATCTGG AAGTCGTCAG GCCCGAGTAC 
ATCACCGACT ACGAAGGGGG CCTGAAGGCC GACTGGAGCC TGGGCGGCAT GCCGGTCCGG 
ACCAACATCT CGACCTTCTA CGCCAAGTAC AAGGACATCC AGCGCACCAC CTCGCTGGTG 
TTCGACAACT TGATCGTCAC CGGCAATTTC AACGCCGCCA AGGCGACGAT CTACGGCGCC 
CAGATCGAGA TCCTGGCCCG TCCGGTCGAG CCGCTGACGC TGCAAGCGTC CTATGGCTAT 
CTGCACACCA AGTATGACAG CTTCCAGAAC GCCCTGCTGG GCGACGTCAC CGGCAACAGC 
TTCGCCCAGG CGCCGGAGGA CACGCTCAAT GTCTCGGCGA CCTACCGCCA TGCCTTGCCG 
TCCGGCGAAC TCGTCGCCAA CGTCAGCTAC GCCTATATCA GCAAGGTCGC CTACTCCGAC 
GACAACCTGA CGACGCCCGG CAATATCGCG CCGGGCTACG GCCTGGTCGA TGCCCGACTG 
GACTGGAAGA AGGTCGGCGG CAGCGCCGTC GACCTGGGCG TCTACGTCAA GAACGCGACG 
GACAAGGAAT ACCTTCTCAA CACCACCGAC CGGACCGGCC GGTTCGGCTT CGACTCCCGG 
GTCTATGGCG ACCCCCGGAC CTTCGGTGTC GAGATCCGCT ACTCATTCTA A

Protein sequence

MLESHTITTG TDLQKLIPTL NVGVSIFGGT QQFSLRGVRT GVVSYLNEVP VDGVLADQML 
WDLSSIQAIS GPQGTLFGKN STGGAVLFVP NQPGEEFEGY VEGRLGRFNL REGTAVVNLP 
VNDKLALRIG ARVTKRDGII DNLTGPDLQA QDHRSLRVSA LFKPNAVLTN YTTFNYAHRD 
DTPYAQISGS GAGTPSCPTA LPACVYGASY ANELAAQRAR GIRTVSIPLD ASQSASPWQL 
TNVLSGHFGA VTAKYIFGYQ KNKDRQFTSQ LSIPLPVIIG LNQNRTSLKT REFQLLGSAF 
TERLTWVAGL YASDSDVNNF NSYLLFAPVG TPHNNNTTQQ TGGNTTTDSK AAYAQGTLAV 
TDRFNVTVGA RYTQDDVKTA QFGYSPGHVC NLPAALPSVN IATCTQRIAA KTDAVTYNLS 
ADFKVSDDVL LYATTRKGYN AGGFNPNIND ADLEVVRPEY ITDYEGGLKA DWSLGGMPVR 
TNISTFYAKY KDIQRTTSLV FDNLIVTGNF NAAKATIYGA QIEILARPVE PLTLQASYGY 
LHTKYDSFQN ALLGDVTGNS FAQAPEDTLN VSATYRHALP SGELVANVSY AYISKVAYSD 
DNLTTPGNIA PGYGLVDARL DWKKVGGSAV DLGVYVKNAT DKEYLLNTTD RTGRFGFDSR 
VYGDPRTFGV EIRYSF