Gene Caul_4751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4751
Symbol
ID	5902213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5136028
End bp	5138415
Gene Length	2388 bp
Protein Length	795 aa
Translation table	11
GC content	66%
IMG OID	641565270
Product	TonB-dependent receptor
Protein accession	YP_001686369
Protein GI	167648706
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0405819
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTTG AGATCCATCG CCCGCGCGCG CGTCGCGCGC TGCTGGCCGC GACTTCGCTG 
GTCGCCGTCG TCGCCTTGCC CATGTTGGCC AGCGCCCAGG ATCGGTCGGA CACCGTCGAG 
GAGCTGATCG TCACCGCCAC CAAGCGCGAC GCGACCATTC TGGATGTGCC GTTCTCGATC 
AACGCCCAGA CCGAGGCCGA CATTCAGAAG TCTGGCGCGG TCACCCTCGA GGACCTGTCG 
CGCAACGTCG CGGGCCTGAC GATCCAGAAC CTCGGCCCCG GCCAGAGCCA AGTGTCGGTG 
CGCGGCGTCT CGGCCGGCCA GGTGGTCCGC GACCAGCCGG GCGTGAAGGA GCAGGTCGGG 
GTCTATCTCG ACGAGTCGGT GATCTCGCTG TCGCTGTTCA CCCCCGACAT CGACCTGTTC 
GACCTCAACC GGGTCGAGAC CTTGCGCGGC CCGCAGGGCA CGCTGTTCGG CTCCGGTTCG 
GTGGGCGGCA CGATCCGCTA CATCACCAAC CAGCCCGTGA TCGGCGACTA TAAGGGTACT 
GTCGAGGCCA ATCTCAACAC CCTGAAGGGC GGCGACGTGG GCGGCTACGT CAAGGGCGCG 
GTCAATATCC CCGTCTCGGA CAAGGTCGCG TTGCGGGCGG TCGGCTATGA CACCGAATAC 
GGCGGCTTCG TCGACGCCCT GGGCGAGGGC GGGACCAAGA AGAACAACGT CAACGACGGC 
TATCGTCGCG GCGGCCGGCT GTCGTTGCTG TTCAAGCCGA CCGACGACAT CAAGATCACC 
CCGCGCGTCG TCTATCAGAA GATCCACGCC GGCGGCTTCA ACCGCCAGGA AGCCTTCAAC 
CTGTTCGCCA ACCCCTACAC CACCACCCGG CCGGCGATCA CCCTGGGCGA GCGCCAGCAG 
TACCTGCTGC TCGACGAGAG CTTCGACGAC AAGACCTTCC TGGCCGACCT GACCGCCGCG 
TTCGCCTTCG ACGGCGTCGA ACTGACCTCG GTGACCAGCT ATATCGACCG CAAGATCGAC 
GTGAACCGCG ACGCCAGCGC CCTGACCGGC AGCGTCTCGG TGGACCTGGG CTTCCCGGCC 
GCCGCCGTCA CCTTGCCCTC GAAACTGGTC GACACCACGG ACCTGGAACA GTTCACCCAG 
GAAGTGCGCC TGGGCTCGCG AACCGACAGC CCGTTCCAGT GGGTGGTTGG CGCGTTCTAT 
TCCAAGGTCG ACCGGGTCTA TAACCAGCGC CTGCCGACGC CGGGCTACGA CGCCTATACC 
GACGCCACGC TGGGGGCCGG AACCTCGGCG CAAGTGGCCA ACGGCTTCCC GGCCAATTCG 
CCCTACAACG CGTCCCTGCC CTACAACATC AAGCAGAAGG CGGTGTTCGG CGAAGCCAGC 
TACGAGATCG ACAAGCTGAC CGTGACGGCC GGCGGCCGCT ATTACGACTT CAAGGAAAAC 
CGCCGCTTCA CGTCGGGCGG CCTGTTCGCC AATGGCGACG ACCAGACCGA CAAGACCTCG 
TCGGATGGCT TCACCCCGCG CCTGCTGGTC AGCTATAAGG CCAATCCGGG CCTGACCTTC 
AACGCCCAGG CGTCCAAGGG TTTCCGATTG GGCGGGGTCA ATGATCCGCT GAACATCCCC 
CTCTGCACCC CGCAGGACGC GGCGATCTTC GGCGGCTTCC AGTCCTATGA CGACGAGACG 
CTGTGGAACT ACGAGGGCGG GGTGAAGTCG CGGTTCGGCG GCGTCACCTT CAACGGCGCC 
GTGTTCTATA CCGACATCAA GAATCTGCAG ACGACGCTCG ACGCCGGCTC GTGTTCGTCG 
CGCGTGGTGT TCAACGTGCC CAAGGCCCAC ACCAAGGGCA TCGAGGGCGA GCTCACGGCC 
CACCCGGCGC CGGGCCTCCA ACTCGGCGTT TCGGGGAGCC TGCTGGAGGC CGAATTCGAC 
TCCACGGTGA GGGATGGCGC GGGCGCGGTG ATCGGCGGGA TCCGCGAGGG CAACCGCCTG 
CCCTCGGTGC CCAAGTTCCA AATCTCGATC AACGCCACCT ACACGCGGAC CCTGACGGCT 
GCCATGGACG GCTATGTCAC CGCGTCGTTC CAGCACGTCG GCAACCGCTA CACCCAGGCC 
AGCGACCAGG AGAATAATCC GCGCGCCTTC GTCTCCGGCT TGCCGTTCGG CGGGGCGACG 
GGAACCCAGG CCACGGTTCT AGACCTGCAA CTGCCCAGCT ACGACCTGGT CAATCTCAGC 
GCCGGCCTGC AGATGGACAG CGGCCTGGAC GTGATCGCCT ACGTCAACAA CGTGTTCGAC 
GAGAACCCGC TGCTGTCGTT CGACCGCGAA CGCGGCGGCC GGGCGCGCCT GGGCTATGCG 
ATCGGCCAGC CGCGCGTCAT CGGCCTGACG GTGCGGCAGT CGTTCTAG

Protein sequence

MRLEIHRPRA RRALLAATSL VAVVALPMLA SAQDRSDTVE ELIVTATKRD ATILDVPFSI 
NAQTEADIQK SGAVTLEDLS RNVAGLTIQN LGPGQSQVSV RGVSAGQVVR DQPGVKEQVG 
VYLDESVISL SLFTPDIDLF DLNRVETLRG PQGTLFGSGS VGGTIRYITN QPVIGDYKGT 
VEANLNTLKG GDVGGYVKGA VNIPVSDKVA LRAVGYDTEY GGFVDALGEG GTKKNNVNDG 
YRRGGRLSLL FKPTDDIKIT PRVVYQKIHA GGFNRQEAFN LFANPYTTTR PAITLGERQQ 
YLLLDESFDD KTFLADLTAA FAFDGVELTS VTSYIDRKID VNRDASALTG SVSVDLGFPA 
AAVTLPSKLV DTTDLEQFTQ EVRLGSRTDS PFQWVVGAFY SKVDRVYNQR LPTPGYDAYT 
DATLGAGTSA QVANGFPANS PYNASLPYNI KQKAVFGEAS YEIDKLTVTA GGRYYDFKEN 
RRFTSGGLFA NGDDQTDKTS SDGFTPRLLV SYKANPGLTF NAQASKGFRL GGVNDPLNIP 
LCTPQDAAIF GGFQSYDDET LWNYEGGVKS RFGGVTFNGA VFYTDIKNLQ TTLDAGSCSS 
RVVFNVPKAH TKGIEGELTA HPAPGLQLGV SGSLLEAEFD STVRDGAGAV IGGIREGNRL 
PSVPKFQISI NATYTRTLTA AMDGYVTASF QHVGNRYTQA SDQENNPRAF VSGLPFGGAT 
GTQATVLDLQ LPSYDLVNLS AGLQMDSGLD VIAYVNNVFD ENPLLSFDRE RGGRARLGYA 
IGQPRVIGLT VRQSF