Gene Caul_3067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3067
Symbol
ID	5902559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3328938
End bp	3331649
Gene Length	2712 bp
Protein Length	903 aa
Translation table	11
GC content	64%
IMG OID	641563570
Product	TonB-dependent receptor
Protein accession	YP_001684692
Protein GI	167647029
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.171951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCGA ACGCCGCGCA CGACCGTGTC CGCGCCTCAG CCGACGGCGC CACGCCCCGT 
CAGGCCGTCG CCATACCGCT CAACCCAAAA TCGGGATCGC TGGCCAACCG CGACATCGCG 
GTTCGACCGC GTGAGCCCGT CGCCGCCTCG CGCGCGAACC GAAACACAAG AACAAGCTCC 
AGGGAGAATA ACGTGAAGAA GGTGCATTTT GTCGGGGCGT CGTTGCTCGC TCTGATCGTC 
GCGGGTCCGG CCCTGGCGCA AACTCCGGCG GCTCAGCCGT CCTCCGCCTC GACCGTCGAA 
GAGATCATCG TCACGGCGAC CAAGCGCGAG CAAACCCTGC AGGACGTGCC GATCTCGGTG 
GCCGTGACGG GCCAGAAGAC CATCGAGCGC GCCCAGATCC GCGATCTGAT CGACCTGCAA 
TCGGTCGTGC CGTCGCTGAA GGTTTCGCAG TTCAACGCAG TCGGTCAGAC CAACTTCGTG 
ATCCGGGGCT TCGGCAACGG CAACGGCAAC GACGGTATCG AAAGCTCGGT CGGCGTGTTC 
ATCGATGGCG TCTATCGCTC GCGGTCGGCC TCGGCCCTAG ACGACCTGCC TGAAGTCGAG 
CGCATTGAAG TGCTGCGCGG TCCGCAGTCC ACCCTGTTCG GCAAGAACGT GTCGGCCGGC 
GCGATCAGCA TCGTGACCAA GCGTCCGCAA TTCGATTTTG GCGGCAAGGC CGAGGTCACC 
CTCGGCAACT ACGATCAGCG CCAGCTCAAG GGCACCGTCA CCGGGCCGCT GAGCGACACG 
GTCGCCGTGC GCCTGTCGGG CAGCGTCAAC AAGCGCGACG GCTATGCCAA CAACGTCACC 
ACCGGCAACG ACGTCAACAA CCGCGATCGC TGGTCGATCC GCGGCGACGT GCTTTGGGTT 
CCGACCGACC AGACGTCCGT CCGCATCATC GCCGACTACA ACAAGATCAC CGAAATCTGC 
TGCGCCGTCG CCTCGATCTA CAACGGTCCC GCCACCCAGT TCATCGGCGC GCCGGCGCCC 
TTCGGCCTGG GCAAGCCTGT TGGTAATCCC GCCAAGATCT TCGATCGCGA CGTGATCTTC 
AATACCGACC CCACCAATCG TCTGACGGGC AAGGGGATTT CCGGCCAGGT CGATCAAGAC 
CTGAGCGTCG GCAAGCTGAC CGCGATCACC GCCTATCGCG AGCAGACCAG CGCTTCGTTC 
CAGGACGTCG ATTTCACCGG CGGCGATCTG GCCAACAAGG GCGATGGCAA CACCATCAAG 
ACCTTCACTC AGGAACTCCG CCTGGCCTCG AACGGCGATG GACCGTTCAA TTGGCTGATC 
GGCGGCTTCT ACCAGGACGA AAAGCTCGAT ACGGGCCGCA CGATCAACTA CGGATCCGAC 
ATCCGCGCCT ATGCCGAAGG CCTGAGCGGT CAAGTCCCCG CGGCCCTGCT CTCAGCCCTG 
CCGGTGGCGC TCCGTCCGGC CCTGACGGGC AAGTCCAATC TCTATGCGCT GGAGTTCCTG 
CAGAGCCTGG TCACGCCGTC GATCGTTCCC GGCAAGACCT ACTTCCAAGC CGGCCAAGGC 
ATCGACGACG ACTATGCGAT GAAGCAACGG TCGTACTCGC TGTTTGGCCA GGCCGACTAC 
AGGATCACCG ACAAATTGAC GGTCACCGGT GGCTTGGCCT ACCTGAACGA CCGCAAGCGC 
GTGGCGTCGA ACGTGGTCCT ACGCGACCCG TTCTCGGCCT TGAATCTGCA GAACGTGCCG 
CAGCTCACCG CCCTGGGCTT GCCGGGCAAT CTGTACGGAG CCCTGGGCGG CCTACAATTC 
TACTATGGCA ACTCGCCGAC CCACGGCCCG GTCAACTTCC CGAACGTCAA CGAGTCCGGC 
GAACTCAAGG GCGACAAGGT CACCTACGCC GTTCGCGCCG CCTACGATTT CGGCTGGGTC 
AACGCCTATG TCAGCTATTC GACGGGCTGG AAGGCGGGGG CCTACAATCT GTCGTCCGAT 
AGCCGTCCGC CGAACGCCAA CGGGGTGGGC CGCACGGCTG CGCCGGAGGA TGTCAGCGTT 
TACGAGGCCG GCCTGAAGGC CAACTTCCAG GGGGGCTACC TGAACCTCGC GGTCTTCGAT 
CAATCGATCA AGGGCTTCCA GTCGAACGCC TATACCGGCA TCGGCTACAG CCTGGTCAAT 
GCCGGCGAGG AGTCGGTGAA GGGCTTTGAG GTCGACAGCG CCTACAAGCC GGCCGACTGG 
CTGGCCCTGA CCGCCGCGGC CACGTATCTG GATCCGACAT ATGACTCGTT CACCGGCGCC 
GCCTGCGTGA ACTACGACAC CGCCCGCTGC CCGGTGAACC CGGCCACCGG TCTGCGCCCC 
AATTTCCGCG ACCTGACCGG CGACCGTCCG GCCGCCATTC CCAAGTGGAG CCTATCGACC 
TCGGCCACCG TCTCGCACGA CCTGGGCAAG GGCTACGGCG GCTACCTGCG CGTCGAGTAT 
GACTACGCTA GCAAGACTCA GTTGACCGAG ACGACGCCGC CGAACCTGTC GACCTGGGGC 
CAGAGCATCG TCAACGCCAG CCTGGGCGTG ACCAATGACG CCCATCAACT GGAAGTCATG 
CTCTGGGGAC GCAACCTCGC CAACGACGAA AGCCTTATCG CGACCTTTCC GACCGTGGCC 
CAGGATGGCA GCTACAGCGG CTACCCCACC GCGCCGCGCA CCTACGGCGT GACGCTGCGC 
AAGACGTTCT AG

Protein sequence

MAANAAHDRV RASADGATPR QAVAIPLNPK SGSLANRDIA VRPREPVAAS RANRNTRTSS 
RENNVKKVHF VGASLLALIV AGPALAQTPA AQPSSASTVE EIIVTATKRE QTLQDVPISV 
AVTGQKTIER AQIRDLIDLQ SVVPSLKVSQ FNAVGQTNFV IRGFGNGNGN DGIESSVGVF 
IDGVYRSRSA SALDDLPEVE RIEVLRGPQS TLFGKNVSAG AISIVTKRPQ FDFGGKAEVT 
LGNYDQRQLK GTVTGPLSDT VAVRLSGSVN KRDGYANNVT TGNDVNNRDR WSIRGDVLWV 
PTDQTSVRII ADYNKITEIC CAVASIYNGP ATQFIGAPAP FGLGKPVGNP AKIFDRDVIF 
NTDPTNRLTG KGISGQVDQD LSVGKLTAIT AYREQTSASF QDVDFTGGDL ANKGDGNTIK 
TFTQELRLAS NGDGPFNWLI GGFYQDEKLD TGRTINYGSD IRAYAEGLSG QVPAALLSAL 
PVALRPALTG KSNLYALEFL QSLVTPSIVP GKTYFQAGQG IDDDYAMKQR SYSLFGQADY 
RITDKLTVTG GLAYLNDRKR VASNVVLRDP FSALNLQNVP QLTALGLPGN LYGALGGLQF 
YYGNSPTHGP VNFPNVNESG ELKGDKVTYA VRAAYDFGWV NAYVSYSTGW KAGAYNLSSD 
SRPPNANGVG RTAAPEDVSV YEAGLKANFQ GGYLNLAVFD QSIKGFQSNA YTGIGYSLVN 
AGEESVKGFE VDSAYKPADW LALTAAATYL DPTYDSFTGA ACVNYDTARC PVNPATGLRP 
NFRDLTGDRP AAIPKWSLST SATVSHDLGK GYGGYLRVEY DYASKTQLTE TTPPNLSTWG 
QSIVNASLGV TNDAHQLEVM LWGRNLANDE SLIATFPTVA QDGSYSGYPT APRTYGVTLR 
KTF