Gene Caul_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1474
Symbol
ID	5898929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1566281
End bp	1568428
Gene Length	2148 bp
Protein Length	715 aa
Translation table	11
GC content	68%
IMG OID	641561961
Product	TonB-dependent siderophore receptor
Protein accession	YP_001683102
Protein GI	167645439
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4773] Outer membrane receptor for ferric coprogen and ferric-rhodotorulic acid
TIGRFAM ID	[TIGR01783] TonB-dependent siderophore receptor

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.052337
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTCCA AAGCCCTGCT GCTCGCCCTG CTGGCGACCG CCGTTCCGTT GTACGCGATG 
GCGGCGGACG CCCCGGCCGA CGACAAGACC TCGGTGGACG GCGTCACCGT CACCGCCCGC 
GCCCACGACA CCGTCGGCTC GACCGGCAGC AAGCTGGCCA CGCCCCTGGT CGATACCCCG 
CAGTCGGTGG CGGTGATCAC CGGCGAGCGC ATCGACCAAC TGGGCCTGCA GTCGCTGAAC 
CAGGCGCTGC GCTACACCGC CGGCGTCACG CCCGAGACCC GCGGCGGCGT GGTCACCCGC 
TACGACCAGT TCAAGCTGCG CGGCTTCGAC GTCAACGCCA CCTTCCTGGA CGGCCTGAGC 
AACCTCTATC CGGGCTGGTA CGCCGACGCC CAGGTCGACG CCTCGACCGT CGACCGCATC 
GAGATCCTCA AGGGCCCGGC CTCGGTGCTC TACGGCAACT CGCCCCCCGG CGGCCTGATC 
AACTATGTCA GCAAGACCCC CAGGGAGGTC GCGGGCGGCG AGATCGAGGT GCGGGCGGGT 
AACAACAAGC TGGTCGAGGC GTCGATCGAC ACCACCGGCC CGATCGCCGG CGACACGCGC 
TACACCTACC GCCTTGTGGC CATGGCCCGT CAGGGCGACG GCCAGGCCGT GACCACCGAG 
CACCAGCGCT ATGTGGTCGC TCCGTCCTTC ACCTGGCGCC CGGACGAGGC CACGACCGTG 
ACCGTTCTGG GCCGCTACCA GCACGATCCC AAGGCGGCCA GCTATGGCGG CGCGCCCTCG 
GAGGGCTCGG CGTTCAAGAA CCCGCTGGGC CAGCTGCAGC CCGACTTCTA CGACGGCGAC 
CCGAACTTCG AGGCCTACAA CCGCACCCAG GCCACCATCG GCTATCTGGC CGAGCACAGG 
TTCAACGACA TCTTCGCCGT CCACCAGAAC CTTCGCTACA GCCGCGTCGA GAGCAATTAC 
GAGTCGGTCT ACGCCACGGG CCTGGACGCC AACGACCGCA CCCTGCACCG CGCCACCGCC 
GCCTCGCTGG AGAGCGTCGA CGGCTTCGTG GTCGACAACC AAGCCAGCGC CCACTTCACG 
ACCAGCGCCT TGACCCACGA CGTGCTGTTG GGCCTGGACT ACCAGCACGC CATGGCCAAG 
GTGCGGTCCG GTTTCGGCGC CGCGCCGGAC CTGGACATCT TCGCCCCGGT CTATGGTCAG 
CCGATCATCG ATCCACGCGG CGACCCGACG GCCTATCGGT CGGACATGCG CATCAAGCAG 
GAGCAGACCG GCCTCTATCT CCAGGACCAG ATCAAGCTGG ACAAGCTGAT CGTGCTGGTC 
GGCGTGCGCC GCGACAGCCT CAAGCAGGAC ACCACGACCC TGGGAGCCTT CGGCGCCACG 
ACGGTGATCG ATCAGGATCA CGCCAGCGGT CGCGTCGGCA TGCTCTATCA CTTCGACAGC 
GGCTTCGCGC CCTATGTCAG CTGGTCGCAG TCGTTCGAGC CCCAGGGCCC TTACGGCACG 
CGCACCTTCA AGCCCATCAC CGGCGACCAG ATCGAGGCCG GCGTGAAGTA CGAGTCGCCG 
GACAAGAAGA TCTACGCGAC CCTGGCCGCC TTCGAGCTGA AGCGCCAGGA CGTGCTGTCG 
CCCGATCCGG CCAACACCAA CGAGAGCATC CAGGGCGGCG AGGTGCGCTC GCGCGGCGTC 
GAGTTCGAGG GGCGCGCCAA GCTGACCTCG CAGCTGTCGC TGTCGGGCGC GGCGACCTGG 
CTCGACGTCG AGAACACCAA GGACATGCTC GCCACCGCGG ACTACGTCAC CTACTTCAAC 
CTGAAGGGCC GCGCGCCGGT CGGCGTGGCC AAGAAGACCG CCTCGGTGTT CGCCGACTAC 
GACTTCGACG GCGGCTTGGC CGGCCTCGGC GTCGGCGCCG GCGTGCGTTA TGTCGGCTCC 
AGCTGGGGCA ACCCGATCAA CAGCTTCAAG GCCCCGGCCT ACACCCTGGT CGACATGAGC 
CTGAGCTACG ACCTGGGCCA GATGAGCGAG GGCCTGAAGG GCTGGAAGGC CATGGCCAGC 
GCCACCAACC TGTTCGACAA GCGCTATGTC TCGTCCTGCT ATTCCGACGC CTGGTGCTGG 
TTCGGCGCCC AGCGCTCGGT GCAGGTCGGC CTCAAGCGCA GCTGGTAG

Protein sequence

MKSKALLLAL LATAVPLYAM AADAPADDKT SVDGVTVTAR AHDTVGSTGS KLATPLVDTP 
QSVAVITGER IDQLGLQSLN QALRYTAGVT PETRGGVVTR YDQFKLRGFD VNATFLDGLS 
NLYPGWYADA QVDASTVDRI EILKGPASVL YGNSPPGGLI NYVSKTPREV AGGEIEVRAG 
NNKLVEASID TTGPIAGDTR YTYRLVAMAR QGDGQAVTTE HQRYVVAPSF TWRPDEATTV 
TVLGRYQHDP KAASYGGAPS EGSAFKNPLG QLQPDFYDGD PNFEAYNRTQ ATIGYLAEHR 
FNDIFAVHQN LRYSRVESNY ESVYATGLDA NDRTLHRATA ASLESVDGFV VDNQASAHFT 
TSALTHDVLL GLDYQHAMAK VRSGFGAAPD LDIFAPVYGQ PIIDPRGDPT AYRSDMRIKQ 
EQTGLYLQDQ IKLDKLIVLV GVRRDSLKQD TTTLGAFGAT TVIDQDHASG RVGMLYHFDS 
GFAPYVSWSQ SFEPQGPYGT RTFKPITGDQ IEAGVKYESP DKKIYATLAA FELKRQDVLS 
PDPANTNESI QGGEVRSRGV EFEGRAKLTS QLSLSGAATW LDVENTKDML ATADYVTYFN 
LKGRAPVGVA KKTASVFADY DFDGGLAGLG VGAGVRYVGS SWGNPINSFK APAYTLVDMS 
LSYDLGQMSE GLKGWKAMAS ATNLFDKRYV SSCYSDAWCW FGAQRSVQVG LKRSW