Gene Caul_4008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4008
Symbol
ID	5901470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4338707
End bp	4339804
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	66%
IMG OID	641564529
Product	TonB-dependent receptor plug
Protein accession	YP_001685631
Protein GI	167647968
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4771] Outer membrane receptor for ferrienterochelin and colicins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.139697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGAC TAGCTTATAC GGTGTCGCTG CTTGCGCTGA CGCTCGCCGC CGCGCCCGCC 
GTCGCGCAGA CCAGCGCCGC GCCGGCCGCC GCGACCAATC CACAGGCCGT GACCAATCTG 
GACGAGATCA TCGTCACGGC CACCCGCCGC AGCGAGCGCC TTCAGGACGT TCCGCTCAGC 
GTCACCGCCT TCTCGCAGAC CGAGCTGACC CAGAAGGGCA TCGTCGGCTT CGAGGGCATC 
GCGCGCCAGA CGCCCGGCGT CGTGCTGAAC AAGGCCAGCG ACAACAACGC CCGGTTCACG 
GTCCGGGGCA TCTCCACCAA TGGCTGGGGC GCCGGGCTGC AGACCACCAC CACCATCTAT 
CTCGACGAGC TGCCGCTCAG CACGATCGGC AATACGGTGA CGCTCGATCC CAGTCTGTTC 
GACGTCGAGC GGGTCGAGTT CCTGCGCGGT CCGCAGGGCA CGCTGTTCGG CTCGGGGTCG 
CTGTCGGGCG CGCTGCGCGT CCTGACCAAG AGCCCCGACC TCAAGAACCA CGCCGCGTCC 
GCCCTCATCG ACCTGGGCTA CACGCCGGAT GGCGACGGCG TTCGCCAGCG CTACAACGCC 
ATGGTCAATA TTCCGCTGGT CGAGGACATC CTGGGGCTGC GCGTCGTCGG CTTCTCGCGC 
AACGAGGACG GGTTCGTCGA CAATGTCGGG ACGGGCGCCA AGAATTCCAA CGCGCTGATC 
GACTGGGGCG GCCGCGCGAT CCTGCTGTGG AAGCCGAACG ACCGGCTCAG CATCCGGCTG 
CTGGGGTCCT ACGAGAACAG CGATCCCAGG GACTCTTCGC TGACCTCGCC GTCGTTGGGC 
GACCGCAAGC GCTACAGCAC GATCCCGGAC CAGTACACGT CCAAGACGCG GATCTACAAT 
GGCACGCTCG ACTATCAGTT CGACGGGGCG CGCCTGACCA GCTCATCGAC CTATTCGATC 
GCCGACAGCC TGTTCAATGT CGATCTCGCC GGCACGTTCA ACCTGGCCGT TCCGTTCTAT 
CTCTATGACG GTTTCAAATC GAAGACCTTC GTCCAGGAGA CGCGGCTGGC CTCGGACCCG 
GGCGGCAAGG TCGACTGA

Protein sequence

MSRLAYTVSL LALTLAAAPA VAQTSAAPAA ATNPQAVTNL DEIIVTATRR SERLQDVPLS 
VTAFSQTELT QKGIVGFEGI ARQTPGVVLN KASDNNARFT VRGISTNGWG AGLQTTTTIY 
LDELPLSTIG NTVTLDPSLF DVERVEFLRG PQGTLFGSGS LSGALRVLTK SPDLKNHAAS 
ALIDLGYTPD GDGVRQRYNA MVNIPLVEDI LGLRVVGFSR NEDGFVDNVG TGAKNSNALI 
DWGGRAILLW KPNDRLSIRL LGSYENSDPR DSSLTSPSLG DRKRYSTIPD QYTSKTRIYN 
GTLDYQFDGA RLTSSSTYSI ADSLFNVDLA GTFNLAVPFY LYDGFKSKTF VQETRLASDP 
GGKVD