Gene Caul_3206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3206
Symbol
ID	5900661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3465947
End bp	3467374
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	71%
IMG OID	641563711
Product	TAP domain-containing protein
Protein accession	YP_001684831
Protein GI	167647168
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.812713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGGAT GGATGCTGGC GGCCGGATTG GCGGCGGGAA CCTGGCTGGC GGCGACCAGC 
GCCCAGGCCG CCGAGCCGAA ATTCACCCCC GGCCCCTGCG CCGGCGACTA CAGCGGCGTC 
AGCAACAGGA TCGAGTGCGG GACGCTGGTG GTCGACGAGA CCCGCGGCGG ACCCAGCACG 
CGGCGCGTCG CCCTGCCGGT GACCATCGTC AAGGCCAGCG CCCCCAAGCC CGGCGCCGTG 
CCGGTCATCT ATCTGCACGG CGGTCCCGGC GGCGGCGTGG TCGAGGCCCT CGGCCGATCC 
TTGCGCGGCG CGGCCGGCCG GGAACTGATC GCCATCGACC AGGACTGGAT CTATTTCGAC 
CAGCGCGGCG GCGGTGTGGC CTCGCCGATC CTCGACTGCG GCGCGGTGGC CCTGAACGAC 
GCCGGCCCGC TGAACGACGC CGCCGCCCAG CAACTGATCG CTTGCGGTCG GCGGCTGAAA 
GCCTCGGGCG TCGACCTGTC GCGCTACAAC GCCGAGGAGG TGGCCAAGGA CATCCAGGAC 
CTGCGCAAGA CCCTGGGCCT CAAGCAGATC GACCTGTTCG GCGTGTCCTA CGGCACCCGC 
ATCGCCCTGG CCGTGGTCAA GCATCAGCCG CGAGGCGTCC GCGCCGTGGT CCTCGACTCG 
CCCTGGACGC CGGAGGCCAA GTGGGCCGAG GGCGGACCGG AGATGGTGTC GGACGCCGTG 
AAGGAGATCT TCAAGCGCTG CGCGGCCGAC GCCGCCTGCA ACGCCAAATA TCCCCATCCC 
GCCGCCGACC TCGACGCCGT CGCCGACACG CTGCTGAGCG GCCCGCAAGA GATCGGCGGC 
AAGGTCTACG CCGCCGACGA CCTGGGCGGC TTCCTGATGG ACGCGGCCTA TAGCGGCCCC 
GACGCCCGCG CTTTGCCCGC CACGGTGGCC AGGTTCGCGG CCGGCGACAT GACCGCCCTG 
GCCCAACAGA TGGAGGGTCG CAGCGGCTAC AACGAGGCCC AGCACCTGAC TCATCTGTGC 
AAGGAGGAGT TCCCGTTCGA GAGCGAGGCG GCGATGCGCA AGGGGGCTGG GCGCGACTCC 
GTTTCGCGGC TGCTGGAGGC CTCGATGGGT CGCTACTTCC AGGTCTGCAA GGCCTATGAT 
GTCGGCGCCC CCGATCCGGT CGAGGCCCTG CCGGTCAGCA GCGCCATCCC AACCCTGTTC 
CTGGCCGCCG AGATCGATCC CGGCTGCCCG CCGGCCGTCG CCAAGGCGGC GGTGGGCCGG 
TTCGCCAAGG GCCAGCTGAC CATCATCCCC AACACCACCC ACGGCGTGTC GCGCGGCAGC 
GCCTGCGCCC GCAAGATGAT CCGCGCCTTC CTGGCCGACC CAACCGCGCC GATCGACCAG 
AGCTGCCTGC ACCCCGAGCA CGACAAGTTC GTGTTCGATT TGGACTAG

Protein sequence

MRGWMLAAGL AAGTWLAATS AQAAEPKFTP GPCAGDYSGV SNRIECGTLV VDETRGGPST 
RRVALPVTIV KASAPKPGAV PVIYLHGGPG GGVVEALGRS LRGAAGRELI AIDQDWIYFD 
QRGGGVASPI LDCGAVALND AGPLNDAAAQ QLIACGRRLK ASGVDLSRYN AEEVAKDIQD 
LRKTLGLKQI DLFGVSYGTR IALAVVKHQP RGVRAVVLDS PWTPEAKWAE GGPEMVSDAV 
KEIFKRCAAD AACNAKYPHP AADLDAVADT LLSGPQEIGG KVYAADDLGG FLMDAAYSGP 
DARALPATVA RFAAGDMTAL AQQMEGRSGY NEAQHLTHLC KEEFPFESEA AMRKGAGRDS 
VSRLLEASMG RYFQVCKAYD VGAPDPVEAL PVSSAIPTLF LAAEIDPGCP PAVAKAAVGR 
FAKGQLTIIP NTTHGVSRGS ACARKMIRAF LADPTAPIDQ SCLHPEHDKF VFDLD