Gene Caul_1202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1202
Symbol
ID	5898657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1265652
End bp	1267406
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	71%
IMG OID	641561687
Product	hypothetical protein
Protein accession	YP_001682830
Protein GI	167645167
COG category	[S] Function unknown
COG ID	[COG4805] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAAC GTGTTCTTCT GGGCCTGGCC CTGGCCCTGA TGCTCAACGG CGTCGCCGTC 
GCGGCGGCGC CCTCCGCCGC TGACCGGCTG GCGCAGGCGG TCAAGGCCTA CGAGGCGTCC 
GGGGCCGGCG AGGACGACGG AGAAGGCGGG GCCGACGAAG CTTCGCGCTT CAAGTTCCCG 
CCGGTCGGAC CCAAGGCCGA CGCCGACCGC AACGCCCTGC TGACCTCGGC CCGCGAGAGC 
CTGGACGGCG TCGACCTGGC CGCGCTCACC CCCGACCAGC GCCTGACCCA CGCCATCCTG 
AAATGGAGCC TGGACGAGCG GCTGGAGGGC CTGTCGTTCG ACGAAGGGCG GATGCCGTTC 
AGCACCGACG GCGGCTTCGA CGTCATCCTG CTGTACCGCG CCAACGGCAT GCACCTGAAG 
TCCGAGGCCG AGGCCCGCCA GTGGATCGCC CTGCTGGGCC AGACGCCCGG CTGGTACGCC 
GCCAATATCG CCAACGCCCG CCGTGGCGTG ACGACCGGCT TCGTCCAGGC CGTACCGACC 
GCCCAGGCCG TGCTCGACCG CGCCCGCCGC ACCGCCGCCA CCCCGGTCGC CGACGAGCCG 
CTGCTGGCCC CCCTGCGGGA TCTCCCCGCC AGCATCCCCG CCGACCGCCG CGCCGACCTG 
CTATCGGAGG GGACGAAGGT GCTGGCCGAC AAGGTCGCGC CCGCCCGCGC CGGCTTCGTG 
ACCTTCCTGG AAACCGAATA CCTGCCGCAC GCCGCCAAGA GCCTGGCGGT CTCCGACCTG 
CCCGACGGCG CGCGCTACTA CGCCTTCCTG GTCCGCCGCC ACACCACCAC GACCTTGACT 
GCCGACCAGG TTCACGCCCT GGGTCAGTCG GAGGTGGCGC GCATCCGCGC GCGGATGGAG 
GTCGTGATGA AGCAGGCCGG CTTTACGGGC GACCTGCCGG CCTTCATCGC CTTCCTGCGC 
AAGGATCCGC GCTTCTATGC GACCAGCCGC CAGCAGCTGC TGGAAAAGGC CAGCGAGATC 
GCCAAGCGGG CCGACGACCA GCTGCCGGCT CACTTCGGCG TCCTGCCGCG CCTGACCTAC 
GGCGTGCGGC CCGTGCCGGC CAGCATCGAG CAGGGCTACA CCACCGGCCG CTATTTCGGC 
GGCGACCCCA AGACCGGCCG AGCCGGCGGC CTGATGATCA ACACCTCGGC CCTGGACCAG 
CGACCGCTCT ACGAACTGCC GGCCCTGGTG CTGCATGAGG GCGCGCCGGG CCACCACATC 
CAGACCGCCC TGGCCCAGGA ACAGACCGGC GTCCCGGAGT TTCGCAAGAC CATCTATTTC 
AACGCCTATG GCGAGGGCTG GGGGCTCTAT TCGGAGTGGC TGGGCGAGGA GATGGGGATC 
TATCGCGACC CCTATGAGCT GTTCGGCCGC CTGTCGTACG AGATGTGGCG CGCCTGCCGG 
CTGGTGGCCG ACACCGGCAT CCACGCCAAG CACTGGACGA TCGACCAGGC CAAGGCCTGC 
TTCCTCGACA ACACCGCCCT GTCGCCGACC AATATCGACG TCGAGGTGGC CCGCTATGTC 
TCCTGGCCCG GCCAGGCCCT GGCCTACAAG GTGGGCGAGC TGAAGATCCT CGAACTGCGC 
CACCGCGCCG AGGCCGCCCT GGGCGACAGG TTCGACGAGC GGGCCTTCCA CGACGCGGTG 
CTGCTCAACG GCTCGCTGCC GCTGGCGGTG CTGGAGGCGA AGGTGGACGC GTGGATCGCG 
GAGCGGAAGT CGTAG

Protein sequence

MSKRVLLGLA LALMLNGVAV AAAPSAADRL AQAVKAYEAS GAGEDDGEGG ADEASRFKFP 
PVGPKADADR NALLTSARES LDGVDLAALT PDQRLTHAIL KWSLDERLEG LSFDEGRMPF 
STDGGFDVIL LYRANGMHLK SEAEARQWIA LLGQTPGWYA ANIANARRGV TTGFVQAVPT 
AQAVLDRARR TAATPVADEP LLAPLRDLPA SIPADRRADL LSEGTKVLAD KVAPARAGFV 
TFLETEYLPH AAKSLAVSDL PDGARYYAFL VRRHTTTTLT ADQVHALGQS EVARIRARME 
VVMKQAGFTG DLPAFIAFLR KDPRFYATSR QQLLEKASEI AKRADDQLPA HFGVLPRLTY 
GVRPVPASIE QGYTTGRYFG GDPKTGRAGG LMINTSALDQ RPLYELPALV LHEGAPGHHI 
QTALAQEQTG VPEFRKTIYF NAYGEGWGLY SEWLGEEMGI YRDPYELFGR LSYEMWRACR 
LVADTGIHAK HWTIDQAKAC FLDNTALSPT NIDVEVARYV SWPGQALAYK VGELKILELR 
HRAEAALGDR FDERAFHDAV LLNGSLPLAV LEAKVDAWIA ERKS