Gene Caul_4143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4143
Symbol
ID	5901605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4495611
End bp	4496672
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	641564664
Product	hypothetical protein
Protein accession	YP_001685765
Protein GI	167648102
COG category	[S] Function unknown
COG ID	[COG4246] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.980511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.981417
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGGAC TGCGCGGCTT TCTCGTCCTG GGCCTGGCCT CGCTGGCCCT GGGCCAGTGC 
GCCAAGGCCC CGCCGCAACC GGCCGTGCTG CCGGTGGCCC CGGTCAAGGT CGGGCCGGAG 
ATCGGCCTGG TCACGACGCC TGTGCCGCTG AGTTCGGCCA ACCCGCCGCC CGTCGCCCTG 
GGCCGCTTCG TCTATGCCGG CGGCGTCGCG ATCAGCAGCC CCGACACCAC CCGCCTGCAC 
GGCCTGTCGG ACCTGAAGTT CGGCCCCGAC GGCGCCCTGG TCTCCGTCAC CGACGACGGC 
GACCTGTTCG AGGCCCGGTT GAAGCTGGAC GACACCGGCC GCCTGGTCGG CCTGACCGAC 
GGCAAGCTCT CGCCGCTCAA GGGCCTGGAC GGCCAGCCGC TGCAGGGTAA GGTGCAGTCC 
GACGCCGAGG GCCTGGCGTT CCTGGCCAAT GGCGACCGGC TGGTCAGCTT CGAGCGCGAT 
CACCGCATCT GGCTCTATCT GCGCCAGAGC GACGGAACCT ACGGCCTGCC GCGCGCCGTC 
AACAAGCCGG CCACCACCTT CCCCGACAAC GAGGGCATGG AGGCCCTGAC CGCCTATCCG 
ATCGCCGGGC CGGACGCCTA TCTGGTGGGC GGCGAGGAGG GCGAGGTGTG GCTGTGCAAG 
GTCTCGGCGC CGTGTGCGAG CGTGACGCCG CAGTCGCCGC CCGACTTCAC CTGGGGCCTG 
ACCAGCTTCG CCGCCTTCGA GGGCCAGGCG GTGGCCGCCC TCTATCGCAG TTTCGATCCG 
GTTCGCGGCT GGCGCGGCCA GGTGCGGTTC GTCGTCGACC CTCGCGCCCC CGCCGCCAAG 
CAGGTGGTGG CCGCGACGCT GAACCTGGAC GGGGCGACCA CCCGCGACAA TTTCGAGGGG 
ATCGCCCTGT CGCGCAGTCC GTCCGGCGCG ACGCGGCTCT ACATCCTGTC GGATGACAAC 
GACACCAGCT TCGAGCGGAC CCTGCTGATG GCCTTCGACT GGACCGCTCC GCCGCCCCCG 
CCGCCGGCTC CGGTGAAGAA GGCTCCGGCG AGGAGACGGT GA

Protein sequence

MIGLRGFLVL GLASLALGQC AKAPPQPAVL PVAPVKVGPE IGLVTTPVPL SSANPPPVAL 
GRFVYAGGVA ISSPDTTRLH GLSDLKFGPD GALVSVTDDG DLFEARLKLD DTGRLVGLTD 
GKLSPLKGLD GQPLQGKVQS DAEGLAFLAN GDRLVSFERD HRIWLYLRQS DGTYGLPRAV 
NKPATTFPDN EGMEALTAYP IAGPDAYLVG GEEGEVWLCK VSAPCASVTP QSPPDFTWGL 
TSFAAFEGQA VAALYRSFDP VRGWRGQVRF VVDPRAPAAK QVVAATLNLD GATTRDNFEG 
IALSRSPSGA TRLYILSDDN DTSFERTLLM AFDWTAPPPP PPAPVKKAPA RRR