Gene Caul_4337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4337
Symbol
ID	5901798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4710284
End bp	4711720
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	70%
IMG OID	641564855
Product	hypothetical protein
Protein accession	YP_001685955
Protein GI	167648292
COG category	[S] Function unknown
COG ID	[COG0397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.210186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGGCA TGCCGATCTC CGACGCCTAC CGCCCCGATC CGATCTTCAT GCGCCTGGGG 
CCGGACTTCG CCGATCCAGT GGCTCCGGCT GACTTCCCCG AGACGCGCCT ACGGTTCCGC 
AACGACCGCG CGGCCGCGAC GGTGGGGCTG GAGGGGTTGA ACGACGCGGC GTGGCTGGAG 
CATTTCGCGC GGTTCCGCCC GCTGCCCGAC AACCAGCCCG GGCCGCTGGC CATGCGCTAT 
CACGGCCATC AGTTCCGCAG CTACAACCCC GACCTGGGCG ACGGGCGCGG CTTCCTGTTC 
GCCCAGTTGC GCGAACAGGG AAGCGGTCGA CTGCTGGACC TGGCCACCAA GGGCTCGGGC 
CAGACGCCGT GGTCGCGGGC CGGCGACGGG CGGCTGACCC TGAAGGGCGG GGTGCGCGAG 
ATCCTGGCGG CCACGATGCT GGAAGCCCTG GGCGTCCCCA CCTCCCGGGC GTTTTCCCTG 
GTCGAGACCG GCGAGGACCT GGTGCGCGGC GACGAGCCCA GCCCGACTCG CTCGGCGGTG 
CTGACCCGCC TGTCGCACAG CCACATCCGC TTCGGGACCT TCCAGCGCCA GGCCTTCCTG 
GAGCGGCCCG ACAACATCGC CGTGCTGGTC GACCACGCGG TCGAGACCTA TTTCCCCGCC 
GTGGCCAACG AGCCCGACCG GCCCAAGGTG CTGCTGGAGC AGGTGGTGGC CGCCAGCGCC 
CGCCTGCTGG CCCGCTGGAT GGCGGCCGGC TTCGTGCACG GGGTGCTCAA CACCGACAAC 
ATGGTGGTCA CCGGCGAGAG CTTCGACTAC GGCCCCTGGC GGTTCCTGCC GAAGAACGAC 
CCGAATTTCA CCGCCGCCTA TTTCGACCAT TCGGGGCTCT ACAGCTTCGG CCGCCAGCCC 
GAGACGGTGT TCTGGAACCT GCAGCAGTTG GCCGGCTGCC TGGCCCAGGT CACCGACGAC 
GCCGGGCTGA TCGCCGCGCT CAACACCTTC TCCGACCTCT ATCGCGACGC CCTGCGCGCC 
GCGATGCTGG ATCGTCTGGG CGTGAAGAGC CGCTCGGCCG AGGACGATGT CGCCCTGGTC 
CAGGCGGCGT TCGCGGCGCT CGCGGCGGGC GCGGGTGATT CGCTACGCTG GGAGCCGTTC 
TTCTTCGACT GGTTCTGTGG CGAGGCGTCG GAAGCGCGCG CCCTGGCTGG GCCGCGCGCC 
GGACTTTATG GCCAGGACAC GTTCCTCGAC TTCCGACGCC AGCTGGCGAC GTTCGAGCCG 
GAGCGCCCGG AGCGCCTGGA AAGCCCGGTT TTCAACGGCT TGGAGCCAGA GGAAATGCTG 
ATCGACGAGG TCGAGGCCCT GTGGGCGCCG ATCGCCCAGG CCGACGACTG GTCGCCGCTG 
CACGCGAAAT TGGGGCGACT TGAAGCCGCT CGTGTCGCCT ATGCGTTGGG AGACTGA

Protein sequence

MRGMPISDAY RPDPIFMRLG PDFADPVAPA DFPETRLRFR NDRAAATVGL EGLNDAAWLE 
HFARFRPLPD NQPGPLAMRY HGHQFRSYNP DLGDGRGFLF AQLREQGSGR LLDLATKGSG 
QTPWSRAGDG RLTLKGGVRE ILAATMLEAL GVPTSRAFSL VETGEDLVRG DEPSPTRSAV 
LTRLSHSHIR FGTFQRQAFL ERPDNIAVLV DHAVETYFPA VANEPDRPKV LLEQVVAASA 
RLLARWMAAG FVHGVLNTDN MVVTGESFDY GPWRFLPKND PNFTAAYFDH SGLYSFGRQP 
ETVFWNLQQL AGCLAQVTDD AGLIAALNTF SDLYRDALRA AMLDRLGVKS RSAEDDVALV 
QAAFAALAAG AGDSLRWEPF FFDWFCGEAS EARALAGPRA GLYGQDTFLD FRRQLATFEP 
ERPERLESPV FNGLEPEEML IDEVEALWAP IAQADDWSPL HAKLGRLEAA RVAYALGD