Gene Caul_3483 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3483
Symbol
ID	5900938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3760585
End bp	3761946
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	58%
IMG OID	641563989
Product	hypothetical protein
Protein accession	YP_001685108
Protein GI	167647445
COG category	[S] Function unknown
COG ID	[COG5323] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01547] phage terminase, large subunit, PBSX family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCTG AGAGGCAAGC CCTCTACGAC TTCATCAAGG CGCAGTTCCA TGACCTCGGA 
GCCGATGGTT TCCAAGAGTG GTGGCATAGC CTGGACGAGG AGACGTTCGA GCTTGTCGAG 
CAGGCCCTTT CCGATCCCGG CTTCGGCCTA AACCCACACC AGATCATGCC CGATGGCGAA 
TGGCGCATCT GGGCGCTTTT CATGGGCCGT GGTGGTGGCA AGACCTACGC GGCCAGCAAG 
GGCTCAAACG TCCTAGCTGA AGAAGTCTTT CCAGGCGGTA CGGGCATCCT CGTCGGCGCG 
ACCGTCAAGG ACGTGCGCGA CACCATGATC GAGGGCGAGA GCGGCATCAT CGCGACCGCG 
CGTCCCGGCT TCGTCCCCCA CTACAACAAA CACGACAACG TCTTGATCTG GCCGAACGGC 
TCCAAGGCGC TGATCCGTAC TGCAGACAAC CCCGAGGACA TTCGCGGTCC AACCGTGAAC 
TGGGCCTGGG CCGACGAACT GGTCAAATGG CGTAGCGAAA AGTCATGGGA CAACCTCAAC 
CGATGCGTCC GTAACCTCCA CGAAAACGGC ACGAAGATCA TCGTGACCAC GACGCCCAAG 
AAGGCGAAGC AGTGGATCAA AGACATTGAG AGCCTGCCGG GCACAATCGT TTCCCGCGCA 
TCTTCACTCG ATAACCCTCA CATGGATGCA GCGTATCTTG AGGGCATTCG ACGCGAAGCT 
GAGACCGGAA GCGCACGCGC ACGCGAAGAG ATTTTCGGCG AGTGGATCGA GGGAGACGGC 
GAGCTTTGGA CTGAGAAATC CATTGAGGAA ATGCGCCAAC GACCCAGCGT CTCGCTGGAG 
GTCATGGCGA AGTCGATGGA CCGTCGATAC ATTAGCGTTG ACCCATCGTC AGGCAAGCAC 
GACGAAACGG GTATCATGCT CATGGGTAAG AAGGCGGGCC GGGTTTACGT GCTCGCGGAC 
TTCACGTCAG GGGGCAACAT CAACCAGTGG ACAGACGAGA TTGTTCAACT CGCAAAGTCC 
TACCTACAAC CCGGCGACAT CATCCTCCTT GAGGTGAACA TGAACGCCGC CGCGCAGAAC 
GTGTTGGAGC AAAAAGACCG CAGCCTTCGC ATCGTCCCTG TGACCGCAAC CCGCTCCAAA 
TGGCACCGCG CGGAAGAGGC ATTTTCGCAC TGTCAGTCAG GCCATGTTGT GTTCTGGCAT 
ACGCATCCGA AGTTGGAGCT ACAGCTTCGC GAGTGGGAAC CCGAAATGAA GAAATCGCCT 
GACCGAGGCG ACGCATTTAC GCAGGGTGTC AACTACGCGA TGGGAACGCA TGGCAGGGGT 
TTGAGCGTGC CATTCTTCAC CATCCAGGGG TTCAACCGCT GA

Protein sequence

MRAERQALYD FIKAQFHDLG ADGFQEWWHS LDEETFELVE QALSDPGFGL NPHQIMPDGE 
WRIWALFMGR GGGKTYAASK GSNVLAEEVF PGGTGILVGA TVKDVRDTMI EGESGIIATA 
RPGFVPHYNK HDNVLIWPNG SKALIRTADN PEDIRGPTVN WAWADELVKW RSEKSWDNLN 
RCVRNLHENG TKIIVTTTPK KAKQWIKDIE SLPGTIVSRA SSLDNPHMDA AYLEGIRREA 
ETGSARAREE IFGEWIEGDG ELWTEKSIEE MRQRPSVSLE VMAKSMDRRY ISVDPSSGKH 
DETGIMLMGK KAGRVYVLAD FTSGGNINQW TDEIVQLAKS YLQPGDIILL EVNMNAAAQN 
VLEQKDRSLR IVPVTATRSK WHRAEEAFSH CQSGHVVFWH THPKLELQLR EWEPEMKKSP 
DRGDAFTQGV NYAMGTHGRG LSVPFFTIQG FNR