Gene Caul_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0474
Symbol
ID	5897929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	514704
End bp	516032
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	66%
IMG OID	641560957
Product	integrase family protein
Protein accession	YP_001682106
Protein GI	167644443
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAG TAAAGATCCC CCTGAGCGAC CGAGCCGTGC TCCAGCTGCC GCCGCCGGCC 
AACGGCCGCT ACACCGTCCG CGACCAGGAC CTGAAAGGCT TCAGCGTCGT CGTCGGCGCC 
AAGCGCAAGA CGTTCACGGT ACAGGGAGAA TTCTGGGAAG ACGGCAAGCG CTTCGCCAAG 
ACCGTCAGCA TTGGCCACGC CGGCGACATC TCGGTCCGCG AAGCGCGGAT CAAGGCCAAG 
GCGCTCCTGG CCAAGATCGT CAGCGGGGAG TTGCAACGAG AAGAGGCCGA GGCCGCCGCG 
GCGGCTGCGG CCATGCAAAC CCCAGTGCAA AACAAGGGCG TCACGCTGCG CGTCGCATGG 
GAGCGCTATC GCACCGCCCA TATGGAGCGC AAGGAGCGCA GCGAGGCGAC CATCAAGGGC 
TATGCCGATC ACGTCGAGCG CCTGTTGGCC GACTGGCTCG ACACGCCACT TCAGGAAATT 
GGAGAGGATC CGGCCAGGGT GGCCGAACGC CATGATCGTC TGACCAAGGA AAACGGGCCG 
AGCGCTGGCA ACGGCGCGAT GCGGACCCTG CGGGCGATCT ACAACCACGC TCGCAAGAGC 
CATCGCAACC TGCCGCCAGA AAACCCGACG CTGGCGGTGG ATTGGAACAC CGAAAGGCGC 
CGTGACACCG CCATGGGGGT CGCGGATGTC CCAGGCTGGT TCGACCAGGC TCGACGCATG 
CGCCATCAGG TGCGGAGGGA ATTTCATCTC TTCACGCTGC TGTCGGGAAG CCGGCCCGGG 
GCCTTGCTTC AGGCGCGCAT CGAGCACGTC AATTTCCGCG AGCGCATTCT GCACATCCCC 
AGACCCAAGG GCGGGGCCAA ACGCGCTTTC GACATCCCCC TGTCGCGGCC GATGATCCGC 
TGCCTGATCC GCGCCATGCG CGCCGGTCGG GACATGCTGC CCGAGCAAGC ACGCACCTGG 
CTTTTCGTCG GCGAAAGCGA AGACGGACAC ATGGTCGAGC ACAAGGAGGA CCGGCGGGTT 
CTGGCCAAAT GGGGCAACGA TCTGCGCCAG ACCTACAGGA CCTTGGGCGC GGAGGCGGAG 
CTGTCGGAGA TCGACATGCA CCTGCTGATG AACCACAGCT TGCCGGGGGT GAATGCCGGC 
TACATCACTC GCGCCAAGCT CCTCAGCACG CATCTGCGGA CGGGACAGGA AAAGCTCTCC 
AGCCTGATCG TGCGCGCGAG CGGCGCAAAG ACGCTAGCTT GGCCGTTCCT GCCGTCGCGC 
AAGATCGGCG ATCCCGTCAC GGACCCGACA CCGCCCGACC CGCGCACCAA AGCCGCACGC 
GCCGCCTGA

Protein sequence

MSEVKIPLSD RAVLQLPPPA NGRYTVRDQD LKGFSVVVGA KRKTFTVQGE FWEDGKRFAK 
TVSIGHAGDI SVREARIKAK ALLAKIVSGE LQREEAEAAA AAAAMQTPVQ NKGVTLRVAW 
ERYRTAHMER KERSEATIKG YADHVERLLA DWLDTPLQEI GEDPARVAER HDRLTKENGP 
SAGNGAMRTL RAIYNHARKS HRNLPPENPT LAVDWNTERR RDTAMGVADV PGWFDQARRM 
RHQVRREFHL FTLLSGSRPG ALLQARIEHV NFRERILHIP RPKGGAKRAF DIPLSRPMIR 
CLIRAMRAGR DMLPEQARTW LFVGESEDGH MVEHKEDRRV LAKWGNDLRQ TYRTLGAEAE 
LSEIDMHLLM NHSLPGVNAG YITRAKLLST HLRTGQEKLS SLIVRASGAK TLAWPFLPSR 
KIGDPVTDPT PPDPRTKAAR AA