Gene Caul_2161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2161
Symbol
ID	5899616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2343848
End bp	2344969
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	68%
IMG OID	641562652
Product	radical SAM domain-containing protein
Protein accession	YP_001683787
Protein GI	167646124
COG category	[L] Replication, recombination and repair
COG ID	[COG1533] DNA repair photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0231722
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCAG CGGTGGTCCA TGATCGGATC ATGGTCGCTC CCGCCAATCT GCCCGGTCAT 
CCGCCGTCGA ACGTTCGAGG GCGCGGGGCC AAGTCCAATC GCACCGGCCG CTTCGAGTCC 
CAGGTCAGCG AGACCTTCGA CGACGGCTGG GGCGAGGAGG ACGAGCCCGC CCAGATCGCC 
ACGACGCTGC AGCCGATGAA GTCGCGGACC ATCATCGCCC GCAACGACAG TCCCGATGTC 
GGCTTCGAGA GCTCGATCAA CCCCTATCGC GGCTGCAGCC ACGGCTGCAT CTATTGCTAC 
GCCCGCCCGG CCCACGCCTA TCTGGGCCAT TCGCCGGGCC TGGATTTCGA GACCAGGATC 
TATTTCAAGC CCGAGGCCGG CAAGCTGCTG GAGCGCGAGC TGTCCAAGAA GGGCTATGCG 
CCCAAGGTCA TCCATATCGG CGGCGACACC GATCCCTACC AGCCCGACGA GCGCCAACTG 
CGGGTGACGC GGGCGGTGAT CGAGACCCTG GCGCGGTTCC GCCATCCGTT CACGATCATC 
ACCAAGTCGG CCCTGATCAC CCGCGACCTG GATATCCTGG GGCCGATGGG CCAGGCGGGA 
CTGGCGCGAG CGGCGGTGTC GATCACCAGC CTGGACCACC GATTGTCGCG CAGCATGGAG 
CCCCGGGCCG CCACGCCGAA GCGTCGCCTC GACGCCGTGC GACAGCTGAC GGCGGCGGGC 
GTGCCGACCA CGGTGATGTT CGCGCCTTCG ATTCCGTCGC TGAACGACCA TGAGATGGAA 
GGCGTGCTCG AGGCCGCCGC CGCCGCCGGG GCGACCACGG CCGGCTATGT CGCTGTGCGC 
CTGCCGCTGG AGATCAAGGA CCTGTTCGAG GAGTGGCTGG CGGCCGAGCA CCCCGACCGC 
GCCAAGCGGG TGATGTCGCT GGTTCGCCAG ATGCGCGGCG GCGCGGCCTA TAGCACCGAG 
TGGGGCAAGC GGATGACCGG CGAGGGTCCG GTGGCCGAGG TAATGAGCCA GCGGTTCCAC 
CTGGCGCGGA CACGCTTCGG TTTGGACCGC AAGCTGCCGC CGTTGGATCT GAGCCAGTTC 
GCCGTCCCCG CCAAGGCGGG CGATCAGTTG TCGCTGTTCT AG

Protein sequence

MFSAVVHDRI MVAPANLPGH PPSNVRGRGA KSNRTGRFES QVSETFDDGW GEEDEPAQIA 
TTLQPMKSRT IIARNDSPDV GFESSINPYR GCSHGCIYCY ARPAHAYLGH SPGLDFETRI 
YFKPEAGKLL ERELSKKGYA PKVIHIGGDT DPYQPDERQL RVTRAVIETL ARFRHPFTII 
TKSALITRDL DILGPMGQAG LARAAVSITS LDHRLSRSME PRAATPKRRL DAVRQLTAAG 
VPTTVMFAPS IPSLNDHEME GVLEAAAAAG ATTAGYVAVR LPLEIKDLFE EWLAAEHPDR 
AKRVMSLVRQ MRGGAAYSTE WGKRMTGEGP VAEVMSQRFH LARTRFGLDR KLPPLDLSQF 
AVPAKAGDQL SLF