Gene Caul_2225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2225
Symbol
ID	5899680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2419029
End bp	2420888
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	65%
IMG OID	641562717
Product	RES domain-containing protein
Protein accession	YP_001683851
Protein GI	167646188
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.195226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.94728
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTACT GGAGCGACCA GCAGATCGCG GAATCTGAAG ACGGCCTTGA TCTCGCACGC 
CTCGCCGGGC GGCACGTCTG TCAGGCCTGC TTCGAAGATG AGGCGCTGAA GACCGTGGTG 
GCCGAAAGCC TGACGTCGCT GGTCTGTGAC TATTGTGGTC GGCGCGCCAA GCATCCGATC 
GCATCGGCCT TGGACCGGGT GGTCGCGCAT ATCTTCGGGT CGATCCAGAA GGAATGGGGC 
AAGGCCGAAG ACTACCTGCC TTGGGACGAC GAAACCGATG CGTTCATGCT CGGCGATGTC 
ATCGACAATC GAGAATTGCT GGAGATGCAC GTCGACCTTG AGCTGCCAAA CGACGGTGCC 
GGTCGCTTGC TCGACGACAT CGTCGCGGCC TTTCCGGAAT GGAGCTGGTG CGTCATTGAC 
CCGCTGATCG CCCAGCCCGA AGAGGCGATC GCCGACAGCT GGCGGACGTT CTGCGAGATC 
ATCAAGCACC GGCGGCGGTT CTTCTTTCTC CAGCACCAGG ACCGGGCGCT TGAGCGCGCG 
ATCAGCCAGG CGGAGGCGGC CTATGATGTG CCGCAGCTGT TGAGCAATCT GGCGGACTTC 
GCGACCCGCA AGAGACTGTT TGAGACCATT CCCGCTGGCG CGGTTTTCGT GCGCGCCCAG 
CAGAAGCAAA AGGAGCAAGA GGCCTTCAGT CCGCGTCGCA TGGGGCCGCC GCCCGAGATG 
TTCGCCCTGC AGCCCAACCG GATGAGCCCG TCTGGCGTGC CGATGTTCTA CGGCGCGCAG 
GCGCAGCGCA CGGCGCTGAT GGAGATCGCC TCCGGGCCGG CCTGGTTCGC GATCGCGGAG 
TTCACGGTCC AGAAGAACCT GACGCTGCTC GACTTGAGAA AGCCGCCCAG GGTCCCAAGC 
CTGTTTGATC CCGCCCTGGC CAAGGACCGG CCCTTCGCGA TGTTCATGGC CGAGTTCATC 
AAGGATTTTC AGGCTCCGAT CAGCCACGAA AAAGGACGCT CTCACGTCGA GTATGTCCCC 
ACCCAGGTGG TCACCGAATA CTTCCGAACC ATCGCGCGGT TCGACGACAA GCCGATCGAC 
GGCGTCCTCT ACGAGAGCAC CAAGGATGTC GGAGCCACCG CGGTGGTTCT GTTCGCCGAC 
AACGGCGATG TGGAGGACGC CGCCGACGCC GCCGCCGAGC CCTACCGCGC CAAGCGCGAC 
ACCTGGCTGG TGATGACCCG CTACGCGGAG GAGGAATATT GTCCGCCGGA TGGGCCGGCG 
ATCGCGCCGA CCGGGGACGT GTTGTTGGCG CTTGGCCTTG ACGCCCGGAC CGAGCCGCTA 
AGCCTCATTG GCCCTTCGGC CGAGGGGCCC GCGTCGCTGC TGGTCTTCCA CAGCGCCGGG 
GATTGGGCCG CACATCTCGC CAAGATCGAC ATCGATCCGC GGATCCCGCT CATCGTGAAA 
GCCAAGTTCG AGCGCGCGCG CAGACTCTAC TTGATGGCTT GGGTAGACGC CGATCTGATC 
AAGGCGGGGG AACTGGCGAC GCTGGTCGCG CTCGAATTGG CGCTGAAGGA TCGCGTGGGG 
GCTAAAGTGG CCGCCAAGAA CCGCAGCTTC GCGGGCATGC TGAGACACTT GGTCGAGGTC 
GAGGGGCTGA CCGACGACAA GATCCCCGTG ATCGTCCAGT ACGGTGGAAC GGCGGTGGGT 
TTCCTGACCG GCGAGAACCA GCCGACTCTG GCCGAGCGTC GCAACGGGAT GGCGCACGGC 
GATCCGTTCG GCGGCCTTCC CGTGGGCGGG TTGCTGGAGC TGACGCGCGA CCTGATCGAT 
TTCGTCTATC GCGACTACCT GGCTGAGGTC GGCGAGCTCG TCGCGGCGCC CCAAGCCTAG

Protein sequence

MSYWSDQQIA ESEDGLDLAR LAGRHVCQAC FEDEALKTVV AESLTSLVCD YCGRRAKHPI 
ASALDRVVAH IFGSIQKEWG KAEDYLPWDD ETDAFMLGDV IDNRELLEMH VDLELPNDGA 
GRLLDDIVAA FPEWSWCVID PLIAQPEEAI ADSWRTFCEI IKHRRRFFFL QHQDRALERA 
ISQAEAAYDV PQLLSNLADF ATRKRLFETI PAGAVFVRAQ QKQKEQEAFS PRRMGPPPEM 
FALQPNRMSP SGVPMFYGAQ AQRTALMEIA SGPAWFAIAE FTVQKNLTLL DLRKPPRVPS 
LFDPALAKDR PFAMFMAEFI KDFQAPISHE KGRSHVEYVP TQVVTEYFRT IARFDDKPID 
GVLYESTKDV GATAVVLFAD NGDVEDAADA AAEPYRAKRD TWLVMTRYAE EEYCPPDGPA 
IAPTGDVLLA LGLDARTEPL SLIGPSAEGP ASLLVFHSAG DWAAHLAKID IDPRIPLIVK 
AKFERARRLY LMAWVDADLI KAGELATLVA LELALKDRVG AKVAAKNRSF AGMLRHLVEV 
EGLTDDKIPV IVQYGGTAVG FLTGENQPTL AERRNGMAHG DPFGGLPVGG LLELTRDLID 
FVYRDYLAEV GELVAAPQA