Gene Caul_5124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5124
Symbol
ID	5897398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	44571
End bp	45551
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	641555227
Product	luciferase family protein
Protein accession	YP_001676558
Protein GI	167621773
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCA TTTCCGTTCT CGACTTCGTG CGCATCACCC GCGAGACAAA CGCACGTCAG 
GCCTTGGACC AAGCCCGCGA GCTGGCGGCT CATGCCGAGG CGCTCGGCTA TCGCCGCTAT 
TGGGTGCCTG AGCACCATAA TTTCCCGGGC ATCGTCGGGG CGGCCACTTC TGTTGTGCTG 
AGCCACATCG CGGCGGGCAC GCGCACCATT CGGATCGGCG CGGGCGGCGT GATGATGCCC 
AATCATCCGC CGCTGGTGGT GGCCGAGCAG TTCGGCACCT TGGCCCAGCT CTTTCCAGAC 
CGCATCGATT TGGGGATCGG ACGCGCGCCC GGCGGAGACC AGAACGTGAT CCGTGCCTTG 
AGGCGTCCGG CGGGCGGCGG CGATCTGATG GCCGACGCCG TGGAGCTTTT GGCCTATTTC 
GGGGAAGAGG GCCAAGCCAA GGGTGTGCGC GCCATGCCGG CGGCGGCCAC CAAGGTCCCC 
CTCTGGATCT TGGGCTCCAG TCTCTATGGT GCGCGGCTGG GGGCGGAGCT GGGCCTGCCT 
TACGCCTTCG CCTCGCATTT CGCGCCCGAG GCTCTTCTGC CGGCGCTGCA AACCTATCGC 
GACCGTTTCA AACCCTCGGT CCACCTGGAG CGGCCCTATG CGATGATGGG GGTCAACATC 
GTCGCGGCCG AGACGGACGC GGAGGCGGTG CGCCTGGCCA CCACACAGCA GATGACCTAC 
ACCGATCTCA TCCGAGGCCG TCCAGGCGTC AGCCAGCCGC CCCTCGACGA CATCAACACC 
TATTGGTCCC CGGTCGAACG CGACCACGTC ACGCGCATGT TGGGCTGCTC GATCATTGGA 
TCGCTGGCCA CGGTGCGCGC GGCCATCGCC GCCCTCGTCG CCCAGACCGG AGTCGACGAA 
CTGATCATCG ACTCCGACCT CTATGATCAC GGGCGACGCA TGACGTCCTT GGAGATCATC 
GCCGAGGCGG TGGCGACCTA G

Protein sequence

MTAISVLDFV RITRETNARQ ALDQARELAA HAEALGYRRY WVPEHHNFPG IVGAATSVVL 
SHIAAGTRTI RIGAGGVMMP NHPPLVVAEQ FGTLAQLFPD RIDLGIGRAP GGDQNVIRAL 
RRPAGGGDLM ADAVELLAYF GEEGQAKGVR AMPAAATKVP LWILGSSLYG ARLGAELGLP 
YAFASHFAPE ALLPALQTYR DRFKPSVHLE RPYAMMGVNI VAAETDAEAV RLATTQQMTY 
TDLIRGRPGV SQPPLDDINT YWSPVERDHV TRMLGCSIIG SLATVRAAIA ALVAQTGVDE 
LIIDSDLYDH GRRMTSLEII AEAVAT