Gene Caul_1935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1935
Symbol
ID	5899390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2075109
End bp	2076674
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	68%
IMG OID	641562425
Product	FAD dependent oxidoreductase
Protein accession	YP_001683562
Protein GI	167645899
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.790128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.638974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGAGC GGTACGATGT CGCGATCGTC GGCGGCGGCC ATAATGGCCT GGTCGCAGGC 
GCCTATCTGG GCAAGGCCGG CAAGCGCGTG CTGGTCGTGG AGCGCGCCGC GATGGCCGGT 
GGGTTGTCGC AATCGGACCA TGTAATCCCA GAAGCGCCCC ACCACATGGT CAACACCGGC 
ACGGCCGAGC TGATCCATAT CCGCGCCTCT CCCGTCATGC AGGAGCTGGA CCTGCGTAGC 
CACGGCTGGA AGACGGTCGA GACCGATCCG ATGTATGCCT ATCTCGATCC TGACGGCGGC 
TCGATCGCGG TGTTCCGCGA TCCGCGCAGG ACAGCGGAAG ACATCGCCCG GTTCTCCAAG 
ACCGATGCGA AGGCCTATCT CGAATTCATC GAGCTGATCG ATGGCTTGAT GCAGTTCGCC 
GGCGCCATGG GCAAGGGCGA TCCGGGGGTG CGGACGGCCG GGAACTATCT GGATCTGGCC 
AAGGTCGCGA TCCGCAACCG CGCGCTGAAG GACCGGCTGC AGCTGATCAG CACCGCCCCG 
GCCGATCAGC TGGCTGCGGA GTGGTTCGAG CATCCGGCGA CGCAGGCCTT GCTGCTGGGC 
GTCGTGGCCG GCGCCGGGCC GTTCGACACC GATGGCAATG GTATCGCCTA CGCTCTGTTT 
GGCCTGCTGC ACCGGGTCGG GGTGTCCAAG GCCCTGGGCG GGATGCGGAT GTTCGCCGAC 
GCCTTGCTGA GCGCCTACGC GGCCTCGGGC GGCCAACTGA TGCTGAACGC CGAGGTCGAG 
GAGATCATCA TCCGCGACGG CGCCACACGC GGCGTGCGCC TGAAGGACGG TCGGATGATC 
GAGGCCGGCC TCGTGATCGC GACTTGCGAC CCGATCACCG CCGCGCGGCT GGCGTCTCCG 
GGCGGGCTGG ATCGCGTCAC CCGCACGCGG CTTGAATACG CCCCCGCGCA CCGGGCCAAT 
GTGGGGCCGT CGCTGATCAA CGTGGCGTCG TCGAAATCCT TCCGCCTGAA GCGGCATCAG 
GACCTGCGGA CCGACGGCGT CGACCTGAAC CAGGCGGTCG GGCTGATCGG CTCGGCGGAT 
GAACTGAGGC AGGCGCTGGT CCATGCCCGG CGCGGACAGG TTCCGTCGGC GCCGGTCTTC 
TCCCTGTCGC CGATGACCAA CTGGGATCCG TCGATGGCGC CCGAGGGCCA GGGCGTGGCC 
TACATCTACC TGCCCGTCTT CCCGGTCGAG GTGAACGACG GATGGCCGCG CGCCAAGGCG 
CCGGCGGCCG ACGCCATCAT CGCGCGGGCG GCGGACTATT ATGAGGGCTT CGACGGTGAA 
CTGGGCCGCT GGTTCGAAAC CTGTCCGGAC CGGGAGGCGA GAACAGGCCT GACCAGGGGT 
TGTGTCACCC ATGTCGATTT CGGCGCCCAG CGAACGGGCG CGAAGCGACC AGCCTTCGGG 
CTTGGCGGGC CCGAGCCGCT GGCGCCGGGG TTCTTCCTGG GCGGCGCGGG GATCCATCCG 
GGCGGCGGGG TTTCGGGTGG TCCGGGACGC CTGGTGTCGA AACGGGTGCT CGACTATCTG 
GCCTGA

Protein sequence

MTERYDVAIV GGGHNGLVAG AYLGKAGKRV LVVERAAMAG GLSQSDHVIP EAPHHMVNTG 
TAELIHIRAS PVMQELDLRS HGWKTVETDP MYAYLDPDGG SIAVFRDPRR TAEDIARFSK 
TDAKAYLEFI ELIDGLMQFA GAMGKGDPGV RTAGNYLDLA KVAIRNRALK DRLQLISTAP 
ADQLAAEWFE HPATQALLLG VVAGAGPFDT DGNGIAYALF GLLHRVGVSK ALGGMRMFAD 
ALLSAYAASG GQLMLNAEVE EIIIRDGATR GVRLKDGRMI EAGLVIATCD PITAARLASP 
GGLDRVTRTR LEYAPAHRAN VGPSLINVAS SKSFRLKRHQ DLRTDGVDLN QAVGLIGSAD 
ELRQALVHAR RGQVPSAPVF SLSPMTNWDP SMAPEGQGVA YIYLPVFPVE VNDGWPRAKA 
PAADAIIARA ADYYEGFDGE LGRWFETCPD REARTGLTRG CVTHVDFGAQ RTGAKRPAFG 
LGGPEPLAPG FFLGGAGIHP GGGVSGGPGR LVSKRVLDYL A