Gene Caul_4478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4478
Symbol
ID	5901939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4851350
End bp	4852747
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	71%
IMG OID	641564997
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_001686096
Protein GI	167648433
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.408304
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.958001
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCCG ATGTCGTCTC CCGCCTGAAA GCCGTGCTCG GCGAGGGCGG ATGGAGCCAG 
GATCCCGACC GCCTGGCGCC CAAGCTGCGG GAGTGGCGCG GACGGTGGAG CGGGCAGACG 
CCGCTGCTGG CCCTGCCCCG TTCGACGGCC CAGGTCGCGG CGGTGGTCGG CGTCTGCGCC 
GCCGAGGGGG TGGCGATCAT CCCGCAGGGT GGCAATACCG GCCTGGTCGC CGGCCAGATC 
CCGCAGGGCG AGATCCTGCT GTCGACCGAA AAACTGACGA CGGTGCGCGA CGTCGATGCG 
TTTGACGACG TCATGGTTCT GGAGGCCGGC GTGACCCTGG CCAAGGCCCA CGAGGTCGCC 
TTGTCGGTCA ATCGCCGTTT CCCGCTCAGC CTGGCCTCGG AGGGATCCTG CACGATCGGC 
GGCCTGGCCT CGACCAACGC CGGCGGCACG GCGGTGCTGC GCTATGGCGT CATGCGAGAC 
CAGATCCTGG GGATCGAGGC GGTGCTGCCC AATGGCGAGG TCTGGAACGG CCTCAAGCGG 
CTGCGCAAGG ACAACACGGG CTATGACTTG AAGCATCTGC TGATCGGCGC CGAGGGCACG 
CTGGGGATCA TCACCGCCGC CAGCCTCATG CTCTATCCCC TGCTGGCTTC GCGGAGCGTG 
GCGATCGCCG CCGTGACCAC GCCGCATGAC GCCATCGCCC TGCTGGCCCG CGCCAAGGAC 
GAGACCGGCG GAGCGGTCGA GGCCTTCGAG CTGATGAGCC GTCTGGGCGT TGCCTTCGCG 
CTGAAGAACA TCCCCGGACT GCGCGAACCG CTGGAGGCCG TGCATCCCTG GTACGTGCTG 
ATCGAGACCG CCTCGGGCGA GCCCGGCGCG GCCGAGGCGG CCATGGAGCG GCTGCTGGCC 
GGGGCGCTGG AGCGCGGCCT GATCCAGGAC GCCGCCGTCG CCCAGTCCGA AGCCCAGGCC 
CAGGCCTTCT GGGCGGTGCG CGAGAACCAG TCCGGCGGCC AGAAGCCCGA GGGCGCGGCC 
TGGAAGCACG ACGTCTCGGT CCCGGTCTCC AAGGTCGCCG ACTTCATCGA CCAGGCCACG 
GCGGCGGTGG AAAAGCTGTC GTCCGGCGTT CGCGTCGTGG CCTTCGGCCA TGTCGGCGAC 
GGCAATGTGC ATTACGATGT CCTGCGGGCC GACGGGGCGG CCGACGACCC GCACGACGCC 
CTGCGCGACG CGGGCGCGCG GATCGTCCAC GACATCGTGG CCAGCATGAA CGGCTCGATC 
AGCGCCGAGC ACGGCCTGGG GGCGATGAAG TCGGTCGAGG CTCTGCGCTA CAAGAGCGCC 
GTCGAGGTCG AGGCCCTGCG CGCTGTCCGC GCGGCGCTCG ACCCTCAGCG GATCATGAAC 
CCTCGGGTGC TGTTCTAG

Protein sequence

MASDVVSRLK AVLGEGGWSQ DPDRLAPKLR EWRGRWSGQT PLLALPRSTA QVAAVVGVCA 
AEGVAIIPQG GNTGLVAGQI PQGEILLSTE KLTTVRDVDA FDDVMVLEAG VTLAKAHEVA 
LSVNRRFPLS LASEGSCTIG GLASTNAGGT AVLRYGVMRD QILGIEAVLP NGEVWNGLKR 
LRKDNTGYDL KHLLIGAEGT LGIITAASLM LYPLLASRSV AIAAVTTPHD AIALLARAKD 
ETGGAVEAFE LMSRLGVAFA LKNIPGLREP LEAVHPWYVL IETASGEPGA AEAAMERLLA 
GALERGLIQD AAVAQSEAQA QAFWAVRENQ SGGQKPEGAA WKHDVSVPVS KVADFIDQAT 
AAVEKLSSGV RVVAFGHVGD GNVHYDVLRA DGAADDPHDA LRDAGARIVH DIVASMNGSI 
SAEHGLGAMK SVEALRYKSA VEVEALRAVR AALDPQRIMN PRVLF