Gene Caul_5093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5093
Symbol
ID	5897310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	-
Start bp	12036
End bp	13373
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	66%
IMG OID	641555196
Product	NtaA/SnaA/SoxA family monooxygenase
Protein accession	YP_001676527
Protein GI	167621742
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGC GCAGACAACT CAAGCTCGGC CACATTATTG AAGGGGCGGG ACGCACCTGG 
ACCGATTGGC GCCATCCAGA CGCCAATCCC GGGGCCAGCA CCGATTTTGG CTTTTACCGC 
CGCGCCGCCC AGTTGGCGGA ACAGGGCAAG CTGGACTTCG TGTTCATCGC CGACAGTTTG 
TCGATCAACG AGAAATCCAG CCCCCACTAC CTCAACCGCT TCGAGCCGAT CTCGATCCTT 
TCGGCGCTGG CCGCGGTCAC CCAGCGCATC GGCCTGGTTG GCACCTTGAC GGTGACCTAC 
TCGGAACCCT TCAACGTCGC GCGCCAGCTG GCCTCGCTGG ACCACATCAG CGGCGGGCGC 
GCCGGTTGGA ATGTGGTGAC CTCCTGGCTG GAAGGGTCGG CCGCCAATTT CGGCAAATCC 
GAGCATCTGG CCCACGACGT GCGCTACCGC TTGGCGTCAG AGTATTTGGA CGTGGTGCGC 
GGCCTTTGGG ATAGCTGGGA AGACGGCGCC CTGCTTCATG ACAAGGCCAG CGGCGCCTTC 
TTCGATCCGG CCAAGCTCAA CACCCTGGGT CATAAGGGCG AGTTCCTTTC GGTGAAGGGG 
CCGTTGAACA TCGCACGCTC GGCGCAGGGC CAGCCGGTGA TCTTCCAGGC CGGCGCATCC 
GACGATGGCC GCAACCTGGC CGCCCGCAGC GCCGACGCCA TCTTCGTGGG CAATGGCGGC 
GTGGAGGACG CGCGCGCCTA CTACGCCGAC GTCAAGGCGA GGGCGGCTGG CTTCGGCCGC 
GATCCCGACA GCCTGTTCAT TCTGCCGGCC ATCGCCCCGA TCATCGGATC GACCGAGGCC 
GAGGCCGAAG CGCGCTGGCA GGAGCGGGCC GACCTGATTT CCATCGAAGC GGCTCTGGCC 
ATGCTGGGGC GCAGCTTCAA CGATCACGAT TTCACCGTCT ACGACCTCGA TGGGCCGTTC 
CCCGATGTGA TCGCGCGCGG TCTGGACAGC ATGAAGTCAA CGTCCCTGAA GATCGCCCAA 
GCCGTGGCCG AAGAGAACCT GACGCTGCGC CAGGTGGCCC AACGCTTCGC CACTCCCAAG 
GACGAGGCGA CCGGCACGCC CGAGCAGGTC GCCGATCGGT TCCAGCACTG GCTGGAAACG 
CGCGCCTGCG ACGGTTTCGT AATCAGCGAG GCCTTGCCGG GGCAGCTTCA GCTCCTCGTC 
GAGGAAGTCG TGCCCTTGCT GCAGAAGCGC GGGATCTTCC GCCAGGACTA CGAGGGCGAG 
ACCTTCCGTC AGAGCCTGGG CCTCGACGTG CCCGCCAACC GCTTCACCCT CGCCAAGTCC 
GCGCGCGCGG TGGCGTGA

Protein sequence

MTKRRQLKLG HIIEGAGRTW TDWRHPDANP GASTDFGFYR RAAQLAEQGK LDFVFIADSL 
SINEKSSPHY LNRFEPISIL SALAAVTQRI GLVGTLTVTY SEPFNVARQL ASLDHISGGR 
AGWNVVTSWL EGSAANFGKS EHLAHDVRYR LASEYLDVVR GLWDSWEDGA LLHDKASGAF 
FDPAKLNTLG HKGEFLSVKG PLNIARSAQG QPVIFQAGAS DDGRNLAARS ADAIFVGNGG 
VEDARAYYAD VKARAAGFGR DPDSLFILPA IAPIIGSTEA EAEARWQERA DLISIEAALA 
MLGRSFNDHD FTVYDLDGPF PDVIARGLDS MKSTSLKIAQ AVAEENLTLR QVAQRFATPK 
DEATGTPEQV ADRFQHWLET RACDGFVISE ALPGQLQLLV EEVVPLLQKR GIFRQDYEGE 
TFRQSLGLDV PANRFTLAKS ARAVA