Gene Caul_5439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5439
Symbol
ID	5897233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	+
Start bp	152721
End bp	153932
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	59%
IMG OID	641550726
Product	alkane 1-monooxygenase
Protein accession	YP_001672212
Protein GI	167621704
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.186555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCA TCGCACGAAA TCCGTCCGCC AATACCGCGC CAGATCGCTA TGTGGACAGG 
AAACGCTATC TATGGATGTT GTCGGTCGTC TGGCCGGCAG CGCCGTTGAT CGGCCTCTAC 
CTCGTGAGCA TGACGGGTCT GGGCGTGTTT TACGCCTTTA CGCTAGTCGT TTGGTATGTT 
GCGATTCCCG CTTTGGACAT TTTGTTTGGG AATGATCCGA ACAATCCTCC TGAGGCAGCT 
GTCGCGCGCC TTGAGGCGGA TCGATATTAT CGAGTTCTCA CCTATCTTAC CGTCCCCGTG 
CATTATGCCT CGCTCATCGT CTCGGCGTGG TGGGTAGCGA CCCAGCCGAT GGCCTGGTGG 
GAAGTTGTCG CGCTTGCCTT GTCCCTGGGC ATCGTCAACG GCTTGGCGCT GAACACCGGC 
CATGAGTTGG GACACAAGAA GGAAGCCTTC GACCGCTGGA TGGCCAAGAT CGTTCTGGCC 
GTGGTCGGCT ATGGCCACTT CTTCATCGAG CACAACAAAG GCCACCATCG CGACGTTGCG 
ACCCCCGAAG ATCCCGCTAC GTCCAAGATG GGGGAGAGTA TCTATAAATT TTCGCTGCGC 
GAGATTCCGG GTGCCTTCAA GCGGGCTTGG AGTCTGGAGA GGGTGCGGCT GGAGCGCCTA 
GGCAAGGGGG TCTGGCGCCT GGACAACGAA ATCATCCCGC CGCTGCTGAT CACCGTAGTT 
CTCTACACAT CCCTTTTGCT GGCGTTCGGC CCCAACCCCA AGTTGTTAGT GTTCTTGCCC 
ATCCAGATCG CCTTCGGATG GTGGCAGCTG ACCAGCGCCA ATTATATCGA GCACTATGGG 
TTGCTTCGCG AGAAAATGGC GGACGGGCGT TATGAGCGCG CCCAGCCCCG GCATTCCTGG 
AACAGCAATC ACATCGCCTC GAATCTGATC CTGTTCCATC TTCAAAGGCA TTCCGATCAC 
CATGCCCACC CGACCCGCAG CTATCAGTCG CTCCGTGACT TTAAAGACCT GCCGGAGTTG 
CCGAGCGGTT ACCCCGGCAT GTTCTTCATG GCGATGATTC CGCCCGTGTT CCGGTCGGTG 
ATGGACCGCC GGGTCGTGGA ATGGGCGGGC GGCGATCTTG GCAAGATTCA GATCGACGGT 
GCGCGCAGGA AGCAGATCGA ACGGAAGTTC GGTGCGGCTT CGCGCCAGCA GGCGCGGGCG 
GCGGCCGAGT AG

Protein sequence

MSSIARNPSA NTAPDRYVDR KRYLWMLSVV WPAAPLIGLY LVSMTGLGVF YAFTLVVWYV 
AIPALDILFG NDPNNPPEAA VARLEADRYY RVLTYLTVPV HYASLIVSAW WVATQPMAWW 
EVVALALSLG IVNGLALNTG HELGHKKEAF DRWMAKIVLA VVGYGHFFIE HNKGHHRDVA 
TPEDPATSKM GESIYKFSLR EIPGAFKRAW SLERVRLERL GKGVWRLDNE IIPPLLITVV 
LYTSLLLAFG PNPKLLVFLP IQIAFGWWQL TSANYIEHYG LLREKMADGR YERAQPRHSW 
NSNHIASNLI LFHLQRHSDH HAHPTRSYQS LRDFKDLPEL PSGYPGMFFM AMIPPVFRSV 
MDRRVVEWAG GDLGKIQIDG ARRKQIERKF GAASRQQARA AAE