Gene Caul_0634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0634
Symbol
ID	5898089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	703547
End bp	705127
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	65%
IMG OID	641561116
Product	cytochrome bd ubiquinol oxidase subunit I
Protein accession	YP_001682265
Protein GI	167644602
COG category	[C] Energy production and conversion
COG ID	[COG1271] Cytochrome bd-type quinol oxidase, subunit 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.361821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.168063
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCCCG CCGTCATCGA CCTTTCTCGG CTGCAGTTCG CCCTGACGGC GCTGTACCAT 
TTCCTGTTCG TGCCCCTGAC CCTGGGTCTC TCCTTCATGC TGGTGATCAT GGAGAGCGTC 
TATGTGATGA CCAAGCGGCC GATCTGGAAA ACCACCACCC GGTTCTGGAG CACGCTGTTC 
GGCATCAATT TCGTGCTGGG CGTCGCCACC GGCCTGACCA TGGAATTCCA GTTCGGCATG 
AACTGGTCCT ACTATTCGCA CTATGTGGGC GACATCTTCG GCGCGCCCCT GGCCATCGAG 
GGCCTGATGG CCTTCTTCCT CGAAGCCACC TTCGTCGGGC TGATGTTCTT CGGCTGGGAC 
AAGCTCAAGC CCGTCACCCA CCTGTTCGTG ACCTTCCTCG TCGCCTTGGG CACCAACCTG 
TCGGCCCTGT GGATCCTGGT CGCCAACGGC TGGATGCAGA ACCCGGTCGG CGCGGCCTTC 
AATCCCGACA CGATGCGGAT GGAGGTGGTC GACTTCGGGG CGGTGGTCTT CAACCCGGTG 
GCCCAGGCCA AGTTCGTGCA CACCGTCAGC GCTGGCTACA CCATCGCCGC GGTCTTCGTG 
CTGGGGATCA GCGCCTTCTA CCTGCTGAAG GGTCGTTATG TCAGCGTCGC CAAGCGCTCG 
CTGACCGTGG CCGCCGCCTT CGGCCTGGCC TCGTCCCTGT CGGTGGTCGT GCTGGGCGAC 
GAGAGCGGCT ACGCCCTGAC CGACAACCAG AAAATGAAGC TCGCGGCCTT GGAGGCCATG 
TGGGAGACCG AACCCGCGCC GGCCGGCCTG ACCGCTTTTG GCATTCCCGA TCTGAAGAAC 
CGCACGACCC ATGCCGAGGT CAAGATTCCC TATGTTCTGG GCCTGATCTC GACCCGCAGC 
CTGGACCGTC CGGTGGCCGG CATCTTCCAA CTGGTCGCCC AGGCGCAGAC CCGCATCGAG 
AGCGGCGTCG TGGCCTATGA CGCGCTGGAA AAGCTGAAGG TCACCCCCAC CGATCTGGCG 
GCGCGCGGCG TGTTCGAGAC CCACCGCCGC GATCTGGGCT ACGCGCTGCT GCTCAAGCGC 
TATGTCGCTG ATCCCCGCCA GGCCGACGCG GCGCTGATCG CCAAGACCGC CTGGGACACC 
GTGCCCAATG TGCCGGTGAT GTTCTGGGCG TTCCGGATCA TGGCCGGCAT CGGTTTCCTG 
ATGATCGCCA TGTTCGCGAC CGCCTTCGTC CTGGTCACCC TGCGCAAGCA CAATACCCGC 
TGGTTCCTGA TGATCGCGGT GGCGGCCATC CCCCTGCCGT GGATCTCGAC GGAGCTGGGC 
TGGGTGCTGG CCGAGGTCGG ACGCCAGCCC TGGGCGGTCG AGGGCGTGCT GCCCACCTTC 
CTGGCGCCGT CCAGCCTCAG CGTGGCCCAG GTCCTGACCA GCATCGTGAT CTTCACCCTG 
CTCTATGGAT CGCTGGCGGT GGTCGAGGTC GGACTGATCC TCAAGACCAT CAAGAAGGGT 
CCCTTCGCCG ACCAGGAGGC CTTCCCATCC GGCGCTCCAG GGCGTCTTGG GGCCGCCCCC 
GCCGGCGAAG CCGTGGCCTA G

Protein sequence

MDPAVIDLSR LQFALTALYH FLFVPLTLGL SFMLVIMESV YVMTKRPIWK TTTRFWSTLF 
GINFVLGVAT GLTMEFQFGM NWSYYSHYVG DIFGAPLAIE GLMAFFLEAT FVGLMFFGWD 
KLKPVTHLFV TFLVALGTNL SALWILVANG WMQNPVGAAF NPDTMRMEVV DFGAVVFNPV 
AQAKFVHTVS AGYTIAAVFV LGISAFYLLK GRYVSVAKRS LTVAAAFGLA SSLSVVVLGD 
ESGYALTDNQ KMKLAALEAM WETEPAPAGL TAFGIPDLKN RTTHAEVKIP YVLGLISTRS 
LDRPVAGIFQ LVAQAQTRIE SGVVAYDALE KLKVTPTDLA ARGVFETHRR DLGYALLLKR 
YVADPRQADA ALIAKTAWDT VPNVPVMFWA FRIMAGIGFL MIAMFATAFV LVTLRKHNTR 
WFLMIAVAAI PLPWISTELG WVLAEVGRQP WAVEGVLPTF LAPSSLSVAQ VLTSIVIFTL 
LYGSLAVVEV GLILKTIKKG PFADQEAFPS GAPGRLGAAP AGEAVA